コメント/.mjt/mosh/bytestream の変更点



 [[.mjt/mosh/bytestream]]
 
 -Mosh 標準に入れる事を前提に質問です。 -- [[ひげぽん]] &new{2009-11-01 (日) 19:00:03};
 --UTF8 パースですが、既存の codec では出来ない何かがありますか? -- [[ひげぽん]] &new{2009-11-01 (日) 19:03:06};
 ---例えば、HTMLをパースするような状況で、(moshの内部表現であるところの)UCS-2に変換してしまうとメモリを食うというのが単純な理由です。あと、bytevector->stringするときにメモリ全部触らざるをを得ないのも微妙。 -- [[.mjt]] &new{2009-11-01 (日) 19:16:22};
 ---要するに(パフォーマンス上の都合で、)"プロトコル用文字列"と"テキスト用文字列"は別個に扱うべきなんじゃないかというアイデアが有って、今はユースケースを調べているところ。と。 -- [[.mjt]] &new{2009-11-01 (日) 19:18:45};
 ---なるほど。メモリやパフォーマンスの話は実際に問題となっていますか? -- [[ひげぽん]] &new{2009-11-01 (日) 19:57:35};
 ---今のところ巨大なXMLを処理しようとしたとき位かなぁ。でもXMLに関してはlibxml(と、そのXPath)で大部分を処理しようと思ってるので, -- [[.mjt]] &new{2009-11-01 (日) 20:51:03};
 ---今のところ巨大なXMLを処理しようとしたとき位かなぁ。でもXMLに関してはlibxml(と、そのXPath)で大部分を処理しようと思ってるので、今後のプロトコル実装しだい。 -- [[.mjt]] &new{2009-11-01 (日) 20:51:03};
 --bytevector-split の戻り値は index? それともメモリ上の領域を共有したバイトベクタ?、コピーされたバイトベクタ? -- [[ひげぽん]] &new{2009-11-01 (日) 19:03:43};
 ---現状の実装ではコピーしてます。MIMEヘッダくらいだったら重要な負荷にはならないと思います。substringのように、共有されたオブジェクトを返すのは悪くないですが、R6RS的にはbytevectorはmutableに使うように出来てると思うので。。 -- [[.mjt]] &new{2009-11-01 (日) 19:13:34};
 ---了解です。僕もコピーがよいと思います。(ユースケースによりますが) -- [[ひげぽん]] &new{2009-11-01 (日) 19:59:36};

リロード   新規 編集 差分 添付 複製 改名   トップ 一覧 検索 最終更新 バックアップ   ヘルプ   最終更新のRSS

Modified by mona
PukiWiki 1.4.6 Copyright © 2001-2005 PukiWiki Developers Team. License is GPL.
Based on "PukiWiki" 1.3 by yu-ji
Powered by PHP 5.2.17
HTML convert time to 0.019 sec.