datをUTF8にするのはどうだろうスレッド
- 422 :動け動けウゴウゴ2ちゃんねる:2008/05/20(火) 15:02:44 ID:CxBd8N6S0
- > 30 名前:止まない雨は名無しさん[sage] 投稿日:2008/04/11(金) 17:52:40 ID:3n18t16j0
> 狐は「もうずっと人大杉」にした。
> ひろゆきは三度、専ブラを使え(で書き込め)なくした。
> それを受け、むむむさんは静かにqb5・6を停止した。
ニュース実況++ / 2ちゃん人大杉拡大 行き場を失ったユーザーの荒らし行為が各地で続発★3
ttp://news24.2ch.net/test/read.cgi/liveplus/1207900534/30
嫌な予感がしてkakikomi.txt確認したら…>>1ネタをネタと(ry
- 423 :動け動けウゴウゴ2ちゃんねる:2008/05/23(金) 20:07:51 ID:7tXSpSoi0
- よし、文字コード設計からやろう
- 424 :動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 01:23:43 ID:m9uPvIcS0
- datの先頭あたりで判別できるようにすればいいんじゃないかな
Shift_JIS:[名無し]さん(bin+cue).rar<>sage<>
UTF-8:[名無し]さん(bin+cue).rar><sage<>
ってみたいに
- 425 :動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 02:10:03 ID:zjd3Cur70
- 判別するだけだったら1文字か2文字でいいんじゃない?
- 426 :動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 02:32:35 ID:m9uPvIcS0
- できそうなところがないじゃない
- 427 :動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 08:52:12 ID:oBnQpL6S0
- UTF-8なDATは、BOM付きUTF-8にすればいい
先頭を見てBOMならUTF-8、さもなくばSJIS
- 428 :動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 12:23:35 ID:d7IdQZ8a0
- 専ブラは差分取得するのでdatの先頭にBOMを付けても役に立たない
- 429 :動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 12:46:32 ID:oKxq3p9z0
- ファイルの途中からUTF-8に変えるのかい?
- 430 :動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 12:49:22 ID:PCPcTJ5b0
- いわゆる BOM 付き UTF-8 は問題児なので反対。RFC 3626 でも基本的に
「使用を禁止すべき」扱いだし。ていうか、HTTP header の Content-Type の
charset で十分だべ。
- 431 :動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 15:28:00 ID:jwQb16jz0
- datファイルは2ちゃんねる専用フォーマットだから自由に設計していいんじゃね?
もちろん標準バリバリでXML化でも良いけど、標準ってのも移り変わるもんだからねぇ。
- 432 :動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 15:43:50 ID:9dlsmaAP0
- XMLは無駄にサイズ食うからなぁ。コードの見通しも悪いし。
賢明な選択肢とは思えん。
- 433 :動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 15:50:33 ID:jwQb16jz0
- 圧縮とセットならXMLもそれほど容量に影響しないと思う。
同じようなキーワードが並ぶのなら全部符号化されちまう。
- 434 :動け動けウゴウゴ2ちゃんねる:2008/05/25(日) 09:38:23 ID:nr0ZnGPL0
- XML化は利点が見えない。現状の1行1レコード、<>がフィールドセパレータ、で
困らないと思う。
- 435 :動け動けウゴウゴ2ちゃんねる:2008/05/25(日) 13:45:49 ID:U0RJgIvu0
- このスレの主旨?とはまったく異なる視点で…
・read.cgi が吐くものを XML で再定義する
・それに食わせる dat?も XML で再定義する
ってのなら、まだ分からんでもないけど > dat?の XML 化
専ブラ開発者からみたら、メリットはないわな。
- 436 :動け動けウゴウゴ2ちゃんねる:2008/05/25(日) 14:07:56 ID:rNTH5CZP0
- これ以上専用ブラウザ作者に迷惑をかけるのはやめてやれよ
- 437 :動け動けウゴウゴ2ちゃんねる:2008/05/25(日) 15:57:25 ID:nr0ZnGPL0
- > ・read.cgi が吐くものを XML で再定義する
read.cgiの吐くhtmlにスキーマを付けるのには全く独立した話として賛成。
- 438 :動け動けウゴウゴ2ちゃんねる:2008/05/25(日) 19:13:36 ID:/yE7qfVJ0
- >>430
> いわゆる BOM 付き UTF-8 は問題児なので反対。RFC 3626 でも基本的に
> 「使用を禁止すべき」扱いだし。
RFC 3626 Optimized Link State Routing Protocol (OLSR) って
Unicode 関係なくない?
- 439 :動け動けウゴウゴ2ちゃんねる:2008/05/25(日) 19:23:33 ID:foEE4xHPP
- >>438
RFC 3629
- 440 :動け動けウゴウゴ2ちゃんねる:2008/05/25(日) 19:43:12 ID:nr0ZnGPL0
- 書き込みがちょん切れたorz
RFC3629的には、
datが、HTTPでやりとりされる物だと見るなら、HTTPのContent-Type
ヘッダがあるからBOMは禁止すべきということになるけど、
dat ファイル単体として見ると、エンコーディングを知る方法が
(なんらかの拡張をしない限り)ないから、BOMは禁止されるべきでない。
専ブラがローカルに持ってるdatについて、ファイル名を変えるとか、
専ブラ独自の形式にするとか、外部に情報ファイルを持つとか、
しなきゃいけなくなる。
- 441 :動け動けウゴウゴ2ちゃんねる:2008/05/26(月) 16:51:29 ID:ZKBghHLV0
- うぁ… RFC の番号打ち間違えてたか、すまん orz
dat 単体で見たときは云々、ってのはあくまでローカルな環境、ユーザエンドで
ファイル単体として扱うときの話なんで、それは環境・アプリ依存。
2ch の素の dat のファイルがどうあろうと、それをユーザ・アプリがどう扱おうと
好きにすればいい。
意味的には、したらばの EUC-JP な dat を Winodws な専ブラがローカルに
Shift_JIS(CP932) で保存するようなもの。
- 442 :動け動けウゴウゴ2ちゃんねる:2008/05/26(月) 18:51:20 ID:xSM3vYZLO
- DATをテキストだと考えるからややこしいんだ。
いっそoctet-streamとしてバイナリ扱いにでもすればいい。
- 443 :動け動けウゴウゴ2ちゃんねる:2008/05/26(月) 23:05:42 ID:4dBEta1n0
- そもそも人間が読めるようにしてるのは誰かってことを考えればなんてことないわけで
作り直すのに時間とお金がかかるのが問題なのかなあとか思ったり
ご飯食べないで生きられて時間が無限にあれば全部解決
とか実も蓋もないことを書いてみる
- 444 :動け動けウゴウゴ2ちゃんねる:2008/05/29(木) 00:47:21 ID:ivI86OvK0
- 金も時間もあって2chの心臓部に触れられる人間というと一人しかいないな
飯のかわりにうまい棒で済むし
- 445 :動け動けウゴウゴ2ちゃんねる:2008/05/29(木) 01:58:12 ID:PsXz3U600
- そのおっさんがどうだろうって言ってるわけでふりだしに戻る
- 446 :動け動けウゴウゴ2ちゃんねる:2008/05/29(木) 11:44:06 ID:0unnv0s00
- いやもう結論でてるし
- 447 :動け動けウゴウゴ2ちゃんねる:2008/05/29(木) 23:11:39 ID:+LT7fBA+0
- そうか
IDかっこいいな
- 448 :動け動けウゴウゴ2ちゃんねる:2008/05/31(土) 11:35:12 ID:m2txMOod0
- おっさんの気が変わった時に備えて議論しておこうとか
- 449 :あぼーん:あぼーん
- あぼーん
98 KB
[ 2ちゃんねる 3億PV/日をささえる レンタルサーバー \877/2TB/100Mbps]
取りに行ったけどなかった。次は一時間後に取りに行くです。新着レスの表示
掲示板に戻る
全部
前100
次100
最新50
read.cgi ver 05.0.7.3 2008/07/26
FOX ★ DSO(Dynamic Shared Object)