もう8時か、
2ちゃんねる ■掲示板に戻る■ 全部 1- 最新50 [PR]美人女性のお部屋をナマ体験[PR]  

datをUTF8にするのはどうだろうスレッド

422 :動け動けウゴウゴ2ちゃんねる:2008/05/20(火) 15:02:44 ID:CxBd8N6S0
> 30 名前:止まない雨は名無しさん[sage] 投稿日:2008/04/11(金) 17:52:40 ID:3n18t16j0
> 狐は「もうずっと人大杉」にした。
>   ひろゆきは三度、専ブラを使え(で書き込め)なくした。
>     それを受け、むむむさんは静かにqb5・6を停止した。

ニュース実況++ / 2ちゃん人大杉拡大 行き場を失ったユーザーの荒らし行為が各地で続発★3
ttp://news24.2ch.net/test/read.cgi/liveplus/1207900534/30
 嫌な予感がしてkakikomi.txt確認したら…>‎>1ネタをネタと(ry

423 :動け動けウゴウゴ2ちゃんねる:2008/05/23(金) 20:07:51 ID:7tXSpSoi0
よし、文字コード設計からやろう

424 :動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 01:23:43 ID:m9uPvIcS0
datの先頭あたりで判別できるようにすればいいんじゃないかな

Shift_JIS:[名無し]さん(bin+cue).rar<>sage<>
UTF-8:[名無し]さん(bin+cue).rar><sage<>

ってみたいに


425 :動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 02:10:03 ID:zjd3Cur70
判別するだけだったら1文字か2文字でいいんじゃない?

426 :動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 02:32:35 ID:m9uPvIcS0
できそうなところがないじゃない

427 :動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 08:52:12 ID:oBnQpL6S0
UTF-8なDATは、BOM付きUTF-8にすればいい
先頭を見てBOMならUTF-8、さもなくばSJIS

428 :動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 12:23:35 ID:d7IdQZ8a0
専ブラは差分取得するのでdatの先頭にBOMを付けても役に立たない

429 :動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 12:46:32 ID:oKxq3p9z0
ファイルの途中からUTF-8に変えるのかい?

430 :動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 12:49:22 ID:PCPcTJ5b0
いわゆる BOM 付き UTF-8 は問題児なので反対。RFC 3626 でも基本的に
「使用を禁止すべき」扱いだし。ていうか、HTTP header の Content-Type の
charset で十分だべ。

431 :動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 15:28:00 ID:jwQb16jz0
datファイルは2ちゃんねる専用フォーマットだから自由に設計していいんじゃね?
もちろん標準バリバリでXML化でも良いけど、標準ってのも移り変わるもんだからねぇ。

432 :動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 15:43:50 ID:9dlsmaAP0
XMLは無駄にサイズ食うからなぁ。コードの見通しも悪いし。
賢明な選択肢とは思えん。

433 :動け動けウゴウゴ2ちゃんねる:2008/05/24(土) 15:50:33 ID:jwQb16jz0
圧縮とセットならXMLもそれほど容量に影響しないと思う。
同じようなキーワードが並ぶのなら全部符号化されちまう。

434 :動け動けウゴウゴ2ちゃんねる:2008/05/25(日) 09:38:23 ID:nr0ZnGPL0
XML化は利点が見えない。現状の1行1レコード、<>がフィールドセパレータ、で
困らないと思う。

435 :動け動けウゴウゴ2ちゃんねる:2008/05/25(日) 13:45:49 ID:U0RJgIvu0
このスレの主旨?とはまったく異なる視点で…

・read.cgi が吐くものを XML で再定義する
・それに食わせる dat?も XML で再定義する

ってのなら、まだ分からんでもないけど > dat?の XML 化

専ブラ開発者からみたら、メリットはないわな。

436 :動け動けウゴウゴ2ちゃんねる:2008/05/25(日) 14:07:56 ID:rNTH5CZP0
これ以上専用ブラウザ作者に迷惑をかけるのはやめてやれよ

437 :動け動けウゴウゴ2ちゃんねる:2008/05/25(日) 15:57:25 ID:nr0ZnGPL0
> ・read.cgi が吐くものを XML で再定義する

read.cgiの吐くhtmlにスキーマを付けるのには全く独立した話として賛成。

438 :動け動けウゴウゴ2ちゃんねる:2008/05/25(日) 19:13:36 ID:/yE7qfVJ0
>>430
> いわゆる BOM 付き UTF-8 は問題児なので反対。RFC 3626 でも基本的に
> 「使用を禁止すべき」扱いだし。

RFC 3626 Optimized Link State Routing Protocol (OLSR) って
Unicode 関係なくない?

439 :動け動けウゴウゴ2ちゃんねる:2008/05/25(日) 19:23:33 ID:foEE4xHPP
>>438
RFC 3629

440 :動け動けウゴウゴ2ちゃんねる:2008/05/25(日) 19:43:12 ID:nr0ZnGPL0
書き込みがちょん切れたorz

RFC3629的には、
datが、HTTPでやりとりされる物だと見るなら、HTTPのContent-Type
ヘッダがあるからBOMは禁止すべきということになるけど、
dat ファイル単体として見ると、エンコーディングを知る方法が
(なんらかの拡張をしない限り)ないから、BOMは禁止されるべきでない。

専ブラがローカルに持ってるdatについて、ファイル名を変えるとか、
専ブラ独自の形式にするとか、外部に情報ファイルを持つとか、
しなきゃいけなくなる。

441 :動け動けウゴウゴ2ちゃんねる:2008/05/26(月) 16:51:29 ID:ZKBghHLV0
うぁ… RFC の番号打ち間違えてたか、すまん orz

dat 単体で見たときは云々、ってのはあくまでローカルな環境、ユーザエンドで
ファイル単体として扱うときの話なんで、それは環境・アプリ依存。
2ch の素の dat のファイルがどうあろうと、それをユーザ・アプリがどう扱おうと
好きにすればいい。

意味的には、したらばの EUC-JP な dat を Winodws な専ブラがローカルに
Shift_JIS(CP932) で保存するようなもの。

442 :動け動けウゴウゴ2ちゃんねる:2008/05/26(月) 18:51:20 ID:xSM3vYZLO
DATをテキストだと考えるからややこしいんだ。
いっそoctet-streamとしてバイナリ扱いにでもすればいい。

443 :動け動けウゴウゴ2ちゃんねる:2008/05/26(月) 23:05:42 ID:4dBEta1n0
そもそも人間が読めるようにしてるのは誰かってことを考えればなんてことないわけで
作り直すのに時間とお金がかかるのが問題なのかなあとか思ったり
ご飯食べないで生きられて時間が無限にあれば全部解決

とか実も蓋もないことを書いてみる

444 :動け動けウゴウゴ2ちゃんねる:2008/05/29(木) 00:47:21 ID:ivI86OvK0
金も時間もあって2chの心臓部に触れられる人間というと一人しかいないな
飯のかわりにうまい棒で済むし

445 :動け動けウゴウゴ2ちゃんねる:2008/05/29(木) 01:58:12 ID:PsXz3U600
そのおっさんがどうだろうって言ってるわけでふりだしに戻る

446 :動け動けウゴウゴ2ちゃんねる:2008/05/29(木) 11:44:06 ID:0unnv0s00
いやもう結論でてるし

447 :動け動けウゴウゴ2ちゃんねる:2008/05/29(木) 23:11:39 ID:+LT7fBA+0
そうか
IDかっこいいな

448 :動け動けウゴウゴ2ちゃんねる:2008/05/31(土) 11:35:12 ID:m2txMOod0
おっさんの気が変わった時に備えて議論しておこうとか

449 :あぼーん:あぼーん
あぼーん

98 KB [ 2ちゃんねる 3億PV/日をささえる レンタルサーバー \877/2TB/100Mbps]

取りに行ったけどなかった。次は一時間後に取りに行くです。
新着レスの表示

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail (省略可) :


read.cgi ver 05.0.7.3 2008/07/26
FOX ★ DSO(Dynamic Shared Object)