日記+コメント付きブックマーク+他人にも役に立つかもしれない情報など。
(更新情報: RSS(ツッコミ付き) / RSS(ツッコミ抜き) / LIRS)
- p (01/03)
- Thiramil (10/26)
- 久々にいまむらを食べたい通りすがり (09/28)
- Fluxadir (05/16)
- Antiprestin (11/08)
2007/05/01
_ [システム運用] xlhtml が巨大な HTML テーブルを吐く
http://www.city.yokohama.jp/me/kenkou/iso/19data/kf-01.xls を xlhtml にかけると、248桁8451行、34MB の素敵な HTML テーブルが吐き出される。
なぜそんな Excel ファイルを作ってしまいますか…。
xlhtml のオプション -te (Trims empty rows & columns at the edges of a worksheet) をつければ改善されるかと思いきや変わらず。
仕方ないので | perl -pe 's"<TD[^>]*>( )*</TD>\n""g' | grep -v '<TR></TR>' なフィルタを通すと、34MB あった HTML は 16KB に縮んだ。(どんだけ空セル含んでたんだよ)
これのせいで estwaver が挙動不審になって半日無駄にしましたよ。
誰が悪いのだろうか。
- 可笑しな Excel ブックを作る役人
- 行・列を削除しても一度割り当てられた領域が最大時から減らない可笑しな仕様の Excel
- 無駄な空白セルをバカ正直に HTML 化する xlhtml
一番悪いのは Excel ですかね。
とても参考になりました。