スペースモラトリアムノカミサマ

日記+コメント付きブックマーク+他人にも役に立つかもしれない情報など。
(更新情報: RSS(ツッコミ付き) / RSS(ツッコミ抜き) / LIRS)

最近の TrackBack:
2004|01|02|03|04|05|06|07|08|09|10|11|12|
2005|01|02|03|04|05|06|07|08|09|10|11|12|
2006|01|02|03|04|05|06|07|08|09|10|11|12|
2007|01|02|03|04|05|06|07|08|09|10|11|12|
2008|01|02|03|04|05|06|07|08|09|10|11|12|
2009|01|02|03|04|05|06|07|08|09|10|11|12|
2010|01|02|03|04|06|07|08|09|10|
2011|01|02|03|07|10|11|
2012|02|03|04|07|08|09|
2013|01|06|07|
2014|02|08|09|11|
2015|09|
2016|01|05|

2007/05/01

_ [システム運用] xlhtml が巨大な HTML テーブルを吐く

http://www.city.yokohama.jp/me/kenkou/iso/19data/kf-01.xls を xlhtml にかけると、248桁8451行、34MB の素敵な HTML テーブルが吐き出される。

なぜそんな Excel ファイルを作ってしまいますか…。

xlhtml のオプション -te (Trims empty rows & columns at the edges of a worksheet) をつければ改善されるかと思いきや変わらず。

仕方ないので | perl -pe 's"<TD[^>]*>(&nbsp;)*</TD>\n""g' | grep -v '<TR></TR>' なフィルタを通すと、34MB あった HTML は 16KB に縮んだ。(どんだけ空セル含んでたんだよ)

これのせいで estwaver が挙動不審になって半日無駄にしましたよ。

誰が悪いのだろうか。

  • 可笑しな Excel ブックを作る役人
  • 行・列を削除しても一度割り当てられた領域が最大時から減らない可笑しな仕様の Excel
  • 無駄な空白セルをバカ正直に HTML 化する xlhtml

一番悪いのは Excel ですかね。

本日のツッコミ(全1件) [ツッコミを入れる]
_ Folly (2007/10/06 21:12)

とても参考になりました。