総務省自身が一昨年公表した『統計表における機械判読可能なデータ作成に関する表記方法』という資料、皮肉にしては強烈すぎます。役所のエクセルファイルを眺めていて抱くさまざまな違和感を非常にうまく説明した資料だからです。この資料を本当に読み込まねばならないのは総務省自身を含めた役所の関係者だったりするのかもしれません。
当ウェブサイトを運営している「新宿会計士」は、ハンバーガー評論家・金融評論家であると同時に、エクセル評論家でもあります。そして、以前の『役所の闇に触れるエクセル方眼紙』などでも報告したとおり、役所のエクセル使いに対し、怒りを感じている企業経営者でもあります。
こうしたなか、総務省統計局が一昨年、こんな資料を公表していたとして、ツイッター上でちょっとした話題となっていたようです。
統計表における機械判読可能なデータの表記方法の統一ルールの策定
―――2020/12/18付 総務省統計局HPより
内容の本文自体は『統計表における機械判読可能なデータ作成に関する表記方法』と題したPDFファイル形式の文書のかたちで公表されているのですが、これがなかなか興味深いものです。
たとえば、「1つのセルに複数のデータを入力してはならない」として、さっそく、こんな図表が掲載されています(図表1)。
図表1 1セルに複数のデータが入力されている事例
(【出所】『統計表における機械判読可能なデータ作成に関する表記方法』P3)
…。
これは、素直に驚きました。
こんなこと、言われなければわからないのでしょうか?もしかして、複数のデータを1つのセルに入力してしまっているという事例があったのでしょうか?
ちなみに、『エク達』のほうでは、「セルに複数のデータが入っていた場合にそれを分割する技法」、「報告書形式とするために、1つのセルにわざと複数のデータを含める技法」などについて触れていくつもりですが、これは一定の目的があってやっていることです。
最初から生データの段階で複数データを1つのセルに放り込むというのは、いかがなものかと思います。
同様に、数値データ内に文字列が含まれている場合の不具合についても触れられています(図表2)。
図表2 数値データに文字列が含まれている場合の不具合
(【出所】『統計表における機械判読可能なデータ作成に関する表記方法』P4)
ただし、この手のデータに関しては、エクセル上はうまくデータとして変換することができる場合もあるほか、原始的な方法ですが、「Ctrl+H」で「検索と置換」のウィンドウを呼び出し、「▲」を「-」に一括置換してしまう、などの対策も立てられます。
さらに強烈なのは、セルの結合に関するものでしょう(図表3)。
図表3 セルの結合
(【出所】『統計表における機械判読可能なデータ作成に関する表記方法』P7)
この手のデータ、たとえば金融庁や日本年金機構などの提出フォーマットでよく見かけるのですが、生産性が大変に落ちます。セルの結合、本当にやめてほしいものです。
※ ※ ※ ※ ※ ※ ※
もっとも、この総務省の公表物に関し、やはり一番熟読しなければならないのは、総務省自身を含めた役所の皆さんでしょう。
実際、同資料を眺めていると、「あぁ、この手のフォーマットは総務省自身の公表物でもあったなぁ…」などと思い出してしまうことも大変に多く、とくに18ページの「印刷を意識してデータが分断されている」というのは、総務省自身が公表している資料でも実例があったほどです。
いずれにせよ、総務省が「エクセルの注意点」を出すというのも、皮肉にしては少し強烈すぎる気がする次第ですが…。
View Comments (5)
エクセルをデータベースの前処理、後処理に使う場合には、余計な加工はほんとにやめてほしいです。1レコードを2行に渡って表を作ったりしてる例がまだまだ結構あります。1行1レコードに変換するのは結構面倒だったりしますね。
>エクセルをデータベースの前処理、後処理に使う場合には
ここが重要で、そもそもデータベースとして扱うコンセンサスを取るのが重要。
エクセルは広い使い方を想定されてるソフトなので。
データベース専門ならならアクセス使うのが推奨される。
もうひとつ、表形式に並べてある多数の数値データを、PDFファイルで公開するのは止めて欲しいですね。エクセルに変換できると称する専用ソフトみたいなのもあるようですが、本当に思い通りに処理してくれるかと言えば、???
中にはエクセル版と合わせてPDF版も並べて公開しているようなケースもありますが、これなんか何のためにやってるのか、訳分からない(笑)。
PDFの方が軽くてビューワが無料
閲覧だけなら十分
エクセルは高価で、業務の場合はともかく、一般の人は持ってないことも多い
って言う話しを聞いたことがあります
見るだけ~なら"Excel Viewer"はタダです。
ただ、「見るだけ~」な「深みに入りたくない人」がワザワザ"Excel Viewer"を使ってまで見るかどうかは疑問ですが。