皮肉にしては強烈すぎる!「エクセルデータの注意点」
総務省自身が一昨年公表した『統計表における機械判読可能なデータ作成に関する表記方法』という資料、皮肉にしては強烈すぎます。役所のエクセルファイルを眺めていて抱くさまざまな違和感を非常にうまく説明した資料だからです。この資料を本当に読み込まねばならないのは総務省自身を含めた役所の関係者だったりするのかもしれません。
当ウェブサイトを運営している「新宿会計士」は、ハンバーガー評論家・金融評論家であると同時に、エクセル評論家でもあります。そして、以前の『役所の闇に触れるエクセル方眼紙』などでも報告したとおり、役所のエクセル使いに対し、怒りを感じている企業経営者でもあります。
こうしたなか、総務省統計局が一昨年、こんな資料を公表していたとして、ツイッター上でちょっとした話題となっていたようです。
統計表における機械判読可能なデータの表記方法の統一ルールの策定
―――2020/12/18付 総務省統計局HPより
内容の本文自体は『統計表における機械判読可能なデータ作成に関する表記方法』と題したPDFファイル形式の文書のかたちで公表されているのですが、これがなかなか興味深いものです。
たとえば、「1つのセルに複数のデータを入力してはならない」として、さっそく、こんな図表が掲載されています(図表1)。
図表1 1セルに複数のデータが入力されている事例
(【出所】『統計表における機械判読可能なデータ作成に関する表記方法』P3)
…。
これは、素直に驚きました。
こんなこと、言われなければわからないのでしょうか?もしかして、複数のデータを1つのセルに入力してしまっているという事例があったのでしょうか?
ちなみに、『エク達』のほうでは、「セルに複数のデータが入っていた場合にそれを分割する技法」、「報告書形式とするために、1つのセルにわざと複数のデータを含める技法」などについて触れていくつもりですが、これは一定の目的があってやっていることです。
最初から生データの段階で複数データを1つのセルに放り込むというのは、いかがなものかと思います。
同様に、数値データ内に文字列が含まれている場合の不具合についても触れられています(図表2)。
図表2 数値データに文字列が含まれている場合の不具合
(【出所】『統計表における機械判読可能なデータ作成に関する表記方法』P4)
ただし、この手のデータに関しては、エクセル上はうまくデータとして変換することができる場合もあるほか、原始的な方法ですが、「Ctrl+H」で「検索と置換」のウィンドウを呼び出し、「▲」を「-」に一括置換してしまう、などの対策も立てられます。
さらに強烈なのは、セルの結合に関するものでしょう(図表3)。
図表3 セルの結合
(【出所】『統計表における機械判読可能なデータ作成に関する表記方法』P7)
この手のデータ、たとえば金融庁や日本年金機構などの提出フォーマットでよく見かけるのですが、生産性が大変に落ちます。セルの結合、本当にやめてほしいものです。
※ ※ ※ ※ ※ ※ ※
もっとも、この総務省の公表物に関し、やはり一番熟読しなければならないのは、総務省自身を含めた役所の皆さんでしょう。
実際、同資料を眺めていると、「あぁ、この手のフォーマットは総務省自身の公表物でもあったなぁ…」などと思い出してしまうことも大変に多く、とくに18ページの「印刷を意識してデータが分断されている」というのは、総務省自身が公表している資料でも実例があったほどです。
いずれにせよ、総務省が「エクセルの注意点」を出すというのも、皮肉にしては少し強烈すぎる気がする次第ですが…。
本文は以上です。
日韓関係が特殊なのではなく、韓国が特殊なのだ―――。
— 新宿会計士 (@shinjukuacc) September 22, 2024
そんな日韓関係論を巡って、素晴らしい書籍が出てきた。鈴置高史氏著『韓国消滅』(https://t.co/PKOiMb9a7T)。
日韓関係問題に関心がある人だけでなく、日本人全てに読んでほしい良著。
読者コメント欄はこのあとに続きます。当ウェブサイトは読者コメントも読みごたえがありますので、ぜひ、ご一読ください。なお、現在、「ランキング」に参加しています。「知的好奇心を刺激される記事だ」と思った方はランキングバナーをクリックしてください。
ツイート @新宿会計士をフォロー
読者コメント一覧
※【重要】ご注意:他サイトの文章の転載は可能な限りお控えください。
やむを得ず他サイトの文章を引用する場合、引用率(引用する文字数の元サイトの文字数に対する比率)は10%以下にしてください。著作権侵害コメントにつきましては、発見次第、削除します。
※現在、ロシア語、中国語、韓国語などによる、ウィルスサイト・ポルノサイトなどへの誘導目的のスパムコメントが激増しており、その関係で、通常の読者コメントも誤って「スパム」に判定される事例が増えています。そのようなコメントは後刻、極力手作業で修正しています。コメントを入力後、反映されない場合でも、少し待ち頂けると幸いです。
※【重要】ご注意:人格攻撃等に関するコメントは禁止です。
当ウェブサイトのポリシーのページなどに再三示していますが、基本的に第三者の人格等を攻撃するようなコメントについては書き込まないでください。今後は警告なしに削除します。なお、コメントにつきましては、これらの注意点を踏まえたうえで、ご自由になさってください。また、コメントにあたって、メールアドレス、URLの入力は必要ありません(メールアドレスは開示されません)。ブログ、ツイッターアカウントなどをお持ちの方は、該当するURLを記載するなど、宣伝にもご活用ください。なお、原則として頂いたコメントには個別に返信いたしませんが、必ず目を通しておりますし、本文で取り上げることもございます。是非、お気軽なコメントを賜りますと幸いです。
コメントを残す
【おしらせ】人生で10冊目の出版をしました
自称元徴用工問題、自称元慰安婦問題、火器管制レーダー照射、天皇陛下侮辱、旭日旗侮辱…。韓国によるわが国に対する不法行為は留まるところを知りませんが、こうしたなか、「韓国の不法行為に基づく責任を、法的・経済的・政治的に追及する手段」を真面目に考察してみました。類書のない議論をお楽しみください。 |
【おしらせ】人生で9冊目の出版をしました
日本経済の姿について、客観的な数字で読んでみました。結論からいえば、日本は財政危機の状況にはありません。むしろ日本が必要としているのは大幅な減税と財政出動、そして国債の大幅な増発です。日本経済復活を考えるうえでの議論のたたき台として、ぜひとも本書をご活用賜りますと幸いです。 |
エクセルをデータベースの前処理、後処理に使う場合には、余計な加工はほんとにやめてほしいです。1レコードを2行に渡って表を作ったりしてる例がまだまだ結構あります。1行1レコードに変換するのは結構面倒だったりしますね。
>エクセルをデータベースの前処理、後処理に使う場合には
ここが重要で、そもそもデータベースとして扱うコンセンサスを取るのが重要。
エクセルは広い使い方を想定されてるソフトなので。
データベース専門ならならアクセス使うのが推奨される。
もうひとつ、表形式に並べてある多数の数値データを、PDFファイルで公開するのは止めて欲しいですね。エクセルに変換できると称する専用ソフトみたいなのもあるようですが、本当に思い通りに処理してくれるかと言えば、???
中にはエクセル版と合わせてPDF版も並べて公開しているようなケースもありますが、これなんか何のためにやってるのか、訳分からない(笑)。
PDFの方が軽くてビューワが無料
閲覧だけなら十分
エクセルは高価で、業務の場合はともかく、一般の人は持ってないことも多い
って言う話しを聞いたことがあります
見るだけ~なら”Excel Viewer”はタダです。
ただ、「見るだけ~」な「深みに入りたくない人」がワザワザ”Excel Viewer”を使ってまで見るかどうかは疑問ですが。