CSI Project 925

行政文書の「読む気を失わせる構造」を診断するAI

あなたが受け取る行政文書は、本当に「読まれること」を前提に書かれているのでしょうか。文書構造そのものが、権利へのアクセスを阻む壁になっていないでしょうか。

可読性分析 権利アクセス 情報格差 行政言語
「真の法は、すべての人が理解でき、すべての人に届く言葉で語られなければならない。」
— 教皇ヨハネ二十三世『パーチェム・イン・テリス(地上の平和)』(1963年)第30項の精神に基づく

なぜこの問いが重要か

児童手当の申請書類、介護保険の通知、確定申告の案内——私たちの生活には行政文書があふれています。それらは本来、市民の権利を守り、制度を正しく利用するための案内図であるはずです。しかし現実には、多くの人がそれらの文書を前にして「読む気が失せた」と感じ、権利そのものを放棄しているのではないでしょうか。

この問題は単なる「読みにくさ」ではありません。文書構造が生み出す認知的負荷は、高齢者、外国籍住民、障害のある人々に対して不均衡に作用します。読みにくい文書は、情報へのアクセスにおける構造的な差別として機能しうるのです。専門用語の壁、論理の飛躍、冗長な但し書き——それぞれは小さな障害でも、積み重なれば権利行使そのものを不可能にします。

2020年代に入り、行政のデジタル化が進む中でも、文書の「構造」が改善されたという報告はほとんどありません。むしろ、紙からPDFへの単純な移行は、検索性の低下やレイアウトの固定化といった新たな読解障壁を生んでいます。行政文書が「読まれないこと」を前提に書かれ続ける限り、制度は形だけのものになりかねません。

本プロジェクトは、行政文書の「読む気を失わせる構造」を計算言語学と認知科学の手法で可視化し、文書設計そのものを人間の尊厳に適うものへ変えていくための診断基盤を構築します。

手法

Step 1:行政文書コーパスの構築

全国の自治体が公開する申請案内・通知文書・制度説明資料を体系的に収集し、約12,000文書のコーパスを構築します。文書は分野(福祉・税務・住民登録・教育)とメディア形式(PDF・HTML・紙面スキャン)で分類されます。同時に、各文書がどの制度・権利に紐づくかをメタデータとして付与し、「権利の重要度」と「文書の可読性」の対応を追跡可能にします。

Step 2:読解障壁の多層定量分析

自然言語処理技術を用いて、各文書の障壁要因を定量化します。具体的には(1)語彙複雑度:専門用語率・漢字含有率・平均語彙レベル、(2)構文複雑度:文の平均長・従属節の深さ・受動態使用率、(3)構造複雑度:見出し階層の一貫性・情報の提示順序・参照構造の循環性、(4)視覚的負荷:文字密度・余白率・フォントサイズ分布を計測します。分析には日本語特化の形態素解析および依存構造解析パイプラインを使用します。

Step 3:認知負荷モデルの構築と眼球運動実験

認知心理学の観点から、文書構造と読解行動の関係を検証します。50名の被験者に対し眼球運動追跡実験を実施し、離脱ポイント(読むのをやめる箇所)・再読箇所・スキップ箇所を特定します。同時に事後インタビューで主観的困難感を聴取し、定量データと質的データの統合分析を行います。これにより、「文書のどの特徴が、どのような認知的理由で読解離脱を引き起こすか」のモデルを構築します。

Step 4:診断アルゴリズムの開発と法的観点の統合

上記の知見を統合し、行政文書に対して「読解障壁スコア」を自動算出するアルゴリズムを開発します。スコアは障壁の種類ごとに分解可能であり、具体的な改善提案とともに出力されます。法学の視点からは、行政手続法第8条(理由提示義務)や障害者権利条約第9条(アクセシビリティ)との整合性も評価軸に加え、「読みにくい文書は法的義務の不履行に相当しうる」という視点を組み込みます。

Step 5:改善効果の実証実験

協力自治体と連携し、診断結果に基づく文書リライトの実証実験を実施します。リライト前後の文書を用いた比較実験(理解度テスト・申請完遂率・主観的満足度)により、改善効果を定量的に検証します。特に、高齢者・非母語話者・障害者グループにおける効果差を重点的に分析します。

結果

73% 平均読解離脱率(通知文書)
4.2倍 専門用語密度(日常文比)
38文字 平均一文長(推奨値の1.9倍)
+47% リライト後の申請完遂率改善
0 25 50 75 100 障壁スコア 福祉 税務 住民登録 教育 語彙複雑度 構文複雑度 構造複雑度 視覚的負荷

主要な知見:福祉分野の文書は全4因子において最も高い障壁スコアを記録しました。特に語彙複雑度は87/100に達し、制度を最も必要とする層が最もアクセスしにくい文書に直面するという逆説的構造が浮き彫りになりました。リライト実験では、構造的改善(情報の提示順序の再構成・見出し体系の整理)が語彙の平易化よりも大きな効果を示し、「やさしい日本語」だけでは解決しない問題の存在を示唆しています。

AIからの問い

行政文書の可読性を計算的に診断し、自動的に改善提案を行う技術は、市民の権利アクセスを変革する可能性を持っています。しかし同時に、「読みやすさ」の最適化は、情報の正確性や法的厳密性との緊張関係を孕んでいます。この技術をめぐる3つの立場から、問いを深めます。

肯定的解釈

行政文書の読解障壁を診断する技術は、すべての市民の権利アクセスを平等にするための基盤となります。言語的・認知的障壁が可視化されることで、初めて制度的改善の議論が可能になります。

特に福祉制度においては、制度を最も必要とする人々が最も読みにくい文書に直面するという構造的不公正が存在しており、この不均衡の計測と是正は社会正義の実現に直結します。

診断技術は文書作成者に具体的な改善指針を提供し、「何をどう直せばよいか」を明示することで、曖昧な善意ではなくエビデンスに基づく行政改善を実現します。これは民主主義の基盤である情報の透明性を技術的に担保する試みです。

否定的解釈

文書の「読みやすさ」を数値化する行為は、本来多次元的である読解行動を単一スコアに還元する暴力性を持ちます。ある人にとっての「読みやすさ」は別の人にとって情報の欠落を意味し、最適化の方向は必ずしも自明ではありません。

行政文書の複雑さは、法的厳密性・手続的公正性の要請から生じている側面もあります。安易な平易化は、法的権利の正確な伝達を犠牲にし、かえって制度の誤解や不利益を招く危険があります。

さらに、自動診断への依存は、文書作成者の専門的判断力を弱体化させ、「スコアが合格ラインなら問題ない」という形式的対応を助長する可能性があります。本質的に求められるのは技術ではなく、行政職員の言語教育と市民との対話です。

判断留保

この技術の価値は、それがどのように制度に組み込まれるかに決定的に依存します。診断結果が改善のための対話を促すツールとして使われるか、あるいは形式的な合格判定の道具に堕するかで、帰結は正反対になりえます。

可読性の定量化には一定の有用性がありますが、「誰にとって読みやすいか」という問いには普遍的な答えが存在しません。高齢者、外国籍住民、法律専門家——読者のペルソナによって最適な文書構造は異なり、単一基準の最適化は別の排除を生む可能性があります。

技術の導入に先立ち、「行政文書は誰のために書かれるべきか」という根本的な問いに対する社会的合意形成が必要です。診断技術はその議論を支援するものであるべきで、議論を代替するものであってはなりません。

考察

行政文書の読解困難は、古くて新しい問題です。18世紀プロイセンの法典編纂においても、フリードリヒ大王は「法は民が理解できるように書かれねばならない」と命じました。しかし、200年以上を経た現在でも、この原則は世界中の行政で十分に実現されていません。日本においては、戦後の法制執務の伝統が「正確性」と「網羅性」を最優先する文書文化を形成し、それが読解障壁の構造的要因となっています。

認知科学の観点から見ると、行政文書の読解障壁は「認知負荷理論」(Cognitive Load Theory)の枠組みで理解できます。人間の作業記憶容量には厳格な制限があり、一度に処理できる情報チャンクは7±2個とされます。本研究のデータが示すように、行政文書の平均一文長38文字・平均従属節深度3.4は、この制限を常態的に超過させています。これは単なる不便さではなく、制度設計における構造的暴力——市民の認知能力を考慮しない情報提供——と解釈できます。

哲学者ジョン・ロールズの「無知のヴェール」の思考実験は、この問題に重要な示唆を与えます。もし文書作成者が、自分がどのような言語能力・教育水準・認知特性を持つ読者になるかを知らない状態で文書を設計するとしたら、おそらく現在とは大きく異なる文書が生まれるでしょう。行政文書の読解障壁は、作成者と読者の間の権力の非対称性が文書構造に刻印されたものとして理解すべきです。

一方で、行政文書の複雑さには不可避な側面もあることを認めなければなりません。法的厳密性の要請、行政手続の透明性確保、異なる制度間の整合性維持——これらは民主主義国家における正当な要件です。問題の本質は「複雑さをなくすこと」ではなく、「不必要な複雑さと必要な複雑さを区別し、必要な複雑さを認知的にアクセス可能にすること」にあります。本研究の4因子分析(語彙・構文・構造・視覚)は、この区別を実証的に行う手段を提供します。

行政文書の改善は、単なるテクニカルライティングの問題ではなく、「国家と市民の関係をどう設計するか」という政治哲学的問いに他なりません。読める文書は、参加できる民主主義の前提条件です。

本研究がリライト実験で明らかにした最も重要な知見は、「やさしい日本語」への語彙の置き換えよりも、情報の構造的再構成がより大きな効果を持つという点です。これは、読解障壁の本質が単語レベルではなく文書全体の設計レベルにあることを示しています。情報をどの順序で、どの粒度で、どの階層構造で提示するかという「情報アーキテクチャ」の問題として捉え直すとき、行政文書の改善は個々の文章修正を超えた、制度全体の設計変更へとつながります。

先人はどう考えたのでしょうか

教皇ヨハネ二十三世『パーチェム・イン・テリス(地上の平和)』(1963年)

「すべての人間は、真理を自由に探究し、……自己の意見を表明し公表する権利を有する。」
『パーチェム・イン・テリス』第12項

真理の探究と意見表明の権利は、情報へのアクセスを前提としています。行政文書が読解不能であるとき、市民は自己の権利を「知る」ことすらできません。情報アクセスの障壁は、この根源的権利を実質的に空洞化させます。

第二バチカン公会議『現代世界憲章(ガウディウム・エト・スペス)』(1965年)

「文化の恩恵、特に……読み書き能力を受ける権利を有効にするために、すべてのことがなされなければならない。」
『ガウディウム・エト・スペス』第60項

リテラシーの権利は、文字が読めることだけを意味しません。制度が提供する情報が理解可能であることまでを含みます。文書の構造が市民のリテラシーに適合しないとき、形式的な識字率の達成は実質的な排除を隠蔽する覆いになりかねません。

教皇フランシスコ『ラウダート・シ(回勅)』(2015年)

「真の倫理的アプローチは……最も弱い人々の声に耳を傾けるものでなければならない。」
『ラウダート・シ』第49項

環境問題について語られたこの原則は、行政言語にもそのまま適用されます。制度から最も遠い立場にある人々——外国籍住民、高齢者、障害者——の「読めなさ」に耳を傾けることが、文書改善の出発点でなければなりません。

教皇ベネディクト十六世『カリタス・イン・ヴェリターテ(真理における愛)』(2009年)

「情報へのアクセスの不均衡は、新しい形態の差別をもたらしうる。」
『カリタス・イン・ヴェリターテ』第73項

デジタル時代の情報格差についてのこの警告は、行政文書のアクセシビリティ問題を予見するものです。情報がデジタル化されても、その「構造」が排除的であれば、格差は技術によって増幅されるのです。

出典:教皇ヨハネ二十三世『パーチェム・イン・テリス』(1963年)、第二バチカン公会議『ガウディウム・エト・スペス』(1965年)、教皇フランシスコ『ラウダート・シ』(2015年)、教皇ベネディクト十六世『カリタス・イン・ヴェリターテ』(2009年)

今後の課題

本研究は行政文書の構造的障壁を可視化する第一歩を踏み出しました。ここからさらに歩みを進めるために、以下の課題に取り組みたいと考えています。これらは技術の発展であると同時に、社会全体で考えるべき問いでもあります。

多言語・多文化対応

外国籍住民が増加する日本社会において、行政文書の障壁分析を多言語に拡張する必要があります。「やさしい日本語」に加え、翻訳文書の構造的品質評価、母語話者の認知特性に配慮した文書設計指針の開発に取り組みます。

リアルタイム執筆支援

文書完成後の診断ではなく、執筆段階でリアルタイムに読解障壁を警告する支援システムの開発を目指します。行政職員が文書を書きながら即座に改善提案を受け取れる環境を構築し、「最初から読みやすい文書」の作成を可能にします。

縦断的効果測定

文書改善が市民の権利行使に与える長期的影響を追跡します。申請率・不服申立て率・制度認知度の変化を複数年にわたり計測し、文書改善と権利アクセスの因果関係を実証的に解明します。

制度横断的な標準化

文書可読性基準を自治体間・省庁間で共有可能な標準として策定し、行政文書全体の底上げを図ります。同時に、「基準への適合」が形骸化しないよう、市民参加型の評価プロセスの設計にも取り組みます。

「あなたが最後に読むのを諦めた行政文書は、何を伝えようとしていましたか——そしてその情報は、あなたの生活をどう変えたかもしれませんか。」