コンテンツにスキップ

Data Governance Policy

対象: AutonoMath DB (unified_registry および関連 canonical テーブル) 事業者: Bookyou株式会社 (T8010001213708) 最終改訂日: 2026-04-24 施行日: 2026-04-24


1. 目的

AutonoMath は、お客様が「受給可能な制度の一次資料に到達する」ための導線を提供します。その価値の源泉はデータ品質の信頼性にあります。本 policy は以下を目的とします:

  1. 誤情報混入の防止 (詐欺リスク回避)
  2. 一次資料への canonical link の維持
  3. 撤回制度の適切な取り扱い
  4. 誤情報発見時の修正 path の明確化

2. データソース基準 (一次資料必須)

2.1 許可ソース (canonical source)

DB に ingest してよいのは、以下のドメインで公開されている公式資料のみ:

カテゴリ ドメイン基準
国の行政機関 *.go.jp maff.go.jp, meti.go.jp, mlit.go.jp, cao.go.jp, env.go.jp
地方自治体 *.lg.jp tokyo.lg.jp, pref.hokkaido.lg.jp, city.sapporo.lg.jp
主要財団・協会 *.or.jp (個別 whitelist) 日本政策金融公庫、中小企業基盤整備機構、各業界団体
独立行政法人 公式 *.go.jp / *.or.jp 農研機構、JETRO、中小機構
国の審議会 / 政府統計 e-Gov, e-Stat e-gov.go.jp, e-stat.go.jp
EU / 国際機関 (サブセット) 公式 domain *.europa.eu, *.oecd.org (該当する場合)

2.2 禁止ソース (aggregator blocklist)

以下のソースからの制度情報を canonical として ingest することを禁止します。Wave 4-6 の信頼性検証で、一次資料との齟齬・誇張・掲載期限切れの確率が高いと判明しています。

禁止 aggregator list:

  • noukaweb.com
  • hojyokin-portal.jp
  • biz.stayway.jp
  • nikkei.com (新聞記事)
  • prtimes.jp (PR)
  • wikipedia.org (百科事典)
  • その他 *.co.jp / 商用メディアで 「まとめサイト」的に制度情報を転載しているもの

ただし、これらのサイトを 一次資料の existence を示唆する lead source として内部的に参照することは可 (lead → primary source 確認 → canonical 登録のフロー)。

2.3 例外処理

上記分類に当てはまらないが重要性の高いソースがある場合、個別に whitelist 登録し、canonical_source_note フィールドに判断根拠を記録します。


3. 更新頻度

3.1 定期 sweep

  • 週次 full sweep: 毎週月曜 02:00 JST、全 canonical URL を re-fetch して change detection。
  • 月次 deep audit: 毎月 1 日、tier A/S 制度は manual review を含む validation。
  • 日次 top-N watch: アクセス上位 100 制度は 24 時間以内に change detection。

3.2 新制度検知時

  • 新制度の公表 (省庁 press release / 告示) 検知時、48 時間以内 に canonical metadata を DB に ingest。
  • ingest 前に primary source で 2 点確認 (URL alive + content match)。

3.3 改正検知時

  • 公募期間変更、交付上限変更、要件変更等を検知した場合、72 時間以内 に DB update。
  • 変更内容は revision_history テーブルに監査ログとして保存。

4. Tier 判定

unified_registry の tier は、実データ充足度に基づき厳格に判定します (2026-04-20 確立ルール)。

Tier 定義 目安件数
S 公募中 + 交付決定あり + 申請様式 link alive + 採択率公開 1 件
A 公募中 + 交付決定あり + 申請様式 link alive ~50 件
B 公募中 + 一次資料 link alive ~60 件
C 休止中だが制度存続、過去交付実績あり ~200 件
D 制度自体が存続するが現在公募なし ~400 件
expired 制度終了・統廃合 別 status

禁止事項: データ空の項目を「ある」と推定して tier を水増ししない。


5. 撤回制度の扱い

5.1 Status 管理

撤回された制度は即時削除せず、以下の canonical_status で区別:

status 意味 検索結果への扱い
active 公募中 標準の検索結果に含む
paused 一時休止 (年度替わり待ち等) 検索結果に含む (ラベル付)
expired 制度終了 検索結果から除外 (名前空間 alias は保持)
merged 他制度に統合 alias で後継制度にリダイレクト

5.2 Alias 保持

撤回された制度でも、お客様が過去の制度名で検索してくる可能性があるため、alias 名は 3 年以上保持します。

5.3 撤回時の情報残置

expired の場合でも、以下の metadata は保持:

  • 過去の交付実績 (aggregate)
  • 後継制度への link (あれば)
  • 終了日
  • 終了根拠 (告示 URL)

6. 誤情報修正 path

6.1 外部からの報告窓口

誤情報の報告は以下の窓口で受け付けます。

  • Email: [email protected]
  • 件名: [data-correction] 制度ID <canonical_id>
  • 推奨情報: canonical_id、誤り箇所、正しい情報の一次資料 URL

6.2 対応 SLA

重大度 対応期限
critical (受給期限切れを「公募中」と誤表示等) 24 時間以内に hotfix
high (交付上限額の誤表示等) 48 時間以内
medium (要件の一部誤記) 7 日以内
low (表記ゆれ、typo) 次回週次 sweep で修正

6.3 修正後の対応

  • 報告者に修正完了を email で通知 (報告者 opt-in 時)
  • revision_history テーブルに修正根拠を記録
  • 誤情報を元に誤った判断をした可能性のあるお客様への事後通知 (critical のみ、API 利用 log から過去 90 日の該当 query を抽出)

7. データ品質 metric

以下の KPI を月次で追跡します。

metric target
canonical URL liveness (200 OK 率) >=99%
誤情報報告件数 記録 (推移 watch)
critical 誤情報発見からの hotfix 時間 (中央値) <=24h
tier S/A の manual review 完了率 100% (月次)

8. データ独立性

AutonoMath は以下を行いません:

  • 個別事業者への推薦 (A 制度より B 制度が良い等の editorial opinion)
  • 制度所管機関からの sponsorship 受領 (特定制度の検索順位を上げる等の commercial bias)
  • 検索結果の paid promotion

検索結果の順位は、客観的 metric (一致度、最新性、tier) のみで決定します。


9. 補足: 個人情報 / 要配慮個人情報 の混入防止

9.1 ingest 時の check

  • 一次資料に個人名 (申請者氏名、採択者氏名) が掲載されている場合、当社は氏名を redact して ingest します。
  • 法人名は公開情報として ingest OK (法人番号、法人名)。

9.2 query-side の check

  • お客様 query 内の PII (email、電話、住所等) は応答 log への記録前に正規表現で redact。詳細は privacy_policy.md 参照。

10. 更新履歴

  • 2026-04-24: 初版策定 (Wave 15 compliance 策定時、禁止 aggregator list を Wave 4-6 知見から確定)

11. 連絡先

Bookyou株式会社 〒112-0006 東京都文京区小日向2-22-1 法人番号: T8010001213708 Email: [email protected]

以上