--- name: reading-withholding description: > 源泉徴収票の画像を読み取り構造化データを返す。 他のスキルから呼び出されるほか、直接ユーザーが呼び出すことも可能。 --- # 源泉徴収票 画像読み取り 源泉徴収票の画像を読み取り、構造化データとして返すスキル。 ## 画像読み取り方法 ### 推奨: デュアル検証(並列2コンテキスト) 精度を高めるため、同じ画像を2つの独立したコンテキストで並列に読み取り、結果を照合する。 1. **2つの独立した読み取りを実行する:** サブエージェントが使える環境では、2つのサブエージェントを並列で起動し、それぞれ独立に画像を読み取る。 各サブエージェントには以下の「基本ルール」と「出力フォーマット」をプロンプトとして渡し、画像ファイルパスを指定する。 2. **結果照合:** 両方の読み取り結果から主要フィールド(金額等)を比較する。 3. **一致の場合:** そのまま採用。「2つの独立した読み取りで結果が一致しました」と報告する。 4. **不一致の場合:** ユーザーに元画像パスと両方の結果を提示し、正しい方を選択してもらう: - 差異のあるフィールドを明示する - A を採用 / B を採用 / 手動入力 の3択を提示する ### フォールバック(サブエージェント非対応の場合) サブエージェントが利用できない環境では、以下の手順で読み取る: 1. 画像ファイルを直接 Read ツールで読み取る 2. 以下の「基本ルール」と「出力フォーマット」に従ってデータを抽出する 3. 抽出結果をユーザーに提示し、**必ず目視確認を依頼する** ⚠ デュアル検証が利用できないため、必ずユーザーに目視確認を依頼してください。 ## 基本ルール - 画像ファイルは Read ツールで読み取る(Claude Vision が自動的に画像を認識する) - 金額は必ず int(円単位の整数)で返す。カンマや「円」は除去する - 日付は YYYY-MM-DD 形式で返す - 和暦は西暦に変換する(令和7年 → 2025、令和6年 → 2024、平成31年 → 2019) - 読み取れないフィールドは UNKNOWN(文字列)または 0(金額)とする - 複数ファイルを渡された場合は全て順に処理してまとめて返す ## 出力フォーマット 画像を読み取り、以下の形式で返す: ``` ---WITHHOLDING_DATA--- payer_name: 支払者名 payment_amount: 支払金額(int) withheld_tax: 源泉徴収税額(int) social_insurance: 社会保険料等の金額(int) life_insurance_deduction: 生命保険料の控除額(int) earthquake_insurance_deduction: 地震保険料の控除額(int) housing_loan_deduction: 住宅借入金等特別控除の額(int) life_insurance_detail: general_new: 一般の新保険料(int) general_old: 一般の旧保険料(int) medical_care: 介護医療保険料(int) annuity_new: 個人年金の新保険料(int) annuity_old: 個人年金の旧保険料(int) ---END--- ``` ## 抽出のポイント - 「支払金額」欄(給与収入の総額)を最優先で抽出する - 「源泉徴収税額」欄を正確に読み取る - 「社会保険料等の金額」欄を読み取る - 生命保険料控除は新旧制度・3区分(一般/介護医療/個人年金)の内訳を確認する - 地震保険料控除・住宅ローン控除は記載がある場合のみ抽出する - 支払者の名称(会社名)を抽出する - 記載がない項目は 0 とする ## 複数ファイルの処理 複数のファイルパスが指示された場合: 1. Glob ツールでファイル一覧を取得する(パターンが指示された場合) 2. 各ファイルを Read ツールで順に読み取る 3. 全ファイルの結果をまとめて返す(各結果の前にファイル名を記載する) ``` ## file1.jpg ---WITHHOLDING_DATA--- ... ---END--- ## file2.jpg ---WITHHOLDING_DATA--- ... ---END--- ```