WORKS
- HOME
- WORKS LIST
- 【ISO認証機関向けDX導入事例】AI-OCRを用いた紙資料の高精度データ化。表抽出85%超・情報検出98%以上を達成し、入力工数を大幅削減
【ISO認証機関向けDX導入事例】AI-OCRを用いた紙資料の高精度データ化。表抽出85%超・情報検出98%以上を達成し、入力工数を大幅削減
【プロジェクト総括(Overview)】
企業向けにISO認証試験や研修を提供する認証機関様において、膨大な紙の資料と手作業によるシステム入力が、業務効率化の大きなボトルネックとなっていました。AMELAは、画像補正からテキスト認識までを統合した独自の「AI-OCRパイプライン」を構築。非定型の帳票や複雑な表(テーブル)からでも、情報検出精度≥98%、テーブル内容検出精度>85%という高精度なデータ化(テキスト化)を実現し、長時間を要していたデータ入力・検索業務の課題を根本から解決しました。
【プロジェクト情報】
- 業界: ISO認証機関(ビジネスサービス・教育)
- 開発カテゴリー: 業務システム / AI開発
- 導入ソリューション: AI-OCRの仕組みを用いたデータ化プラットフォーム
お客様の課題・背景(Client Challenges)
今回ご紹介するのは、企業向けにISO認証手続きの受付、研修コースの提供、および試験の実施を行っている機関の事例です。事業が成長し処理すべき情報が増加する一方で、情報システム・DX担当者は以下のような「紙ベースの業務が引き起こす負の連鎖」に直面し、強い危機感を抱いていました。
- システムへのデータ入力に長時間を喪失: 企業から提出される様々な申請書類を目視で確認し、システムへ手作業で入力しており、膨大な時間が奪われていた。
- 紙保管による検索性の悪化: 資料のほとんどが紙のままバインダーやキャビネットで保管されており、必要な情報を探し出すだけで多大な労力と時間がかかっていた。
- 過去データの活用ができずリソースを浪費: 研修部門が新たに教材を作成する際、過去の資料がテキストデータ化されていないため再利用できず、毎回多大なリソースを費やしてゼロから作成しなければならなかった。
お客様のご要望(Client Requirements)
これらの課題を解消し、社内の情報資産を有効活用するため、お客様からは以下の要件をいただきました。
- 膨大な紙の資料を、人の手を極力介さずに高精度でテキストデータ化すること。
- 単なる文字の読み取りだけでなく、申請書に含まれる「表(テーブル)」の構造も正確に抽出すること。
- 現場の担当者がスムーズに資料を検索・再利用できる状態にすること。
AMELAが選ばれた理由(Why AMELA?)
高精度なAI-OCRの開発において、お客様がAMELAをパートナーとして選定したのには、大きく2つの理由がありました。
- Computer VisionおよびNLP(自然言語処理)領域における確かな実績: AMELAは、過去にAI画像生成技術(GAN)を用いた美容クリニック向けシミュレーションアプリ開発を手掛けるなど、画像解析(コンピュータビジョン)や機械学習において豊富なノウハウを有していました。今回はOCRだけでなく、言語理解やエンティティ認識(NLPモジュール)を組み合わせた高度な技術力が求められ、弊社の実績が高く評価されました。
- 圧倒的なリソースと、高い継続率を誇る開発体制: AMELAは2019年の創業以来、社内エンジニア200名以上、パートナーエンジニア1,000名以上という体制で、200社・350件以上のプロジェクトを支援してきました。単なる開発力だけでなく、「顧客満足度90%」「フェーズ継続率95%」「プロジェクト延長率97%」という数字に裏打ちされた伴走力が、選定の大きな決め手となりました。
AMELAのソリューション:AI-OCRの仕組み(Our Solution)
AMELAは、非エンジニアの現場スタッフでも安定して運用できるよう、元のスキャン画像からテキスト化に至るまで、以下の4ステップからなる独自の「AI-OCRパイプライン」を構築しました。
- ステップ1:画像補正(Radon変換適用+最適化) スキャンした書類の傾きや歪みを、数学的な処理(Radon変換)を用いて自動的に検知・補正し、AIが文字を読み取りやすい最適な画像状態へと整えます。
- ステップ2:テキスト検出(ブロック解析) 補正された画像の中から、「どこに文字が書かれているか(テキストブロック)」を正確に見つけ出します。
- ステップ3:情報検出とテーブル内容検出(行の解析) 文書全体のレイアウトを理解し、ブロック内の行を解析します。ここでは単なる文字の羅列としてではなく、申請書に特有の「表(テーブル)」の構造を維持したまま情報を抽出します。
- ステップ4:テキスト認識(AI・辞書による文字訂正) 行内の文字を解析しテキストデータ化します。その際、独自のAIと辞書を連携させ、文脈から不自然な箇所を自動で訂正することで、極めて精度の高いデータ化を実現しました。
導入効果(Results / Outcome)
本AI-OCRシステムの導入により、手作業と紙に縛られていたお客様の業務に以下の明確な成果がもたらされました。
【Before】
- 紙の資料を手作業でシステムに入力・保管しており、検索や入力に長時間を要していた。
- 過去の研修資料が紙で埋もれており、新教材の作成時に情報が再利用できなかった。
【After】
- 情報検出精度【≥98%】を達成: AIと辞書による強力な文字訂正機能により、極めて高い精度でのデータ化(テキスト化)に成功。長時間を要していたシステムへのデータ入力にかかる工数を大幅に削減しました。
- テーブル内容検出精度【>85%】を実現: 従来のOCRでは読み取りが困難だった複雑なフォーマットの表データも正確にデジタル化できるようになり、情報の構造化に成功しました。
ペーパーレス化による「データの資産化」: 紙の資料が検索可能なテキストデータに変換されたことで、必要な情報へ瞬時にアクセスできるようになりました。これにより、研修部門が過去の資料データを容易に活用できるようになり、教材作成の生産性が飛躍的に向上し
まとめ(Conclusion)
本プロジェクトは、画像補正技術と高度なAIテキスト認識を組み合わせることで、企業が抱える「手入力の限界」と「紙資料のサイロ化(孤立)」を見事に解決したDX成功事例です。
データが適切にテキスト化され検索可能になったことで、組織は単純作業から解放され、過去のナレッジを活かした質の高い研修・サービスの提供にリソースを集中できるようになりました。
AMELAジャパンでは、このような最先端のAI技術(Computer VisionやNLP)を活用したペーパーレス化から、システム全体のDX推進まで、お客様の課題解決を強力に伴走支援いたします。弊社の幅広い対応領域や実績については、弊社のシステム開発・DX支援サービスをご覧ください。
━━━━━━━━━━━━━━━━━━━━━━━━━━
データ入力の自動化やAI導入のパートナーをお探しですか?
「紙の書類が多くてシステムへの入力に時間がかかっている」「過去の資料が検索できずリソースを浪費している」といった業務課題をお持ちの企業様は、ぜひ一度AMELAジャパンにご相談ください。 貴社の業務フローを深く理解する専門チームが、最適なAI・システムソリューションをご提案いたします。