
実環境レシートデータに最適化したOCRモデルを共同開発し、1日100万枚規模の処理とOCRランニングコスト80%以上削減を実現しました。
導入の背景
WED株式会社は、ユーザーからレシートを買い取り、購買データとして活用する「ONE」を提供しています。「ONE」では、レシートから購買情報を抽出するため、1日あたり100万枚規模の画像をOCRで処理しています。
従来は他社製OCRエンジンを利用していましたが、ランニングコストの高さや、業務要件に応じたチューニングの柔軟性に課題がありました。
導入した取り組み
MLismは、WEDが保有する実環境レシートデータを活用し、日本語OCRエンジン「YomiToku」をベースとしたレシート特化OCRモデルを共同開発しました。
チューニングにあたっては、ピンボケ、手ブレ、折れ・曲がり、特殊フォントなど、実運用で発生する多様で複雑な条件を考慮し、モデルの最適化を進めました。
本モデルは、WEDにおける「ONE」プラットフォームのOCRエンジンとして採用されています。
導入効果
5%以上
識字率向上
30%以上
処理時間を削減
100万枚/日
レシート画像を安定処理
80%以上
OCRランニングコスト削減
認識精度の向上
実環境のレシートデータをもとにチューニングし、ベースモデルに対して5%以上の識字率向上を実現しました。
大量処理への対応
モデルの軽量化と処理パイプラインの最適化により、1日あたり100万枚規模のレシート画像を安定的に処理できる体制を構築しました。
コスト削減
従来利用していた他社製OCRエンジンと比較して、80%以上のランニングコスト削減を実現しました。
運用要件への最適化
ピンボケ、手ブレ、折れ・曲がり、特殊フォントなど、実運用で発生する条件を考慮してモデルを最適化しました。
お客様の声
「ONE」で収集した実データと、MLismの日本語OCRエンジン「YomiToku」を組み合わせることで、大幅なランニングコスト削減を実現しました。さらに、「ONE」で収集したデータは、今回のレシート特化モデルに加え、「YomiToku」の汎用モデルの精度改善にも活用されています。今後もYomiTokuとの連携を深めながら、蓄積した実購買データのさらなる価値化に取り組んでまいります。
新井 俊樹様
WED株式会社 代表取締役