株式会社ルーターが提供する、AI技術を駆使したビッグデータ収集エンジン「AIクローラー(※1)」は、複雑なフリーフォーマット文章構造のPDFファイルからの情報抽出精度向上や、閲覧者のPDF内の重要情報把握をサポートする文書ハイライト・リンク機能など、同サービスのPDFパース機能に対して機能強化を行いました。

AIクローラーは近年の非定形情報の収集ニーズに対応した、クローラー自身がコンテンツの意味を理解し必要な情報を自動選別して収集する、全く新しい形のビッグデータ収集ソリューションです。本サービスリリース後、各業界より大きな反響を頂き、様々なご要望にあわせて機能強化を進めて参りました。

今回、AIクローラーのさらなる追加機能として、パワーポイントから生成されたPDFのような、文章や図表がフリーフォーマットで複雑にレイアウトされた、文書構造の把握が困難なPDFフォーマットに対しても、原本の文書構造をAIクローラーが適切に理解し必要な情報を抽出できるようになりました。また、PDFファイル原本のページレイアウトを維持したHTMLファイルを生成し、文書内の抽出対象部分をHTMLファイル上でハイライト、及び、アンカーリンクを発行することで、閲覧者の視覚的な情報把握をサポートする機能も追加しております。

PDFパース機能を初め、AIクローラーの詳細はサービス説明資料をご請求頂きご確認ください。サービス説明資料のご請求は、下記AIクローラー紹介ページ下部のお問い合わせフォームより、お問い合わせ件名「AIクローラーの資料請求」にてお問い合わせください。

AIクローラー 〜AI技術を駆使したビッグデータ収集エンジン〜

株式会社ルーターは、自社の強みである革新的なクローリング技術を活かし、今後も世の中のホワイトカラー業務の作業自動化を推進し、人がよりクリエイティブな仕事に集中していく未来の実現に貢献して参ります。


※1 従来のクローラーは人間が取得するコンテンツのURLやコンテンツの位置を決めることで初めてデータ収集が可能になります。しかし、世の中の情報収集のニーズは「どこにあるか分からない」、「どんなレイアウトでページ上に記載されているか分からない」というような、対象Webサイトや掲載フォーマットが定まっていない非定型の情報をクローラーによって収集したいという方向に移り変わって来ています。

この課題に対し、弊社ではクローラーがコンテンツの意味を理解し、必要な情報を自動選別して収集することが可能な「AIクローラー」を開発致しました。AIクローラーは検索エンジンのようにキーワードベースで対象データの傾向を命令するだけで、インターネット上を回遊し、求められた情報を自動選別して収集することができる新時代のクローラーです。

Pocket