カテゴリー : AI/機械学習
Qwen3-VLで名刺読み取りを試してみた はじめに 以前Chromeに内蔵されたローカルLLMである Gemini Nano を用いて名刺読み取り制度の検証を行いました。今回はその続きで、 Qwen3-VL を試してい […]
はじめに ChromeにはローカルLLMである Gemini Nano が内臓されています。 GeminiのRest APIを叩いて高性能なモデルを利用するのが簡単ですが、API料金がかかってしまいますし、 医療や個人情 […]
はじめに 皆さん、こんにちは、エンジニアの Hodoshima です。 今日では、Gemini における Code Execution の機能を紹介します。 Code Execution 機能を使うことによって、特に、デ […]
再学習・二次利用の有無は、有料か無料かで決まる Gemini APIの利用規約に、再学習・二次利用に関する記述があったので抜粋します(2026年2月6日時点)。 ▼無料サービス > Google AI Studio […]
利用シーン:請求書をまとめてもらう 私が使ってるGem(Geminiのプロンプトテンプレ)はこちらです。 このようなプロンプトをあらかじめGemに登録すると領収書をアップするだけで一覧にまとめてくれます。 ただし10個を […]
昨今のAIブームの影響を受けて、各組織で内部ドキュメントをどのように生成AIで参照するかを思案していることかと想像します。 本記事では、そこで課題となるであろうファイル内の埋め込み画像の扱われ方について検証します。 お急 […]
はじめに Cloudflare AI GatewayをはじめとするAIモニタリングツールは、各種AIアプリケーションのログ管理、キャッシング、レート制限などを一元管理できる非常に強力なツールです。 基本的な使い方や機能に […]
Cloudflare AI Gatewayとは Cloudflare AI Gatewayは、AIプロバイダー(OpenAI、Gemini、Claudeなど)のAPIを中継するプロキシサービスです。 アプリから直接API […]
はじめに 皆さん、こんにちは、エンジニアの Hodoshima です。 今日では、膾炙されるようになった生成 AI について、生成 AI を用いたプロダクトが多く生まれるようになっています。 その中で、生成 AI に分析 […]
エンジニアの kanazawa です。久々の機械学習ネタということで、類似画像の判定を試してみました。類似画像の判定には、古典的な画像分析で頑張る方法もあるかと思いますが、今回はエイヤで Google Vision AP […]
お問い合わせ・ご依頼はこちらから