コロナに負けず、できることを少しずつ。

[ML Study Jams Vol.4] GSP075 Cloud ML API を使用して画像内のテキストの抽出、分析、翻訳を行う学習メモ

[ML Study Jams Vol.4] GSP075 Cloud ML API を使用して画像内のテキストの抽出、分析、翻訳を行う学習メモ

GSP075 Cloud ML API を使用して画像内のテキストの抽出、分析、翻訳を行う
https://www.qwiklabs.com/focuses/1836

概要

このラボでは、複数の機械学習 API を組み合わせて使用し、機械学習によってできることを体験します。最初に Cloud Vision API のテキスト検出メソッドを使用し、光学式文字認識(OCR)を利用して画像からテキストを抽出します。次に、そのテキストを Translation API で翻訳する方法と、Natural Language API で分析する方法を学びます。
(qwiklabs から引用)

ハンズオンの内容メモ

■SIGN ボード画像からテキストを OCR するための準備から、ハンズオンは始まります。


■ CloudVision API では見慣れた結果ですね。


■分析のために “content”:”your_text_here” を Natural Language API へ渡した後のエンティティ結果。


■Natural Language API により見つかったエンティティ結果。

闇雲に遊んでみる 
SIGN画像は変更せず日本語を Translation API へ渡す(絶対失敗する時のエラーを知りたい)

■結果は、Translation API に使用する API Key が有効ではないので bad request として無効でした。

■順序が前後しますが、Translation API https://cloud.google.com/translate/docs/reference/rest/v2/translate の引数は次の条件があります。

string

Required The input text to translate. Provide an array of strings to translate multiple phrases. The maximum number of strings is 128.

必須翻訳する入力テキスト。 複数のフレーズを翻訳する文字列の配列を提供します。 文字列の最大数は128です。


■そのため、文字列を英文にするとスルー(そのまま)出力されます。

ちなみに “Where do you want to go today?” はマイクロソフト・グローバルキャンペーン文言(かなり前)です。

学習した内容

  • 複数の機械学習 API を組み合わせたユースケース
  • Vision API の OCR リクエストを作成し、curl を使用して API を呼び出す方法
  • Translation API を使用してテキストを翻訳する方法
  • Natural Language API を使用してテキストからエンティティを抽出する方法

ラボ終了

このコマ終了に要した時間は 14 分ほど。

ご覧いただき有難うございました。

以上

ML Study Jams Vol.4カテゴリの最新記事