AIが写真を解析して「文字と音声」で教えてくれる実験的アプリをマイクロソフトがリリース

投稿日:

by kimi

Photo on Foter.com

「人間の仕事を奪う」なんてことも言われるAIですが、確かに人に近づいてきているかもしれないと思わせるようなアプリがあったので紹介します。

「Seeing AI」は、iPhoneのカメラで写真を撮るとAIが「何が写っているか」を読み取り、音声や文字情報で教えてくれるというアプリ。

まさにAIが人のように写真の内容を理解しているからこそ実現できる技術であり、AIの技術の凄さを感じられるものとなっています。まあ、まだまだ発展途上みたいなんですけどね。

Seeing AI
仕事効率化
無料

なんか惜しいぞ!

マイクロソフトが配布を開始した「Seeing AI」は、カメラで撮影することで、写真から様々な情報を読み取り、音声や文字情報で教えてくれます。目の不自由な人が、自分の近くに何があるのか把握するのに役立ちそうですね。

幾つかモードが選べるのですが、特に興味深いのは「Scene」。写真を撮ると、何が写った写真なのかをAIが認識して教えてくれます。出かけついでに幾つか試してみたので紹介しますね。

まずは花を撮影。「ピンクの花が庭にあります」と正しく認識してくれました。

走っている電車を撮影すると、「旅客列車が線路の上にある」と認識。まるで人に「何が写った写真?」と、尋ねているような気がしてしまいます。

ただ、何枚か撮ってみると「なんか惜しい!」と思ってしまうこともしばしば。

道端のポストを撮ってみると、「おそらく歩道にある赤いベンチ」。あの色・形のポストはおそらく日本特有なものでしょうから認識できないのでしょうね。

コンビニの前にあるゴミ箱を撮影すると、「おそらくビルのよこにあるパーキングメーター」とのこと。たぶん、形が特有だったみたいです。

線路のみを撮影してみると、「鉄の線路の上の電車」と表示。AIには何が見えているんですかねぇ…。

と、いうわけで日本特有の色・形のものを中心として、認識能力はまだまだこれからといったところでしょうか。

ちなみに、現在搭載されているモードは、「Scene」も含めて以下の9つ。いずれも、英語もしくは英語圏内で利用されることを想定されており、日本語は利用できません。

  • Short text 文字を読み取り音声で読み上げる
  • Document 印刷された書類を綺麗に取り込み、読み上げる
  • Product 商品のバーコードを読み取り、その商品についての情報を音声で知らせる
  • Person 顔認識機能で、どのくらい離れたところに何人、人がいるのか音声で知らせる
  • Currency カメラに映った紙幣がいくらか音声で知らせる 
  • Scene 撮影した写真がどんな場所か文字情報で知らせる 
  • Color 中央部に写った色を音声で知らせる
  • Handwriting 手書きで書かれた文字を音声と文字で知らせる
  • Light 光量を音の高さで知らせる

「Scene」など幾つかはまだプレビュー版であり、実験段階の機能だったりするので、これからもっと進化して実用的になっていくことが見込まれます。

似たようなものはGoogleが「Google Lens」としてリリースしていますが、AIとスマホの進化でより多くの人がますます便利に日常生活を送っていくことができるようになれば良いですね。

Seeing AI
仕事効率化
無料
iPhoneをチェックする

 ソフトバンク民は見ない方がいいかも。最終的に全然違うよ。

iPhoneをチェックする

 ソフトバンク民は見ない方がいいかも。最終的に全然違うよ。

kimi
Photo on Foter.com

人気記事

ランキングの続きを見る


関連記事