データアーティスト株式会社は、AIを中心にデジタル領域のソリューションの提供やマーケティング課題の解決などに取り組んでいます。そのデータアーティストが、AIモジュールを組み合わせてソリューションを構築するサービス「KEY RING」を開発。AIの専門家でなくてもAIを活用した企画を検討できるなど、AIモジュールの組み合わせによって多様な使い方があることが特徴です。
前回「KEY RING」について取り上げた記事では、データアーティストの山田健氏より、「KEY RING」の開発背景から概要、特徴などについてご紹介しました。第2回目となる本記事では、データアーティストの鈴木初実氏が、主に「画像処理系のモジュール」を活用した事例についてご紹介します。
今やAIはさまざまな分野で活用されていますが、「興味はあっても、使い方が分からない」「自社のビジネスで活用するのは難しそう」などと、感じていらっしゃる方も少なくないでしょう。そのような方こそ、ぜひ本記事をお読みいただき、自社でのAI活用の可能性について一度検討されてみてはいかがでしょうか。
「KEY RING」には5つの「画像処理系モジュール」が用意されている
「KEY RING」は全部で18のモジュールから成り立っています。その中でも、「画像処理系モジュール」と呼ばれているものは5つ。基本的には撮影した動画から対象物をAIが分析する、というものなのですが、どのような分析ができるかというと、以下の5つです。
①表情・感情認識モジュール:顔の表情解析などによって、その人の感情を分析

②性別・年代別推定モジュール:対象者の性別や年代を推定

③物体検出モジュール:撮影された対象物が何なのかを判定

④モーショントラッキングモジュール:対象物の動きを把握

⑤画像領域分解モジュール:画像のどこに何が写っているのかをピクセル単位で分解

これらを活用して私たちが実際にソリューション開発に取り組んだ事例を、今回は4つご紹介します。
「画像処理系モジュール」を活用した4つの事例
事例1:マラソン大会「顔パス」参加(「表情・感情認識モジュール」と「物体検出モジュール」の組み合わせ)

以前から、イベント会場にカメラを設置し、そこに入場する人々の顔をトラッキングして、個人特定はしないままに、観客の感情を判定したり(楽しんでいただいているかどうか、あるいはどのタイミングで楽しいという感情が高まっているか)、イベント会場内のどこに滞留してしまうのかを分析したりといった取り組みは行っていました。それらの実績を踏まえて、「顔パス入場を実現しよう」というチャレンジがスタート。
とある都市の市民マラソン大会で参加者向けのアプリを作り、顔写真を事前に登録してもらいました。その上で、当日に顔認証だけでエントリーできるか、という実証実験を行ったのです。参加者には、アプリ上で、名前とエントリーナンバーと顔写真を登録しておいてもらいます。そして当日、会場の受付にはタブレット型端末が設置してあり、そこに顔を映すだけでエントリー完了、というシステムです。いざ実践してみたところ、認証精度は100%となりました。判定時間も2秒程度と非常にスムーズで、こうした活用方法は、今後もっと広がっていく可能性があるのではないかと思っています。
もちろん幾つか課題もありました。例えば通信状況が悪いと判定ができない、あるいは認識に時間がかかるという問題です。エントリー場所が地下であったりすると、通信がスムーズに行えないケースもあるかもしれません。ですが、これがきちんと稼働すれば、受付登録のためのスタッフの削減にもなりますし、混雑緩和や感染症対策、何より「大会当日に登録のために長い時間待たなければいけない」といった参加者のストレスも軽減されるのではないかと思います。
事例2:寿司ネタ判定(「物体検出モジュール」)

これは、とある回転寿司店からご相談いただいた案件だったのですが、「お客さまの注文通りに寿司ネタがきちんと出ているのかチェックしたい」というご相談でした。そこで、私たちの物体検出モジュールを活用して実証実験を行いました。
具体的には、「アジ」「イワシ」「コハダ」「マグロ赤身」「中トロ」「大トロ」「ブリ」「サーモン」「炙りサーモン」「生エビ」「ボイルエビ」「イクラ」「ウニ」の13種類の寿司ネタをAIできちんと見分けられるか、というチャレンジです。実際にやってみたところ、イクラやウニは簡単に見分けられますが、やはり「アジ」「イワシ」「コハダ」といった光り物系は見た目も似ていて判定が難しい。それでも、これら光り物3種類においても、8割以上の正解率となりました。
この話だけでは「その実験に意味があるのか」と疑問に思われるかもしれませんが(笑)、この取り組みを発展させることで「ミスの防止や品質管理にAIを活用できる」という可能性が生まれることがポイントだと考えています。AIによる画像解析が入ることで、例えば「注文されたものと違っていないか」「品質が悪くないか」を判定してはじくことができるかもしれません。そうなると、カメラ1つでミス防止から品質管理までできることになり、活用できるシーンは増えていくのではないでしょうか。
事例3:AI ELEVEN(「モーショントラッキングモジュール」と「画像領域分解モジュール」の組み合わせ)

AI ELEVENは、サッカーの試合結果をリアルタイムに予測するユニークなAIです。試合のライブ映像から選手やボールの動きを検出し、複数のAIを用いて分析。視聴者は瞬時に戦況を把握することができます。既に、東アジアサッカー連盟(EAFF)が主催する国際大会「E-1サッカー選手権」や、韓国のKリーグなどで実証実験を行った実績があります。
このシステムでは、試合中のボールポゼッション(チームがボールを保持している割合)や選手の動き、フィールドのどのエリアでプレーをしているのか、どちらのチームがどのくらい攻めているのか、キックオフから何分後にどのようなイベントが起こったのか、といったことを全て画像解析によって把握し、瞬時にAIが勝敗予測を判定。これにより視聴者は、サッカーの試合を楽しむだけではなく、その勝敗予測が試合展開とともにリアルタイムで動いていく、という新たな観戦体験を得ることができるのです。
「サッカーの勝敗予測」を楽しむ方法としては、いわゆる「スポーツくじ」などもありますが、こちらは選手のコンディションや過去の対戦成績、ここ最近の試合結果などから事前に勝敗を予測することになります。一方、AI ELEVENは、「今目の前で展開されている試合の状況から瞬時に勝敗を予測する」わけで、これはAIならではの新たな楽しみ方と言えるでしょう。
事例4:ヘアカラー・シミュレーター(「画像領域分解モジュール」)

こちらは、とあるヘアケア・トイレタリー系企業さまとの取り組みで、AIによる「ヘアカラー・シミュレーター」を開発しました。
自分の顔をスマートフォンで撮影し、画面上で髪の色を自由に変えることができます。実際に「ヘアカラーを使ってみたけれど、仕上がりを見たらイメージと違った」という体験をしたことがある人は多いのではないでしょうか。このシミュレーターを使えば、事前にこのヘアカラーを使えばどんな風に自分の印象が変わるのか確認できるので、そのギャップを少なくすることができます。
さらに、このシステムでは、ヘアカラーだけではなく、白髪染めのシミュレーションも可能。「スマートフォンで撮影して画面上で髪の色を変える」というと簡単にできるように思えるかもしれませんが、実は髪の毛というのは人によって形も違いますし、細いので、輪郭を正確に捉えるのは非常に高い技術が必要となります。白髪の場合は、髪の毛の境目が分かりにくい、というケースも。シミュレーターの精度が低いと、頭の上に不自然に色がのっているような状態になり、実際のイメージがよく分からない、ということもあります。正確に髪の毛の領域を特定し、そこに色をのせるというのは非常に高度なAIの技術を必要とするのです。
今回は、「画像処理系モジュール」を活用した4つの事例をご紹介させていただきました。これらの事例を応用すれば、「顔パス受付でセキュリティを強化」「お客さまの動きを分析し、店舗陳列の最適化」「シミュレーターと組み合わせた、リモートでの接客サービスの提供」など、さまざまなケースが検討できるのではないでしょうか。本記事をお読みいただいている皆さまのビジネス成長に貢献できる要素もきっとあるのではないかと思っています。
私たちも、日々チャレンジと進化を続けています。コロナ禍によってリアルイベントは減ってしまいましたが、例えばイベント来場者の評価を、アンケートではなく表情や行動から判定する、というようなシステムも構築しました。これからも私たちは「KEY RING」を活用しながら、さまざまな課題にお応えできるソリューションの開発・提供を進めてまいります。
混雑の緩和や品質管理、新しいエンターテインメントの提供など、AIの活用によってさまざまなメリットが生まれる可能性が分かりました。今回は、画像処理系モジュールから具体的な事例を紹介しましたが、「KEY RING」は全18のAIモジュールから構成されています。Transformation SHOWCASEでは、引き続きこの「KEY RING」を活用して構築したAIソリューション事例をご紹介していきます。そちらの記事もぜひご一読ください。