昨今、さまざまな分野で生成AIの業務活用に挑戦する動きが活発になっています。
もちろんデザイン業界も例外ではありません。グッドパッチでも、2023年12月から2024年3月にかけて、社内のデザインリサーチャーとエンジニアが協力し、リサーチプロセスにおける生成AIの活用に挑戦してきました。
今回、2024年5月18日に開催された「RESEARCH Conference」に登壇し、インタビューの文字起こしを活用した切片の作成・切片のグルーピング・構造化の取り組みを紹介しました。
この記事では、時間の都合で触れられなかったことも補足する形で、当日の発表内容をダイジェストでお届けします。また、記事の最後に実際に使ったプロンプトも掲載していますので、最後まで読んでいただけるとうれしいです。
目次
RESEARCH Conferenceとは
「RESEARCH Conference」は、デザインリサーチ、UXリサーチの発展を目指して2022年より開催されている日本発のリサーチカンファレンスで、グッドパッチは2023年に「探索型リサーチで広げるリサーチの価値」をテーマに、デザインリサーチャーの米田が登壇しました。
本年も、RESEARCH Conferenceの目的である「より良いサービスづくりの土壌を育むために、デザインリサーチやUXリサーチの実践知を共有し、リサーチの価値や可能性を広く伝えること」に共感し、ゴールドスポンサーとして協賛・登壇しました。
生成AIでリサーチャーの仕事は効率化できるのか?
今回、生成AIの活用を試したのは、グッドパッチ内のデザインリサーチの専門チーム。「人」を起点としたリサーチから、新規事業の立ち上げや事業改善、未来構想などのアクションを後押ししています。
講演でも触れた通り、生成AIを活用したのは、リサーチの中でもインタビューの分析工程、特に文字起こしやデータ分析の効率化です。「リモートでの働き方」をテーマにしたインタビューをテストケースとして使いました。
インタビューの分析工程には、大きく2つのステップがあります。
STEP1は、切片化とグルーピングです。インタビューの書き起こしテキストをバラバラにして切片(インタビューの文字起こしデータを、一定単位に分割したもの)を作り、グルーピングをしてラベルをつけます。STEP2は抽象化です。STEP1で作成したラベルを再度グルーピングして、より大きな単位でラベルをつけます。
今回の取り組みでは、GPT-4を使用して切片づくりとグルーピングを行いました。具体的な工程やプロンプトは後述します。
ここでの工夫として、できるだけ人の分析結果に近づけるよう、リサーチャーへのヒアリングを基に、リサーチャーの思考プロセスを細かくプロンプトに落とし込みました。こちらが、実際の出力結果の比較です。
プロンプトを細かく指定しない場合は、カテゴリや単語を拾った分類レベルで出力され、かつ説明文が要約されているのに対して、リサーチャーの思考を取り入れたプロンプトで実行したものは、欲求ベースかつ、ちょうど良い抽象度でまとまっています。
また、インタビューの発話の切片もそのままセットで出力がされていて、人間での分析シーンが想起できる形式でアウトプットされています。
STEP2はSTEP1の結果から、共通項を見つけてグルーピングし、さらに抽象化してラベルをつけるという工程ですが、ラベルに入れて欲しい要素を「Why、What、How、Want」の形式で指定する点を工夫しました。
こちらが、STEP2の出力結果で「リモートでの働き方について」の最終分析結果の比較です。
左側のラベルは「ワークライフバランス」というような単語やフレーズになっているのに対して、右側のリサーチャーの思考と独自の構文を取り入れたプロンプトの場合は「働き方の自由を通じて生活の質を高めて、仕事効率を維持したい」というような、具体的なニーズに沿ったラベルが出力されています。
生成AIを使ったインタビュー分析のメリットと改善点
講演では、生成AI活用を試した結果、リサーチャーとエンジニア、それぞれが感じたことを発表しました。
リサーチャーとしては、生成AIの出力結果をそのまま使うのではなく、たたき台として使うのが良さそうだと感じました。
出力結果を基にリサーチャーが精度を高め、データ群の関係性から新たな気付きを発見していくという活用方法が効果的だと感じています。これにより、AIの効率性と人間の洞察力を組み合わせた新たなアプローチが可能となります。
一方、エンジニアの観点では、リサーチに生成AIを活用する際に、AIの出力が人の分析に近づかず、文脈を理解せずに表面的な類似性で切片を抽出する点や、見出しの抽象度のコントロールが難しい点に苦労しました。
これを克服するために、リサーチャーの思考プロセスをプロンプトに反映し、過去のプロジェクトと比較しながら、分かりやすい見出しを作るための独自の構文を定義しました。
生成AIを活用したプロセスの全体図
ここからは、RESEARCH Conferenceで伝えきれなかったプロセスの詳細を紹介します。講演では「切片のグルーピング&ラベル化」に絞って紹介しましたが、検証は書き起こしからペルソナ作成までを見据えた形で行っていました。
段落分けと見出しを付けたインタビュー文字起こし
さらに単純な文字起こしだけでなく、分析に使いやすい形での文字起こしにもチャレンジしました。
段落に分けて、その段落ごとに見出しを付けます。見出しは要約として機能するため、目次を読むだけで文字起こし全体の概要をつかめます。
インタビューではありませんが、実例としては「Figma Config 2023」のセッションのテキスト情報を使った例が参考になります。
参考リンク:AI and the future of design: Designing with AI – Noah L, Jordan S, Andrew P, Vincent van der Meulen(日本語文字起こし)(補足:こちらはConfig 2023に関連する情報をグッドパッチがまとめたNotionページです)
インタビュイーの発話を抽出
Whisperが話者分離をサポートしていないため、GPT-4を使っています。pyannote.audio
やWhisperx
を使って話者分離する方法もあるようですが、厳密さは求めていないため、GPT-4に任せています。
ペルソナの叩きと画像を生成
インタビュイーの発話からペルソナの叩きを作成します。必要な情報が不足している場合は、GTP-4に補足してもらいます。
その後、ペルソナの叩きを使って、ペルソナをイメージしやすくなるような画像を生成します。最初はポートレート写真のような画像を生成していましたが、少ない線で表現した顔のイラストの方がレポート資料での使い勝手が良いことが分かりました。そのため、現在は後者を生成できるようトライ中です。
リサーチャーが「深く考える」をもっと増やしたい
このプロジェクトは、Slackで見かけた困りごとをきっかけに始まりました。当然ながら、最初は生成AIをリサーチにどう取り入れればよいか、どこから手を付ければよいのか手探りでした。
最も時間がかかっていたという文字起こしから始め、そこからペルソナ作成、インタビューの切片化、グルーピング、抽象化へと手を広げていきました。これらの段階で、自作ツールを駆使しながら取り組んできました。さらに、デスクトップリサーチではPerplexity AIを導入し始めて、情報収集の質も格段に上がりました。
まだ道の途中ですが、リサーチャー自身が生成AIを活用して、リサーチの質とスピードを上げ、「深く考える時間」をもっと増やすことを目指したいです。そのためには、人間の思考プロセスをさらに言語化することや、インタビュースクリプトや図解化などにも、AIの活用を広げていくことが必要だと考えています。
現時点では、誰でも使えるようなアプリケーション化はできていません。「Dify」のようなLLMアプリ開発プラットフォームが登場したことで、その可能性が広がり、私たちもこの技術を使ってリサーチプロセスをさらに効率化するアプリケーションを開発することにチャレンジしたいと考えています。
技術の進化に伴って、私たちの仕事のやり方もどんどん変わっていくでしょう。その流れにしっかり乗って、さらに効率的で精度の高い作業を目指します。私たちの取り組みが、これからのリサーチの参考になればと思います。
プロンプトを共有
最後に今回の取り組みで作成したプロンプトを紹介します。プロンプトは詳細に書きすぎて冗長的な部分があります。この点は今後改善し、より簡潔で効果的なプロンプトにしていきたいと考えています。
段落分け&見出しを付ける
プロンプト
あなたはプロの編集者です。 読みやすいようにトランスクリプションを段落に分け、理解しやすいように段落に見出しをつけてください。書き起こしを要約してはいけません。原文をそのまま書き写してください。 回答はマークダウン形式で作成してください。 回答は句点で改行してください。
インタビュイーの発話を抽出(プロンプトだけ記述)
プロンプト
このテキストはインタビューの文字起こしで、インタビュアーとインタビュイーが交互に発言しています。インタビュイーの発言を特定し、全て省略なく抽出してください。インタビュイーの発言は、通常「はい」や肯定的な応答で始まり、しばしば質問の回答として構成されます。発話は句点で終わるため、新しい発話が始まる位置を特定する際に句点を目印として使用します。また、発話が紛れることなく完全に抽出されているかを確認することを心掛け、可能な限り原文に忠実に抽出内容を出力してください。回答は句点で改行してください。 # インタビューの文字起こし
STEP 1
プロンプト
あなたは優秀なリサーチャーである。与えられたインタビューの発話録の具体的な発言(切片)をグループ化してほしい。発話録が入力されるまで待機してほしい。 # このコンテンツの前提条件 本コンテンツは、デザイン会社に勤務するデザイナーの働き方を理解し、彼らの発言をテーマごとにグルーピングすることが目的である。デザイナーが日々直面する働き方のニーズや課題を整理し、より良い働き方を模索するための分析である。 # このコンテンツの詳細 デザイナーによって挙げられた働き方に関するさまざまな側面についてのコメントを分析し、テーマ別にグルーピングすることにより、デザイナーの働き方に対するニーズや課題を浮き彫りにする。これには通勤の利点、オフィスでの協力作業、創造性を促進する環境など、多岐に渡るトピックが含まれる。 # 変数の定義とコンテンツの目的 - 変数: インタビューからの発言(切片)をグループ化するための単位。 - 目的: 切片をテーマ性に基づいてグルーピングし、デザイナーの働き方に関連するニーズや課題を明確化すること。 # 目的を達成するためのステップ 1. 切片の内容を読み込む。 2. 切片が複数のニーズや課題を含む場合は、切片を分割する。 3. グルーピングの対象となる切片をリストアップする。 4. 切片の内容からキーワード/テーマを抽出する。 5. 抽出したキーワード/テーマに基づき切片をグルーピングする。 6. グループごとに「〜したい」「〜できない」の文体で名前を付ける(厳守すること) 7. 各グループの範囲と内容を明確化する。 # 手順の実行プロセス(すべて厳守する) - 手順に従い、デザイナーの発言をテーマ別に整理し、適切な名前を付けることでグルーピングする - 複数のテーマに当てはまる切片については、複数グループへの分類する - 内容量が多くなる場合でも、全ての切片をグルーピングする - グループの数は限度はなく、より多くのグループを作成する # 成果物の生成 グルーピングの対象となる発言を全てリストアップする。最終的なグルーピングリストを明解で理解しやすい形で提供する。これには各グループの名称とそれに含まれる切片のリストが含まれる。 # 成果物の例 ## グループ1: 〇〇したい - 切片 - 切片 - 切片 ## グループ10: 〇〇したい ## グループxx: 〇〇できない ## 全体を通してのコメント
STEP 2
プロンプト
あなたは優秀なリサーチャーである。与えられた第一段階のグループ化の結果を使用して第二段階のグループ化を実施してほしい。第一段階のグループ化の結果が入力されるまで待機してほしい。 # このコンテンツの前提条件 デザイナーが日々直面する働き方のニーズや課題を整理し、より良い働き方を模索するための分析を行うことである。第一段階として、デザイン会社に勤務するデザイナーのインタビュー発話録から働き方のニーズや課題を理解し、彼らの発言をテーマごとにグループ化した。第二段階では、第一段階のグループ化の結果を使用して、より深いレベルで働き方に関するさまざまな側面について分析する。 # このコンテンツの詳細 第一段階のグループ化の結果を使用して、より深いレベルで働き方に関するさまざまな側面について分析する。深い洞察でニーズや課題、ワークスタイルの観点でグループ化することにより、デザイナーの働き方に対するニーズや課題、ワークスタイルを言語化する。 # 変数の定義とコンテンツの目的 - 変数: インタビューの発話録の具体的な発言「A切片」を情報ソースとしてグループされた、第一段階のグループのリスト。各グループのタイトルを「B切片」と呼ぶ。 - 目的: B切片を働き方のニーズや課題に基づいてグループ化し、デザイナーの働き方に関連するニーズや課題、ワークスタイルを、さらに深いレベルで言語化する。 # 目的を達成するためのステップ 1. B切片の内容を読み込む。 2. 各グループのA切片を読み込む。 3. グループ化の対象となるB切片をリストアップする。 4. A切片とB切片を一つ一つを分解して、その構成要素を詳細に言語化する。 5. 言語化した情報からキーワードを抽出する。 6. 抽出したキーワードに基づきB切片をグループ化する。 7. 下記の「Why, What, How, Want」構文を用いて、働き方のニーズや課題、ワークスタイルをストーリーとして言語化する。日本語で150文字から200文字程度の文章にする。 8. 言語化したストーリーを「Why, What, How, Want」構文の文章にする。それをグループタイトルとする。 # 「Why, What, How, Want」構文 - Why: なぜそれをするのか - What: 行為の対象は何か - How: どのようにするのか - Want: その結果、何を期待するのか - 「[Whyの文章] [Whatの文章] [Howの文章] [Wantの文章]」のフォーマットで文章を構築する - 文章の文末は「したい」「したくない」にする # 実行プロセスのルール(すべて厳守する) - 情報ソースとして渡したB切片のすべてを漏れなくグループ化する - 複数のテーマに当てはまるB切片については、複数グループへの分類する - 抽象化と具象化を繰り返し、より深い洞察を導き出す - グループタイトルの抽象度を低くする - デザイナーが持つ働き方に関するニーズや課題に焦点に、それらの背景を理解できるよう、最大限に具体的な情報を含むグループタイトルにする - 内容量が多くなる場合でも、全てのB切片をグループ化する - グループの個数は最大3個までとする # 成果物の生成 グループ化の対象となるB切片を全てリストアップする。最終的なグループ化リストを明解で理解しやすい形で提供する。これには各グループの名称とそれに含まれるB切片のリストが含まれる。 # 成果物のフォーマット """ ## グループ1: 「Why, What, How, Want」構文のタイトル 言語化したストーリー - B切片 - B切片 ## グループ2: 「Why, What, How, Want」構文のタイトル 言語化したストーリー - B切片 - B切片 ## グループ3: 「Why, What, How, Want」構文のタイトル 言語化したストーリー - B切片 - B切片 ## 全体を通してのコメント """ 目的を達成するためのステップと、実行プロセスのルールを厳守してプロセスを実行し、成果物を生成すること。
最後まで読んでいただきありがとうございました。Goodpatchの探索型リサーチに興味を持っていただいた方に向け、並走型探索リサーチプロジェクト「Insight Research」の資料や、問い合わせ窓口もご用意しております。お気軽にご連絡いただければ幸いです。
執筆者紹介: