2026.04.21
- TOPICS
- 学生の活躍
自然言語処理の応用による商品共起データのクラスタリング:Item2vec を用いたスパー ス性と鎖効果への対応
データサイエンス研究科 博士前期課程2年(上田研究室)の村本遥香さんは、卒業論文・修士論文を通じて統計学の手法を用いた研究に励む傍ら、自身の専門性を広げるべく機械学習の手法を用いた研究にも着手し、その研究成果が「マーケティング・サイエンス」誌に掲載されました。
筆頭著者
データサイエンス研究科 博士前期課程2年
村本 遥香さん
指導教員
データサイエンス学部 データサイエンス学科
上田 雅夫教授
論文タイトル
自然言語処理の応用による商品共起データのクラスタリング:Item2vec を用いたスパース性と鎖効果への対応
掲載雑誌
マーケティング・サイエンス
DOI:https://doi.org/10.11295/marketingscience.202506
データサイエンス研究科 博士前期課程2年
村本 遥香さん
指導教員
データサイエンス学部 データサイエンス学科
上田 雅夫教授
論文タイトル
自然言語処理の応用による商品共起データのクラスタリング:Item2vec を用いたスパース性と鎖効果への対応
掲載雑誌
マーケティング・サイエンス
DOI:https://doi.org/10.11295/marketingscience.202506
今回の研究内容について村本さんに解説していただきました。
本研究では、マーケティング分野に自然言語処理のEmbedding手法(Item2vec)を応用し、商品の共起データをベクトル化して階層クラスター分析を行ったことで、従来手法と比較してクラスタリングの問題点が改善され、商品分類の内容と効率性が向上したことを示しました。
分析対象データは、食品スーパーのID付きPOSデータであり、カテゴリー内のメーカー数から、ドレッシング、カレールー、ソースの3カテゴリーを分析対象といたしました。分析の結果、提案手法において、クラスター内に含まれる商品が極端に少ないことはなく、また鎖効果*1も見られませんでした。さらに、各クラスターは容量、価格、メーカー、点数シェアなどにより明確に分類されたことが確認されました。
本研究の成果は、実務面では棚割り提案の効率化の促進であり、学術的には自然言語処理とマーケティング・サイエンスの橋渡しに貢献ができる点だと考えられます。
本研究では、マーケティング分野に自然言語処理のEmbedding手法(Item2vec)を応用し、商品の共起データをベクトル化して階層クラスター分析を行ったことで、従来手法と比較してクラスタリングの問題点が改善され、商品分類の内容と効率性が向上したことを示しました。
分析対象データは、食品スーパーのID付きPOSデータであり、カテゴリー内のメーカー数から、ドレッシング、カレールー、ソースの3カテゴリーを分析対象といたしました。分析の結果、提案手法において、クラスター内に含まれる商品が極端に少ないことはなく、また鎖効果*1も見られませんでした。さらに、各クラスターは容量、価格、メーカー、点数シェアなどにより明確に分類されたことが確認されました。
本研究の成果は、実務面では棚割り提案の効率化の促進であり、学術的には自然言語処理とマーケティング・サイエンスの橋渡しに貢献ができる点だと考えられます。
村本さんのコメント
この度は、これまで取り組んできた研究に対して評価をいただくことができ、学会誌への掲載に至りましたことを大変光栄に思います。研究指導をしていただいた上田先生をはじめ、本研究に携わっていただいた皆様に、心より御礼申し上げます。
学会誌への投稿は初めての試みであり、苦戦することもございましたが、皆様からのご助言や査読プロセスを通して、自身の研究をじっくりと見つめ直せる、非常に有意義な機会となりました。今後もデータサイエンス領域、特にマーケティング分野の発展に貢献できるよう努めてまいります。
指導教員 上田 雅夫教授のコメント
カテゴリー・マネジメント、リテール・サポートにおいて、市場構造を分析する際、共起構造のデータから期間併買行列を作成し、作成したデータを階層クラスター分析で処理する方法がよく使用されています。この方法は明確な市場構造を得るには、試行錯誤を経る必要があり、分析の現場では手間がかかるという問題がありました。本研究では、購買データにおける商品の共起構造が、文章における共起構造と同じであることに着目し、embeddingという自然言語処理の方法でデータを処理することで、既存の手法の課題を解決しました。この研究は、実務で広く使用されている手法の改善点を示しただけではなく、embeddingのアルゴリズムが、ID付きPOSデータの処理に利用できることを示し、自然言語処理とマーケティング・サイエンスとの橋渡し的な研究で、大変意味があるものです。なお、この研究は、修論とは異なり、村本さんが自発的に分析し、学会発表した結果を論文化したもので、本人の努力には頭が下がります。
この度は、これまで取り組んできた研究に対して評価をいただくことができ、学会誌への掲載に至りましたことを大変光栄に思います。研究指導をしていただいた上田先生をはじめ、本研究に携わっていただいた皆様に、心より御礼申し上げます。
学会誌への投稿は初めての試みであり、苦戦することもございましたが、皆様からのご助言や査読プロセスを通して、自身の研究をじっくりと見つめ直せる、非常に有意義な機会となりました。今後もデータサイエンス領域、特にマーケティング分野の発展に貢献できるよう努めてまいります。
指導教員 上田 雅夫教授のコメント
カテゴリー・マネジメント、リテール・サポートにおいて、市場構造を分析する際、共起構造のデータから期間併買行列を作成し、作成したデータを階層クラスター分析で処理する方法がよく使用されています。この方法は明確な市場構造を得るには、試行錯誤を経る必要があり、分析の現場では手間がかかるという問題がありました。本研究では、購買データにおける商品の共起構造が、文章における共起構造と同じであることに着目し、embeddingという自然言語処理の方法でデータを処理することで、既存の手法の課題を解決しました。この研究は、実務で広く使用されている手法の改善点を示しただけではなく、embeddingのアルゴリズムが、ID付きPOSデータの処理に利用できることを示し、自然言語処理とマーケティング・サイエンスとの橋渡し的な研究で、大変意味があるものです。なお、この研究は、修論とは異なり、村本さんが自発的に分析し、学会発表した結果を論文化したもので、本人の努力には頭が下がります。
用語説明
*1 鎖効果とは、ある一つのクラスターに、残りの対象が順に一つずつ結合されてクラスターが形成されていく現象である。
*1 鎖効果とは、ある一つのクラスターに、残りの対象が順に一つずつ結合されてクラスターが形成されていく現象である。
