特定分野のスタートアップ企業を簡単に一覧する方法

目まぐるしい技術革新の中、開発担当者は、少しでもはやくイノベーションに近づきたいと思うでしょう。自社開発もひとつの手ですが、とくに新しい分野においては、スタートアップと手を組むのも有効な手段のひとつではないでしょうか。

スタートアップの情報を入手するには、有料のデータベースや金融機関からの紹介など、いくつか考えられますが、いずれも何らかのフィルターがかかっていると思われます。そこで、少なくとも自社の周辺領域(分野)については、独自にスタートアップの情報を収集し一覧したいと思うでしょう。

今回は、特定分野のスタートアップの情報を、簡単に収集する方法についてご紹介します。

スタートアップ企業を一覧する方法

Google ニュースを使って、特定分野の記事を収集し、そこから企業名を抽出します。なぜGoogle ニュースを使うのかは、やはり情報の鮮度、また、多様なソースが集約されていること、さらに、検索式しだいでは、特定分野に的を絞れること、などがあげられます。

問題はその数です。何万件もの情報に全て目を通し、それらしい企業名を抜き出すのは容易では有りません。そこで、テキストマイニングを使います。膨大なテキスト情報をバラバラにして、企業名だけをふるいにかけます。完全に企業名だけを残すのは難しいですが、それでも手作業で行うよりは、はるかに効率的です。

この手法のポイントは3つあります。1.適切な検索式、2.Google ニュースのテキスト情報の取り込み、3.テキストマイニングで企業名を残す設定、以下順に解説していきます。

AI関連のスタートアップ探索

今回は、Google ニュースにて、”スタートアップ”と”AI”のAND検索をかけました。かなりダイレクトな検索式ですが、例えば、”(ベンチャー OR スタートアップ)”と”AI”のAND検索でもいいですし、さらに”資金調達”で絞ってもよいと思います。スタートアップ企業が多く登場するキーワード、検索式を選択してください。

次に、テキストマイニングをかけるために、Google ニュースの検索結果をExcelに取り込みました。今回は弊社の情報分析ツール「Quark Apps」のCrawler機能を使いましたが、Google Alertで自動収集した情報をExcelで読み込んでも構いません。これについては、過去の記事をご参照ください。今回は実験のため、上位100件を対象にしていますが、処理のほとんどはツールが行いますので、数千件、数万件でも労力は大きく変わりません。

取り込んだテキスト情報にテキストマイニングをかけます。今回は実験のため、記事の「タイトル」に対して処理しました。本番では、「要約」に対して処理した方が企業名が取りやすいかもしれません。こちらも弊社ツール「Quark Apps」のテキストマイニング機能を使っていますが、重要なのは、品詞で細かくフィルタできる、かつ、ストップワードの設定ができるツールが良いと思います。今回、企業名を抽出したいので、名詞のみを対象とし、動詞や形容詞や副詞は対象から外します。さらに名詞の中でも、代名詞、サ変接続、形容動詞語幹などを除外します。テキストマイニングをまわして、うまく除外されていないワードがあれば、個別にストップワードへ登録し、除外していきます。

Quark Apps – Text Mining Jの設定画面

このようにして抽出したワードを、頻度解析したものが以下になります。ここで、株式会社を黄色で強調していますが、この前後にあるワードがスタートアップの企業名と思われます。10社以上が確認できます。「株式会社」が付いていませんが、企業名と思われるものもあります。

Quark Apps – Tag Cloud表示

上記マップは、弊社ツール「Quark Apps」のTag Cloudという機能で表示していますが、名前をクリックすると、Googleの検索結果へ遷移します。各企業をクリックし、AI関連のスタートアップと確認できた企業10社をリストします。

株式会社バカン
株式会社ELYZA
株式会社KiZUKAI
株式会社Tsunagu
株式会社レボーン
株式会社ヘッドウォータース
ポート株式会社
株式会社VAAK
株式会社シナモン
Symmetry Dimensions Inc.

経済産業省が推進するスタートアップ企業の育成支援プログラム「J-Startup」では、AI関連企業が17社掲載されていますが、上記は該当しません。つまり、それほど目立った動きをしていない企業でも、網にかけられる可能性があるということです。

多様な情報ソースを扱える方が有利

上場企業の一覧は誰でも簡単に入手できます。しかしながら、スタートアップの一覧、とくに特定分野におけるスタートアップ一覧は、イノベーションを加速する上で、とても価値のあるものになるでしょう。もちろん、情報を入手する方法は他にもあるでしょう。有料データベースや金融機関、あるいは特許情報などでも可能かもしれません。

例えば特許情報なら、その企業が有望かどうか、技術力を見ることで判断も可能です。しかしながら、特許情報は、公開されるまでに1年半のタイムラグがあってイノベーションにとって致命的です。あるいは特許自体を出していなければ、その企業を見つけようがありません。

情報分析では、多様な情報ソースを扱える方が有利です。なぜなら、多角的な分析ができるからです。スタートアップを調べるのに、1年半もタイムラグがあってはダメなのです。もう解散してしまっているかもしれませんから。。イノベーションが目的なら、情報の鮮度、スピードという観点において、ニュース記事はまずおさえておきたい情報ソースの一つでしょう。

今回の分析は、情報分析ツール「Quark Apps」を使っています。Quark Appsは、情報の自動収集、前処理、ビジュアル化、機械学習(AI)をExcelから操作できるようにした、Quarkオリジナルのパッケージです。