AIはナレッジ共有を促進する未来のカギ。大切なのは学習データ。
Column
— ナレッジ活用コラム —
AIはナレッジ共有を促進する未来のカギ。大切なのは学習データ。
みなさんこんにちは。倉本です。
最近、訪問先で頻繁に「うちの会社もAIで何かやれないのか、と上から言われていまして…」と言う話を耳にします。AIで何かやれ?犬と猫の顔でも判別できるようにしましょうか?と言う訳にもいかないので、お客様もいろいろと頭をひねっていらっしゃいます。
当然、犬と猫の顔ではないにせよ、いろいろな業務に対してAIを適用できないかと考える時に必要になってくるのが学習データです。教師データなんて呼び方もしますよね。
学習データとは簡単に言ってしまうと、AIが何かをできるようになるための情報の事。生まれたてのAIは何も学習していないためそのままでは何もできません。例えば、例題と答えをたくさん学習するからこそ、未知の問題が来たときにもAIが答えを出せるようになる。
まさに人間が過去の経験(ナレッジ)から「この場合はこうなるのでは」と判断できると言う事と同じようなイメージに見えます。
ナレッジマネジメントに悩んでいる皆様の企業であれば、ウチの会社だったら○○のデータがたくさんあるな、××の件だったら膨大に蓄積しているな。ではそれをAIに学習させて。。。と思われると思いますが。
それって本当に全部学習させてしまって大丈夫でしょうか。
中にはこれは特例だな。そもそもこれって間違えていない?そんなデータも入っていたりしないでしょうか。そういった物を間引くとなると、膨大だと思っていた数が減っていったり、そもそも間引く時間が。。。
取り組もうとする内容にもよりますが、場合によっては膨大な量と質の学習データが求めらます。どのくらいのデータ量が求められるのか、学習したAIに何かをさせた結果にどのくらいの精度を求めるのか、これは取り組みを行う企業様が自分たちの責任で、ある程度の認識を持っていなければいけません。
冒頭にも出てきた犬と猫の顔を判別するという程度であれば、大量の学習データは必要無いかと思いますが、「企業における重要な何かの判断を支援する」場合にはどうでしょうか。
じゃあ企業の学習データを揃えなければ、企業でAIは使えないのかと言うとそうではない部分もあります。そのあたりの話はまた今度にでも。
See you
※ 本記事は、当社が運営していたオウンドメディア「ナレ活」記事のアーカイブです。(2018年9月26日掲載分)