プロジェクト概要
AI技術を用いて、分析結果よりそれが何の物質であるかを特定するアルゴリズム(算出方法)を自動で作成する処理の開発を行っています。
島津製作所の分析装置は高性能で精度が高く、微小な化合物も分析することができます。その分析結果から何の物質であるか答えを出さなければなりません。答えを出すためには物質ごとに専用のアルゴリズムが必要になりますが、新しい物質を判定するためのアルゴリズム作成には、専門的な知識と経験が必要で、時間と労力を費やしていました。このプロジェクトではAI技術を用いて、専門的な知識がない人でも、独自のアルゴリズムを自動で作成する処理の開発をしています。
プロジェクトを通して
学んだこと
機械学習には大量のデータが必要です。「データの可視化の大切さと見せ方」について学びました。アルゴリズムの構築においては、間違ったデータを少しでも学習させた場合、出来上がったアルゴリズム の品質は劣化します。今回のデータの中にも測定に失敗したデータが含まれていましたが、一つ一つデータを確認して取捨選択するには、データ量が膨大であるため不可能です。そこで、データの表示方法を工夫し、大量のデータを1つの画面上で確認できるにようにしました。これによって、測定に失敗したデータには特定の特徴があることが分かり、それをもとに測定が失敗したのかを判定するアルゴリズムを作り上げることが出来ました。また、実験データの可視化方法を工夫することで、説得力のある実験の報告ができ、アルゴリズムを構築する上で有効な議論ができるようになりました。
良いものを作りたいという思いがあったからこそ、メンバーと共感できる開発が出来ると感じました。
プロジェクトを経験して
成長したこと
プロジェクトが始まる前は、Pythonと機械学習の経験が少なかったので少し不安を感じていました。そのためPythonの基礎からプログラミング方法やライブラリの使い方などの勉強に取組みました。
最初はニューラルネットワークの仕組みや、学習モデル層の違いなど理解に苦しみましたが、先輩からの技術指導を受け、アルゴリズムのモデル設計の経験を積み重ね、理解が深まっていきました。
今では後輩にもPythonについてレクチャーできるようになり成長したと実感しています。
また、プロジェクトの傍ら、機械学習で必要となるディープラーニング検定試験にも合格し、さらに機械学習への理解が深まっていると感じています。
このプロジェクトが完成したらどうなりますか?
一部の人間しか使えなかった
分析器が、
より多くの人に
使用可能に
今までのような、測定データの類似度により物質の種類を調べる方法では、性質が似ている物質では差を見出す事が難しく、適用できませんでした。しかし、AIを使い測定データの微細な特徴を学習することにより、人間では判断できない精度の高い判別ができ、専門的な知識を有していない研究者の方でも、新しい物質の判定などが可能となります。このように、従来では一部の人間しか使えなかった分析装置だったのが、多くの人が使用できるようになり、新しい発見を促す一助になれると思いアルゴリズムの開発に臨んでいます。
挫折しかけたこと
今まで経験したソフトウェア開発は、世の中の誰かがすでに実現している、もしくは時間をかければ実現できる場合がほとんどでした。しかし、今回のようなAI技術を用いた開発プロジェクトでは必ずしもそうではありません。常に実現不可能な問題である可能性が付きまとっています。そのため、何か問題があった場合には、現在の方法を諦めて全く別のアプローチを試すのか、現在の手法のままデータを見直すのか、お客様の目的を再確認し新しいアプローチを提案するなどいろいろな選択肢からベストアンサーを引き出し先に進むことになります。そういう意味では、かなり研究分野に近い開発を行っていると日々実感しており、普段のソフトウェア開発とは違ったやりがいを感じています。