IBM 現場SEのITな日々

IBM現場SEが日々駆使している技術、現場SEの経験・知見を綴るブログです

(山賀) RPAとAI(機械学習)について最近思ったこと

 

壮大なタイトルをつけてみました。

最近OJTでRPA(Blue Prism)を用いた地震速報情報通知システムを開発しています。そこで、それを通して調べたことや思ったことについて少しだけ書いてみようと思います。

また、私は大学院生の時、金融市場の研究をしていました。RPAを用いてクローラー(ウェブ上の文書や画像などを周期的に取得し、自動的にデータベース化するプログラム)を作成すれば、こんなことができるのでは?と株式市場に対する機械学習の応用例に関する論文を読んで思ったことがあるので、それについても書いてみます。

 

① そもそもRPAとAIの違いとは?

インターネットで調べてみると、以下のような内容が多いでしょうか。

・RPA〜人間が行うデスクトップ画面上の操作を、ルールに基づいて自動的に再現する技術
・AI(機械学習)〜学習・推論・認識・判断などの人間の知能を持たせたコンピューターシステム

自分で触れてみて、違いとして挙げられるのはRPAは完全に指示したことで動く(Excelを開くとかWeb上のこのページの情報を取ってくるとか)。機械学習は入力に対する出力を学習させて、自分自身で判断させるようにする(犬の画像を見せて、その特徴を覚え、犬の画像という入力が来たらこれは犬だ!と判断させるとか。)ということでしょうか。RPAは定型作業を、機械学習は非定型作業を行わせることができる(可能性がある)というのが大まかな世の中で通っている認識と言えそうです。

 

 

② RPAの実際の社会での応用例

Web上に出ている資料を読むと以下のような事例がすでにあるそうです。

・経費チェックロボット

経費申請額の妥当性をウェブで調査、相場より高価な申請はアラート通知。

・航空券価格自動修正ロボット

競合会社と自社の航空券価格を比較、自社価格が常に低価格となるように自動修正。

・外貨積立金学目標到達監視ロボット

外貨建積立金額が目標値に到達した瞬間に、低リスクの円建積立に自動変更する保険商品を開発。

・WEBシステム負荷テストロボット 

システムへの大量同時アクセスを行い、システムの負荷耐性やレスポンス速度を測定。

 

 

適用できそうな部分の共通点として挙げられそうなのは以下の内容でしょうか

・チェック業務(領収書の照合、物品購入額の妥当性調査など)
機械的反復作業(Webサイトの巡回情報収集、サイト登録者への自動メール送信など)
・複数システムに跨る業務(受注システムから顧客システムへの登録、誤入力照合など)
・一定の業務ボリュームがあること
・意思決定の介在しないルールベースの定型業務であること(ID作成、アプリ別権限付与など)

 

クローラーのために作られたソフトと言っても過言ではないかもしれません。

 

 

③ RPAと機械学習を用いてTOPIXの動きを予想する仕組みを構築する?

RPAを使わなくてもPythonRubyでもクローラーを作ることはできると思いますが、コンピュータープログラムを書くよりも敷居が低いと思うので、ここではRPAを推しています。あらかじめ。

 

jsai2016:3L3-OS-16a-6 新聞記事の時系列テキスト分析による株式市場の動向予測

著:松井藤五郎、和泉潔 出典:人工知能学会(2016)(アクセス:2017年8月18日)

 

2016年の人工知能学会で発表された論文です。個人的にとても面白かったので、ご紹介させていただきます。

 

簡単にまとめると、

①まず日経新聞のデータを用意します。

②テキストから言葉を抽出します。形態素解析と呼ばれる手法を用いて、「経済」とか「アメリカ」といった言葉を分割して抽出し、結合する。

③毎日、新聞の言葉の見出しの部分の差分を取る。(例えば、「日本経済」という言葉が2日連続で出ていれば維持、消えていれば消滅、新しく今日出て来ていたら「新出」というようにタグ付けする。これらを特徴語出現パターンと呼ぶ。)

④選択されたX個の特徴語出現パターンP1..xを出現の時は1、そうでないときは0として特徴量ベクトルとして入力する。また出力は予測対象日の日中の利益率が正ならば+1、負ならば-1としてSVM(サポートベクトルマシンと呼ばれるパターン認識手法)を用いて学習させる。

TOPIX連動型投資信託(ETF)の寄りから引けまでの動きが、上がるか下がるかを予想する。

 

 単純作業(日経電子版の情報を毎日抜き出して、エクセルに入れるとか)はRPA、SVM形態素解析等はPythonを使えば構築できそうです。(誰かやってみてください)

 

結果、予想的中率は一番高い年で71.4%、最も低い年で56.3%だそうです。「え、大したことないじゃん」と思われるかもしれませんが、6年間の累積運用成績では200倍強になるようです。効率的市場仮説とは一体なんだったのか。こういったものは、市場参加者が何を考えてトレードしてるかといった定性的な発想も大事なのかもしれませんね。

 

④ まとめ

これからはRPAのように、毎日日経新聞の見出しを自動的に取ってくるといった単純作業をコンピュータプログラムを書くよりもはるかに簡単にできて、Watsonのような分析ツールを用いれば上記のような予測をすることがかなり手軽にできる時代になっていくのだと思います。(もうなっている?)

なので、そういったツールを使いこなせるかどうかは、これからの時代はエンジニアに限らずとても大事なことになっていくだろうな、とRPAを使いながら感じました。

 

 

 

この記事の執筆者:山賀