AI最前線の現場から【Stripe】オンライン決済における不正使用の性質とその被害

この連載が書籍になりました！『エンジニアのためのAI入門』

システム開発

技術解説

連載 :

ディープラーニング・人工知能最前線

2017年4月6日(木)

マイケル・マナパット

はじめに

Stripeの製品は何十万ものeコマース企業、SaaS事業、オンデマンドマーケットプレイス、非営利団体および各種プラットフォームのオンライン事業で使われています。オンライン決済における大きな問題の1つに不正使用があります（残念ながら頻繁に発生しています）。対面で決済するビジネスと比べ、インターネット上の決済は不正な購入に対して脆弱になりがちです。とは言え、オンラインビジネス事業者が不正使用に長けている訳ではありません。その結果として多くの企業が不正使用を分析する専用のチームを構え、システム開発を余儀なくされています。そこでStripeでは、不正使用の検出および防止に向けた一連のツール群「Stripe Radar」（以下、Radar）を開発しました。

本連載では、Radarの原動力である機械学習について詳細を説明し、不正使用を検出するシステムの効率性やパフォーマンスに関するStripeの取り組みを紹介します。

今回は、オンラインにおける不正使用の性質とその被害について解説したいと思います。

クレジット決済と不正使用

初歩的なオンラインの不正決済は、他人のクレジットカード番号を盗んで利用するというものです。不正使用を行う人物は高価な商品（時計など）を10万円で購入し、オークションサイトなどで2万円程度で転売するかもしれません。本当のカード保有者は後になって不正な決済を発見し、カード会社にクレームや不審請求の申請を起こすでしょう。これを「チャージバック」と言います。なお、クレームにも様々ありますが、本連載では不正使用を事由として争われる「決済」を取り上げます。

「取引が不正であった」と認定された場合、カードの保有者は保護されますが、事業者は不正使用によって発生した費用に責任を負います。この費用には販売された商品の代金だけでなく（事業者が時計の仕入れにいくらかかったかにも関わりなく）、クレームに費やされた追加手数料なども含まれるため、標的になった事業は財政的にも大きく影響します。

不正使用が事業に与える影響は「偽陰性」（不審請求の申請発生以前に防げなかった、特定できなかった不正使用）のみに限りません。「偽陽性」（正当な取引を不正使用検出システムが不正使用と判断してブロックした）の費用も高いのです。買い物をしようとして取引がブロックされてしまったら、事業は利益面および評判の面でも悪影響を受けます。

詳細は後述しますが、偽陰性と偽陽性はトレードオフの関係にあり、前者を減らすためには後者の増加を受け入れる必要があります（逆もしかり）。偽陰性は一定の費用を発生させますが（販売された商品の費用やクレーム対応費用など）、偽陽性も同じです（販売されていたら生じるマージン）。マージンが小さい事業では偽陰性は高く付きますが、偽陽性はそれほどでもありません。そのため、潜在的な不正使用の防止を目指す場合は、偽陽性の増加に繋がるとしても大きく網を張ろうとします。マージンが大きい事業ではその逆です。

なお、このトレードオフは事業側で自由に設定できるものではないことを押さえておく必要があります。不正使用率が1%を超えると、VisaやMastercardなどはネットワーク決済自体をできなくするかもしれません。この不正使用率の厳密な定義や深刻な措置がとられるかどうかはカード会社によって異なります。大事なのは、不正使用率が1%に満たない時点では事業側で自らのバランス感覚で不正使用とのトレードオフを行うしかないということです。もし1度でも1%を超えてしまうようなことがあれば、あらゆる手立てで不正使用率を下げるほかありません。たとえそれが経済合理性のない偽陽性率になったとしてもです。そうしなければ、「決済手段の喪失」という事業存続に関わるリスクを負うことになります。

RadarとStripeネットワーク

Radarの根幹にあるのは「適応型機械学習」で、Stripeの機械学習チームにおける長年のデータサイエンスやインフラ研究の成果によるものです。Radarのアルゴリズムはすべての取引に対する不正使用リスクを評価し、適切に措置します。デフォルトでは高リスクの決済はブロックされますが、ユーザが具体的に設定できるようになっています。

一般的に、不正使用を防止するサービスは事前または継続的に費用が発生します。まず、利用者側では決済データなどを送信し、査定情報を処理するための開発が必要です。さらに機械学習により「不正使用かもしれない」と判断された取引については、数週間かけて本当に決済が不正かを判断（ラベリング）しなければなりません。そしてようやく不正使用検出システムが効果を発揮できるようになるのです。しかし、不正使用のパターンは常に変化するため、継続的にラベリングしていかなければなりません。RadarはStripeの決済フローから直接情報を受け取りながら、カードネットワークおよびカード発行会社から取得したデータを活用しています。

Radarの利点は2つあります。1つはRadarはStripeに統合されているため、Stripeを採用する10万を超える事業すべてから得た不正使用関連データを用いて常にシステムを改善している点です（データ収集は自動で行う）。1件のカード決済から読み取れるデータにはカード発行国、決済したIPアドレス、メールアドレスのドメインなどがあります。これらは不正な決済を予測する上で重要なデータですが、最も予測に関連するのは行動データです。例えば、1枚のカードが最近どれだけ多くの国で利用されたかは不正使用を突き止める上で重要な指標になります。

Radarは数十万におよぶStripeユーザ全体のクレジットカード決済を分析し、行動データベースを構築します。Stripeを導入しているある事業者にとっては初めて利用されるカードでも、Stripeネットワーク上ですでに使われている確率は80%にもなります。過去にカードが使われていれば、リスク査定として十分なデータが確保できます。

もう1つは、Radarがクレームや不審請求などの情報を銀行やカード会社などの金融パートナーから受け取っているため、利用者側での継続的なラベリングが不要な点です。ラベリングは人海戦術で行われますが、その過程でラベリングする人によってバイアスがかかります。分析者が甘かったり厳しかったりすると、不正使用検出システムのパフォーマンスにも影響を及ぼす可能性があります。Radarはカード発行者から取得した網羅的かつ正式なクレームおよび不審請求情報に基づいて正確な不正使用情報を学習し、導入初日から機械学習による不正防止機能が使えるようになるのです。

今回は、オンラインにおける不正使用の性質とその被害について解説しました。次回からは、Radarの原動力である機械学習の基礎と、Stripeでどのように機械学習が活用されているのか、その利用形態についてさらに詳しく紹介していきます。


Think IT 編集部　編価格：2,200円＋税発売日：2017年7月7日発売 ISBN：978-4-295-00154-6 発行：インプレス	エンジニアのためのAI入門この特集が書籍になりました！本書は、インプレスの“オープンソース技術の実践活用メディア"Think ITの特集記事「ディープラーニング・人工知能最前線」の内容をまとめ、加筆して書籍化したものです。これから業務としてディープラーニングやAIに携わる必要(可能性)がある技術者に向けて、基礎知識から様々な業種の利用事例、ディープラーニング・人工知能の最前線で活躍する技術者の紹介など、1冊で幅広く網羅した書籍となっています。

Think IT 編集部　編
価格：2,200円＋税
発売日：2017年7月7日発売
ISBN：978-4-295-00154-6
発行：インプレス

エンジニアのためのAI入門

この特集が書籍になりました！

本書は、インプレスの“オープンソース技術の実践活用メディア"Think ITの特集記事「ディープラーニング・人工知能最前線」の内容をまとめ、加筆して書籍化したものです。これから業務としてディープラーニングやAIに携わる必要(可能性)がある技術者に向けて、基礎知識から様々な業種の利用事例、ディープラーニング・人工知能の最前線で活躍する技術者の紹介など、1冊で幅広く網羅した書籍となっています。