患者のプライバシー優先がビッグデータ普及の鍵

2021年12月16日 AsianScientist

ビッグデータと機密性の高いプライバシーが密接に相関することはあまりないが、医療テクノロジー設計の時にプライバシーを考慮すれば、ビッグデータが幅広く採用されるための鍵となろう。

AsianScientist - 新型コロナウイルス感染症(COVID-19)が世界中で急激に拡大した2020年後半、世界中で50万件以上の新規感染が連日報告された。感染の波が何度も押し寄せ、医療の最前線は飲み込まれそうになった。病院は一年中満床、酸素供給は不足という悪夢が崩壊寸前の医療システムを物語っていた。

病院がパンデミックとの戦いの場になったことから、患者と医師は、負担の一部を物理的な医療現場から移動させるために、遠隔医療相談などといったデジタル医療システムに注目した。電子医療記録を患者データを分析する人工知能 (AI) プログラムと組み合わせることで、臨床医は病気の診断を自動化し、予後を予測し、適切な医療サービスを提供することが可能になった。

このようなデータ主導型技術は明らかに医療プロセスを強化するが、プライバシーに対する懸念は残り、個人情報の保護の確保という大きな問題が持ち上がる。

ビッグデータの恩恵と悩み

精度と適応性を向上させた強力なAIテクノロジーは、医療に革命をもたらした。大量のデータを迅速に精査し、熟練医師も見逃した情報を抽出できるかもしれない。

しかし、ビッグデータ・アプリケーションは膨大な量の臨床データを分析できる場合に最もうまく機能する。たとえば、コンピューター断層撮影 (CT)による 胸部スキャンから肺疾患を検出するようAIモデルをトレーニングするには、何千もの検査画像を見せ、健常な画像と疾患のある画像が基本的にどのように見えるかを学ばせる必要がある。データはこのようなテクノロジーで広く利用されているかもしれないが、その分析力がすべて活用されているわけではない。

データプライバシーに関する懸念は消えないため、処理できるデータの量と種類が制限される傾向がある。Netflixのレコメンドシステムや友人が述べたばかりの製品についてカスタマイズされたFacebook広告など、個人的な好みがすでに頻繁にコンテンツ作成のために使用されていることを考えていただきたい。このようなことは今では当たり前のこととなっているが、機械があなたのことを知り尽くしているような感じがして、不気味なことには変わりはない。

医療データは、気候パターンや経済動向などといった他の種類のデータよりも特に機密性が高く、多くの人が秘密にしておきたいと思う個人情報を含んでいる。 十分に確立されたデータ共有規制がなければ、テクノロジーは侵入的で有害となり得る方法で使用され、情報の流れを支配する者たちに力が偏向するという真の危険となる。

プライバシーを最優先

COVID-19パンデミックの規模と範囲は大きい。その蔓延と戦い、悲惨な影響を軽減するために、医療ビッグデータ・アプリケーションの必要性が注目された。現在、AIを使用する医療テクノロジーには、患者のプライバシーを保護できる手段が組み込まれた設計がなされている。

今日のアジアの研究者らはプライバシー保護技術を開発しており、データセキュリティと精密解析との間によく見られるトレードオフを克服しようとしている。たとえば、香港中文大学 (CUHK) のチームは最近、使用した臨床データを明示的に共有することなく胸部CTスキャンからCOVID-19を診断できる高精度のAIモデルを構築した。

「COVID-19パンデミックは急速に広がる中、国家間はもとより、施設間でも複雑なデータ共有契約を結ぶ時間はありませんでした」と筆頭執筆者であるCUHKコンピュータ科学工学部のドウ・チー (Dou Qi) 助教授は振り返る。

データプライバシーを保護しつつ臨床状態をさらに理解する方法として、研究者らは、機械学習の手法の一つ、連合学習 (FL) システムを使用した。このシステムでは、トレーニングと分析プロセスが別々のデータベースに分散される。この分散型フレームワークでは、機密性の高い患者データは参加している各病院のローカルモデルに安全に保管される。他人がアクセスできる大きなネットワークにデータが供給されることはない。

次に、AIは入力データを使用して、最も効率的に分析を行える規則を学習する。デルに新しい情報が入る毎に、その規則またはパラメーターは微調整される。各ローカルモデルはこれらのパラメータを送信するが、臨床データをグローバルサーバに送信することはしない。これは内部を描くことなく建物の輪郭をスケッチするのと似ている。ローカルモデルは更新されFLネットワーク全体で他のローカルモデルを含んだ最適化が行われる。

「FLプロセスは、グローバルモデルを集約するために、各ローカルデータセットから最適化されたモデルパラメータを共有するだけで済みます。この特性があるため、学習プロセス全体を通じて患者の生データを地元の病院から移動させずに済み、患者のプライバシーを効果的に保護できます」とドウ助教授。

ローカルモデルは独立して操作可能であるため、FLシステムを国際的な設定に簡単に適用できた。このモデルでは、香港、中国、ドイツの医療機関で撮影された胸部スキャン画像から、放射線科医と同等の精度で肺損傷を検出することができた。さらに、診断ははるかに速く行われた。臨床医が完了するのに最大10分かかる評価プロセスを、すべてわずか40ミリ秒で完了した。

使用するスキャン機器やイメージングプロトコルは様々であり、データ形式には違いがあったにもかかわらず、性能は効率性が高く一貫性を保っていた。

FLの技術は多様なデータセットをキャプチャすることにより、ローカル、地域、グローバル規模で効果的なコラボレーションを可能にし、モデルの堅牢性を高め、より多くのユースケースの汎用性を高めた。このようにして、FLは患者のプライバシーを保護するだけでなく、モデルの分析機能も向上させた。

「プライバシーを保護する機械学習は、このような状況で重要な成功要因として機能します。デジタル医療技術の取り組みをまとめ、タイムリーな患者ケアのために信頼できる臨床支援を提供してくれます」とドウ助教授は述べた。

侵入せずに追跡

COVID-19との戦いでは、FLの他にテクノロジー主導による介入を行うことができるが、利点を最大限にするためには、やはり大量のデータを必要とする。けれど、それらは例えば居場所や日常の活動など潜在的に機密性の高い情報である。同時に、パンデミックの中でデータ共有を遮断するとテクノロジーの有効性が低下されるかもしれないという懸念もある。アジアの研究者と政府はこれら相反する問題を念頭に置き、効率性と機密性の両方が保たれる中間点を模索した。

台湾ではCOVID-19対策として、当局が通信会社と提携して、全地球測位システム (GPS) 技術よりも侵害性の低い電子フェンスシステムと呼ばれる検疫監視プログラムを実施した。このシステムは、携帯電話の信号を検出して隔離患者の位置を特定し、その位置を近くの基地局に送る。

このシステムは、正確な動きの追跡についてはGPSよりも精度が低いが、自宅や指定隔離場所から離れた隔離患者を認識するのに十分な情報を提供する。違反者に対し、プロトコルに従うよう自動テキストメッセージを送信するとともに、関連当局にも通報する。

ユーザーのプライバシーを保護するために、詳細データにアクセスできるのは当局の中央流行疫情指揮センターのみである。セキュリティ担当者など最前線にいるスタッフは、市または郡の情報だけを閲覧できる。

日本の連絡先追跡アプリは、ユーザー同士が濃厚接触した際にブルートゥース信号を交換するので、GPSの追跡を必要としない。

一元的にデータを収集することはなく、情報はランダムに生成されたコードとして各モバイルデバイスに安全に保存され、電話番号や名前などといった他の個人情報を抽出することはできない。これらの連絡先のいずれかが検査でウイルス陽性反応が出た場合、濃厚接触の通知が送信され、ユーザーは自分自身と周囲の人々を守ることができる。

匿名性があることに加え、アプリは必須義務ではない。また、インストール時だけでなく、感染状況などの機密データを記録するときにも明示的な承認が必要である。

同意が重要視されているため、人々はデータの使用方法を管理できる。このアプリは、正しい方向に向けてデータセキュリティ関連の倫理的問題を解決する一歩である。より多くの人々に対しプログラムに参加するよう奨励し、COVID-19の蔓延を抑えることができるかもしれない。

プライバシーから参加へ

計算効率は別として、プライバシー保護技術が進化すれば、ビッグデータ医療アプリケーションがさらに多く採用されるであろう。責任あるデータの使用と機密情報のセキュリティが確保されれば、このようなイノベーションは、医療現場の高度デジタル化に対する懸念を和らげることができる。

「AIが患者のプライバシーを保護し、一般化されたときに実際に信頼できるものであれば、世界中のスマートホスピタルと医療システムに革命を起こす大きな可能性があります」とドウ助教授は述べた。

ユーザーが不安を抱くことがなければ、人間とテクノロジーとの間には信頼という基盤ができるであろう。ますます多くの人々が新しいテクノロジーを使い、満足するようになれば、医療イノベーションは非常に効果的になり、多くのデータを取得し、システムは最適化され結果は一層よいものとなろう。

効率性とデータセキュリティの両方を提供することで、デジタル医療が現実のものとなる。多くのコミュニティがアクセス可能となり、恩恵を受け、最終的には力を得ることができる。

上へ戻る