「人のつながり分析」で新型コロナの感染追跡【企業のリスクマネジメント】

新型コロナウィルスの感染拡大が止まりません。これから冬をむかえ、さらに拡大することが懸念される中、企業や医療機関、そして学校など、リスク対応に迫られているのではないでしょうか。従業員、患者や医師、先生や生徒、万が一、感染者が出た場合、迅速に適切な行動を取ることが求められるでしょう。できるだけ業務を止めずに、感染を広げなようにするにはどうすればよいか。今回は組織内で感染者が出たことを想定し、リスクマネジメントとしてのデータ分析について、考えてみたいと思います。

新型コロナの感染追跡を行うには

現状では、人の行動を100%追跡することは不可能ですから、まずは感染リスクが高まる場所や環境に注目します。企業なら会議やイベント、医療機関なら診察や治療、学校なら授業や講義といった具合です。データ分析する必要性から、少なくともこれらの行動は、個人名を含め、全て電子的に記録されている必要があります。そうすれば、1つのイベントに複数人の氏名があれば、彼らは感染リスクが高い環境において「つながり」があったことになります。これらの「つながり」をすべて可視化すれば、感染リスクの高い人のネットワーク図が書けます。

そして、このネットワーク図の誰かに感染者がいたとすれば、誰が濃厚接触者か、クラスターはどこか、スーパースプレッダーの存在、逆に非接触者は誰かなど、様々な分析が可能です。これにより、濃厚接触者を待機させるなどの対応をしつつ、非接触者には業務を回してもらうといった、積極的な対応が取れます。

テストデータで分析してみる

それでは実際に、企業内に感染者が出たことを想定して、分析を行ってみましょう。テストデータとして、架空の会議情報のCSVデータを用意しました。このデータには、今年3月から10月までの過去8ヶ月分の会議情報、出席者、開始時間、場所、議題(タイトル)、会議の内容、・・などの情報が含まれています。

テストデータの概要

ここで、仮に感染者が3人出たとしましょう(竈門氏、田中芳氏、田中裕氏)。まず、フィルター機能を使って、(感染発覚から)過去30日分のデータで、かつ3人の名前が含まれている会議情報だけを表示します。次に、WEB会議など、感染リスクのない会議情報を非表示にします。そして、表示されているデータについて集計をかけると、3人と直接接触した人のリストがつくれます。また、3人が利用した会議室も限定できます。このように、感染リスクの高いイベントがデータ化されていれば、濃厚接触者の特定は簡単な作業です。

フィルター後の情報
直接感染者のリスト(灰色は感染者)

しかしながら、非接触者(間接的にも全く接点が無い人)の特定は、少し厄介です。仮に、上記で非表示にしたデータから、名前をリスト化しても、感染者と直接接点は無いにしても、間接的に接点があるかもしれないからです。もし間接的にでも接点があれば、感染リスクはゼロではありません。これを分析するには、人のつながりを全て可視化するしかありません。

先程のデータのうち、WEB会議など感染リスクのない会議情報だけを非表示にして、ネットワーク図を作成します。さらに、つながりが切れているところでクラスタリングします(Connected Component分析)。ここで、感染者3人を含まないクラスターは、非接触者であると特定できます。さらに安全策をとるなら、非接触者のリストを出した上で、感染者3人が利用した会議室を使っていない人たちが、感染リスクが最も低い従業員ということになります。・・業務を回してもらいましょう。

過去30日間の人のつながり
クラスタリング後(赤いノードは感染者)

直接接触でもなく非接触でもない、間接接触者(?)をどうするかですが、少なくともマップ上で追跡することは可能です。感染者3名に対して、1階層追跡した図と、2階層追跡した図を示します(SubGraph分析、赤いNodeに着目)。

マップ上では時間的なファクターは示されていませんが、選択されたNodeの詳細情報を参照すれば、元になった会議情報へアクセスできますので、前向き(Prospective)接触者なのか、さかのぼり(Retrospective)接触者なのか、確認することができます。

この例では、2人の感染者を持つ左下のグループは、中央の人物がスーパースプレッダーの可能性があり、対策が必要なクラスターであると推定できます。

感染者から1階層追跡(赤いノードに着目)
感染者から2階層追跡(赤いノードに着目)

できるところから行動履歴をデジタル化

感染者が出ないように対策することはもちろんですが、出てしまったときにどうするかということも、具体的に考えておく必要があります。ウィルスは目には見えないし、交渉が通用する相手でもありません。したがって、データにもとづいたアプローチが必要です。正しく実態を把握し、それにもとづいてブレーキとアクセルを制御しながら、業務を継続していかなければなりません。顧客への感染拡大もあってはなりません。

そのためには、従業員やスタッフの行動履歴をできる限りデジタル化しておく必要があります。大規模なシステムを導入しなくても、できることはあるはずです。会議や診療なら「予約」、授業なら「出欠」などは、いまあるシステムでも容易に記録できます(しかも無料で)。まずは、感染リスクが高まるイベントだけでもデジタル化し、追跡できる準備をはじめるべきでしょう。

今回の分析は、情報分析ツール「Quark Apps」を使っています。Quark Appsは、情報の自動収集、前処理、ビジュアル化、機械学習(AI)をExcelから操作できるようにした、Quarkオリジナルのパッケージです。