EpiGraphHub を活用したスイスの COVID-19 リアルタイム疫学分析

ソースデータ

この作業では、スイス連邦公衆衛生局 (FOPH – opendata.swiss/en/dataset/covid-19-schweiz) のデータを使用しました。 26州すべてから報告された毎日の症例数(図1に示す)、入院、検査、検査陽性、および死亡の数を使用しました。 カントンは、米国の州に似たスイスの行政区域です。

図。 1

すべてのカントンで毎日の感染者数がカウントされます。 それらの入射曲線の間に時間遅延があることがわかります。 カントンは、公式の 2 文字コード (en.wikipedia.org/wiki/ISO_3166-2:CH) で識別されます。

ここで使用されるデータセットは、名前、簡単な説明、および EpigraphHub プラットフォーム内でアクセスできる場所へのリンクを示す表 1 に一覧表示されています。4. データセットごとに、対応するメタデータ テーブルも利用できます (https://epigraphhub.org/tablemodelview/list/)。 メタデータ テーブルには、参照するテーブルと同じ名前が付けられ、接尾辞「」が追加されます。_meta」。 スイス連邦公衆衛生局から取得したその他の COVID-19 データセットも、EpigraphHub でダウンロードして視覚化できます。 データセットは保存され、変更なしで再共有されます。

表 1 このホワイト ペーパーで使用したデータ セットのリスト。

ここで使用されているデータセットの視覚化の概要については、epigraphhub.org/superset/dashboard/p/yorXv7eBJAQ/ を参照してください。

入院率の見える化

2021 年の初めからの一連のウイルス変異とワクチン接種の影響を考えると、時間の経過に伴う入院リスクの進化を視覚的に追跡する簡単で効果的な方法は、新規入院数と新規入院数の日々の関係を調べることです。毎日報告される新しいCovid-19症例の数。 この視覚化は、単純な散布図と時間カラー マッピングの適用によって実現できます。 最後に、分析を 3 か月のブロックに分割して、症例の平均重症度の変化を示しました (図 2)。 これらの率を州ごとに見て、全国の率とどのように異なるかを確認できます (図 3)。

図。 2
写真2

四半期 (3 か月ウィンドウ) ごとに色分けされた、スイスのケース別の毎日の入院。 Q1: 1 月から 3 月、Q2: 4 月から 6 月、Q3: 7 月から 9 月、Q4: 10 月から 12 月。 傾向線は、ケースごとの入院の平均比率を表します。

図。 3
写真3

チューリッヒ、ジュネーブ、アールガウ、ベルンでのケースによる毎日の入院。 青い円は 2021 年の第 4 四半期、緑色の円は 2022 年の第 1 四半期、シアンは 2022 年の第 2 四半期のものです。

時空間分析

各カントンで毎日報告されている症例の時系列から、ペアワイズ相関分析を適用して、ウイルスの空間的ダイナミクスを解明しました。

ウイルスが地理的地域(カントンなど)に広がるにつれて、さまざまな地域で報告された症例の発生率の遅れを推定できます(図1)。 毎日報告された新しいケースシリーズ間の相互相関を使用して、この空間的軌跡を経時的に推定するだけでなく、すべてのカントン間のペアワイズ相関の大きさも分析しました。 ラグを取得するには τ 2つのシリーズの間で、すべてのカントンのペア間の相互相関係数を最大化するラグを評価しました.

2 つの時系列の正規化された相互相関関数、 バツあなたあなた によって与えられます:

$${rho}_{XY}(tau)=frac{{mathbb{E}}left[left({X}_{t}-{mu }_{X}right)left({Y}_{t+tau }-{mu }_{Y}right)right]}{{シグマ}_{X}{シグマ}_{Y}}.$$

(1)

のサイン τ 相互相関関数を最大化する は、予測可能性の方向のプロキシです。つまり、 ρXY(τ > 0) カントンを意味します バツ 予想する 発生傾向にあり、したがって、 6. の値を見つけるには τカントンの各ペアの相関を最大化することを計算しました ρXY(τ ) の値について τ -30 日から 30 日までの範囲。 ここ、 μσ各時系列の平均と標準偏差です。 以下に示すように、この情報を使用して、各カントンの予測モデルを構築しました。 注目すべきは、この尺度は地理的地域のペア間の因果関係の証拠ではないということです7. ただし、他の地域のトレンドの短期予測に貢献できる地域を選択することはできます。

空間クラスタリング

1−を使用して最大 (ρXY) カントン間の距離 バツ 、カントンの凝集クラスタリングを実行できます6、上記のように得られた最適なラグを考慮して。 最大相関と最適ラグは、それぞれ相関行列とラグ行列として保存されます (図 4、5)。

図。 4
図4

州の発生時系列間の相互相関行列。

図。 5
図5

このマトリックスは、カントンの各ペア間の相関を最大化するラグを示しています。

有病率と入院率の推定

流行を確率過程と考えると、利用可能なデータを使用してその割合を推測できます。 ここでは、ケース、テスト、および入院シリーズを使用して、有病率と入院率を推定しました。

報告された症例数から有病率を推定することは簡単ではありません。検査頻度は時間の経過とともに大幅に変化し、検出された症例数に影響を与えるからです。 したがって、単純なベイジアン階層モデルを構築して、感染率を推定しました HPあなた と入院率 Phあなた 検査数から Tあなた および陽性検査の数 (ボックスあなた)。

報告されたケースをモデル化することから始めます (ボックスあなた) パラメータ付きの二項プロセス (式 2) として いいえp それぞれ、毎日のテストの数と陽性テストの割合に対応します8.

テストの数とテストのカバレッジが十分に大きく、テストされた母集団が一般母集団の代表的なサンプルに近いと仮定します。 その場合、陽性検査の数により、検査が陽性である確率を見積もることができます。 これは、一般集団における感染者の割合、つまり有病率を概算するために使用できます。 HPあなた. 有病率を適切に表現するために、事前ベータを使用してモデル化できます。 (P{v}_{t} sim Betaleft({alpha}_{p},{beta}_{p}right))、技術的には、それを確率変数として扱います。

$$Case{s}_{t} sim Binleft(n={T}_{t},p=P{v}_{t}right).$$

(2)

同様に、入院の確率を次のようにモデル化できます。 (P{h}_{t} sim Betaleft({alpha}_{h},{beta}_{h}right)) 二項式としての入院、

$$入院{s}_{t} sim Binleft(n=ケース{s}_{t},p=P{h}_{t}right).$$

(3)

完全なベイジアン モデルは次のようになります。

$$begin{array}{lll}入院{s}_{t}| P{h}_{t} & sim & {rm{Bin}}(n=ケース{s}_{t},p=P{h}_{t}),\ ケース{s}_ {t}| P{v}_{t} & sim & {rm{Bin}}(n={T}_{t},p=P{v}_{t}),\ P{h}_{ t} & sim & {rm{Beta}}({alpha }_{h},{beta}_{h}),\ P{v}_{t} & sim & {rm {ベータ}}({alpha}_{p},{beta}_{p}).end{array}$$

有益でないベータ事前確率の選択、 ({alpha}_{h}={beta}_{h}={alpha}_{p}={beta}_{p}=0.5)、ニュートラルから推論を開始するために取られました アプリオリ 視点。

これらの単純な確率モデルは、共役分布 (ベータ二項) に基づいているため、二項確率パラメーターの事後分布の閉形式の式を持ちます。 ここで説明するモデルに基づく推論は、PyMC python パッケージ (www.pymc.io) を使用するか、後のベータ ディストリビューションのクローズド フォーミュラを使用して行われました。

発生率の確率論的表現を持つことの利点は、それを入院の二項モデルに組み込むことができることです (式 3)。

予測モデル

疫学的時系列を予測するためのアンサンブル モデルの利用は、近年何度も成功裏に適用されています。6.9.

州の入院曲線を予測するために、確率的勾配ブースティング マシン モデルを使用しました。10、複数の時系列回帰モデルで複雑な非線形関係を捉えることができるためです。

モデルは次のように定義されました。

$$begin{array}{lll}ln{H}_{k,t} & = & {beta}_{0,k}+{beta}_{1,k}{C}_{k ,t-{tau}_{i}}+{beta}_{2,k}{H}_{k,t-{tau}_{i}}\ & & {+beta} _{3,k}{T}_{k,t-{tau}_{i}}+{beta}_{4,k}IC{U}_{k,t-{tau}_ {i}}+varepsilon ,end{array}$$

(4)

どこ Hk、t は対数正規確率変数としてモデル化され、カントンでの新規入院の数です kその日に あなたVS は発生率、 T は実行されたテストの数であり、 ICU は ICU 患者数です。 これらの各予測子は、モデルに 14 回入り​​ますが、ラグがあります。 τ= 1…14 (各シリーズの最後の 14 日間を予測変数として使用します)。 同様に、同じクラスターのさまざまなカントン kも同じラグでモデルに追加されます。

式のモデル。 (4)、任意の日の入院を予測するようにトレーニングできます ≥あなた. ここでは、それを使用して 14 日先までの入院数を予測しました (図 9)。

予測モデルは、EpiGraphHub データベースでデータが更新された直後に毎日実行されます。 その後、予測は EpiGraphHub にも保存されます。 使用された最新のデータ セットと結果テーブルの URL を表 1 に示します。

Leave a Comment

Your email address will not be published. Required fields are marked *