本研究では、COVID-19患者の電子健康記録(EHR)を分析し、入院期間(LOS)を用いて感染の重症度を予測する手法を提案しています。COVID-19は2019年に世界的なパンデミックを引き起こした呼吸器疾患で、症状の重さは様々です。多くの患者が短い入院期間を持つ反面、重症化によって長期入院するケースもあります。したがって、入院期間に偏ったクラス不均衡の問題に対処するため、合成データを利用してオーバーサンプリングを行います。生成したオーバーサンプルデータを用いて、人工ニューラルネットワーク(ANN)を訓練し、ベイジアン最適化を用いてハイパーパラメータを調整します。最も良いF1スコアを持つモデルを選択し、評価と考察を行います。