国内用語コードに対する、当面のOMOP concept IDの割り当て方
日本の用語コードに対するODHSIボキャブラリの正式な割当ができるまでの仮の方法として
下記のようにすることを提案する。
『傷病、医薬品、特定機材、医科診療行為のレセ電コードを、一定の規則で
20億番~21億番未満の番号に変換し、それをconcept IDとする。』
-
マッピング表を利用するのではなく、規則(ルール)により変換する。ETLプログラムに実装できる。
-
OMOP concept IDでは、20億番以上はローカル用途に使う領域になっている。
-
その領域のうち、20億番~21億番未満の番号を使用する。21億番以上(~2,147,483,647)は使用しないので、本当にローカルな用途に4000万個以上の領域を引き続き使用できる。
-
本規則により割り当てられた20億番以上の番号を、2B-J IDと呼称する。
-
2B-J IDは日本ローカルな、しかし日本共通のOMOP concept IDである。
-
2B-J IDからOMOP 標準のconcept IDへのマッピングを別途整備する。これにより日本の用語コードをOMOP標準concept IDへ変換できるようになる。
-
CDM各テーブルへの格納はこのようになる。
*_concept_id : OMOP標準conceptのIDを入れるもので、日本のコード/用語は入らない。
*_source_concept_id: 本規則で導出された番号(2B-J ID)を格納する。
*_source_value: 元データのコードを入れる。コード体系はレセ電とは限らない。
-
元データの用語コード体系がレセ電コードではない場合、一旦レセ電コードに変換した後、本規則によるconcept IDを導出する。
-
ICD10についてはAthenaにマッピング表があるため本規則は必要ない。
-
検体検査はレセ電では一部粒度が不足するため、元データがレセ電でない場合の別途対応を加える予定。
-
ATLAS等で使うためには、Custom Vocablary が必要で、これも別途整備する予定。
(Athenaから取得したvacablaryと同様に、CDMのvacablaryとして取り込めるようにする。)
-
将来Athenaに収録されたときには、concept IDが変わることになるが、*_source_valueに元コードがあるので、その情報をもとにAthenaを引けばよい。
-
レセ電コードの範囲変更等により、本規則を随時変更することがある。2B-J IDに限らずボキャブラリが更新されたときには、再マッピングを必要にあわせ実施しなくてはならない。
《変換規則》ver.202205
※見やすくするためにコード・ID番号中に空白を挟んでいるが、除去して使用する。
傷病名
医薬品
医科診療行為
特定機材
レセ電コード
AAA AAAA
6ABBB BBBB
1 ABBB BBB0
7 0AAA 0000
7 100A AAAA
7 2AAA A000
7 3AAA 000B
7 5AAA A000
7 70AA AAA0
7 99AA AAA0
⇒
⇒
⇒
⇒
⇒
⇒
⇒
⇒
⇒
⇒
2B-J ID
20 0AAA AAAA
20 ABBB BBBB (A=1..8)
20 9ABB BBBB (A=1..9)
20 900A AA00
20 901A AAAA
20 902A AAA0
20 903A AA0B
20 905A AAA0
20 907A AAAA
20 909A AAAA