国内用語コードに対する、当面のOMOP concept IDの割り当て方

日本の用語コードに対するODHSIボキャブラリの正式な割当ができるまでの仮の方法として
下記のようにすることを提案する。

傷病、医薬品、特定機材、医科診療行為のレセ電コードを、一定の規則で
 20億番~21億番未満の番号に変換し、それをconcept IDとする。

  • マッピング表を利用するのではなく、規則(ルール)により変換する。ETLプログラムに実装できる。

  • OMOP concept IDでは、20億番以上はローカル用途に使う領域になっている。

  • その領域のうち、20億番~21億番未満の番号を使用する。21億番以上(~2,147,483,647)は使用しないので、本当にローカルな用途に4000万個以上の領域を引き続き使用できる。

  • 本規則により割り当てられた20億番以上の番号を、2B-J IDと呼称する。

  • 2B-J IDは日本ローカルな、しかし日本共通のOMOP concept IDである。

  • 2B-J IDからOMOP 標準のconcept IDへのマッピングを別途整備する。これにより日本の用語コードをOMOP標準concept IDへ変換できるようになる。

  • CDM各テーブルへの格納はこのようになる。

 *_concept_id : OMOP標準conceptのIDを入れるもので、日本のコード/用語は入らない。

 *_source_concept_id: 本規則で導出された番号(2B-J ID)を格納する。

 *_source_value: 元データのコードを入れる。コード体系はレセ電とは限らない。

  • 元データの用語コード体系がレセ電コードではない場合、一旦レセ電コードに変換した後、本規則によるconcept IDを導出する。

  • ICD10についてはAthenaにマッピング表があるため本規則は必要ない。

  • 検体検査はレセ電では一部粒度が不足するため、元データがレセ電でない場合の別途対応を加える予定。

  • ATLAS等で使うためには、Custom Vocablary が必要で、これも別途整備する予定。

(Athenaから取得したvacablaryと同様に、CDMのvacablaryとして取り込めるようにする。)

  • 将来Athenaに収録されたときには、concept IDが変わることになるが、*_source_valueに元コードがあるので、その情報をもとにAthenaを引けばよい。

  • レセ電コードの範囲変更等により、本規則を随時変更することがある。2B-J IDに限らずボキャブラリが更新されたときには、再マッピングを必要にあわせ実施しなくてはならない。

《変換規則》ver.202205
 ※見やすくするためにコード・ID番号中に空白を挟んでいるが、除去して使用する。
 


傷病名
医薬品

医科診療行為
特定機材

 

 

 

レセ電コード

AAA AAAA
6ABBB BBBB

1 ABBB BBB0
7 0AAA 0000
7 100A AAAA
7 2AAA A000
7 3AAA 000B
7 5AAA A000
7 70AA AAA0
7 99AA AAA0

 








2B-J ID
20 0AAA AAAA
20 ABBB BBBB (A=1..8)

20 9ABB BBBB (A=1..9)

20 900A AA00
20 901A AAAA
20 902A AAA0
20 903A AA0B
20 905A AAA0
20 907A AAAA
20 909A AAAA