國家衛(wèi)生數(shù)據(jù)字典
(初稿)
衛(wèi)生部統(tǒng)計信息中心
第四軍醫(yī)大學(xué)衛(wèi)生信息研究所
目 錄
一、字典結(jié)構(gòu) 1
1.元數(shù)據(jù)標(biāo)識符 3
2.?dāng)?shù)據(jù)元表示形式 4
3.?dāng)?shù)據(jù)類型 4
4.?dāng)?shù)據(jù)格式 5
5.基本屬性描述 5
二、字典內(nèi)容 7
附錄1 數(shù)據(jù)元條目(278個) 8
附錄2 代碼條目(85個) 28
附錄3 大型代碼表(20個) 35
附錄4 詞匯表條目(6個) 60
附錄5 數(shù)據(jù)字典應(yīng)用實例-醫(yī)院出院病人數(shù)據(jù)庫結(jié)構(gòu) 63
國家衛(wèi)生數(shù)據(jù)字典(National Health Data Dictionary, NHDD)即元數(shù)據(jù)資源庫(Meta Data Repository),目的是為使用者提供數(shù)據(jù)元和描述數(shù)據(jù)元的元數(shù)據(jù),是衛(wèi)生信息系統(tǒng)和數(shù)據(jù)庫建設(shè)必須遵循的行業(yè)標(biāo)準(zhǔn)。
一、字典結(jié)構(gòu)
根據(jù)元數(shù)據(jù)注冊國際標(biāo)準(zhǔn),國家衛(wèi)生數(shù)據(jù)字典具有8個基本結(jié)構(gòu),見圖1,其中最基本的結(jié)構(gòu)是對象類、特性、表示。
對象類:現(xiàn)實世界中的想法、抽象概念或事物的集合,有清楚的邊界和含義,并且特性和其行為遵循同樣的規(guī)則,能夠加以識別和標(biāo)識;
特性:對象類的所有個體所共有的某種性質(zhì);
表示:值域與數(shù)據(jù)類型的組合,必要時也包括度量單位或字符集。值域是數(shù)據(jù)元允許(或有效)值的集合。比如,表示醫(yī)生年齡的數(shù)據(jù)元可以用一個非負(fù)整數(shù)集(實際年齡,以年為單位)作為有效值集。另一種選擇是,把有效值用事先指定的類別清單表示,且每個類別都具有一個代碼值,如代碼值1(< 35歲),2(36~ 50歲),3(51~ 65歲),4(>65歲)。前者的值域是一個非窮舉域,后者的值域是一個窮舉域。窮舉域通常用編碼系統(tǒng)表示,如ICD-10編碼。ICD-10編碼是值域的一種分類模式。
數(shù)據(jù)集和術(shù)語(詞表)是國家衛(wèi)生數(shù)據(jù)字典的附屬結(jié)構(gòu)。數(shù)據(jù)集有兩個主要作用,一是用來表示需要用多個數(shù)據(jù)元表示的事務(wù),如人的姓名的完全表示包括當(dāng)前姓名、昵稱、化名、筆名、中文名、外文名、曾用名、曾用名使用時間、曾用名停用時間等;二是用來規(guī)范國家最小數(shù)據(jù)集,如出生登記最小數(shù)據(jù)集、死亡報告最小數(shù)據(jù)集等。術(shù)語(詞表)是供所有元數(shù)據(jù)條目參照、引用的規(guī)范詞匯。
對象類是我們希望用于收集和存儲數(shù)據(jù)的事物。對象類的例子有病人、醫(yī)生、護士和化驗單等。特性用來區(qū)別和描述對象的特征,如膚色、姓名、性別、年齡、職業(yè)、收入、住址等。另外,特性有可能需要用多個詞組加以描述,這要視所用的自然語言而定。對象類和特性的組合稱為數(shù)據(jù)元概念(DEC)。數(shù)據(jù)元概念是能以數(shù)據(jù)元形式表示的概念,其描述不包括任何具體的表示。例如 “醫(yī)生年齡”就是對象類+特性構(gòu)成的一個數(shù)據(jù)元概念,對應(yīng)了兩種表示:實際年齡或年齡組。因此,數(shù)據(jù)元的構(gòu)成可表達為:
|
|