臨床研究基本出發(fā)點在于闡明疾病的病因、診斷、治療、預(yù)防、及預(yù)后方面的科學問題,從而認識疾病的本質(zhì),并進行有效的防治。而科研選題是臨床科研全流程的第一步,愛因斯坦曾說過“提出一個問題比解決一個問題更重要”。 科研選題通常有三大來源:臨床實踐、文獻閱讀和數(shù)據(jù)庫挖掘。 對于一些還沒有太多自己數(shù)據(jù)、沒有太多臨床經(jīng)驗、沒有大量文獻閱讀的年輕醫(yī)生來說,或是對于一些資深的臨床專家來說,做好公共數(shù)據(jù)庫挖掘無疑是非常省心的一個選題來源。 常用的免費公共數(shù)據(jù)庫主要有中國健康與營養(yǎng)調(diào)查(China Health and Nutrition Survey, CHNS)、中國健康與養(yǎng)老追蹤調(diào)查(China Health and Retirement Longitudinal Study,CHARLS)、美國國家健康與營養(yǎng)調(diào)查(National Health and Nutrition Examination Suivey,NHANES)、MIMIC重癥系列(Medical Information Mart for Intensive Care)、美國SEER數(shù)據(jù)庫(Surveillance, Epidemiology, and End Results)、BioLINCC數(shù)據(jù)庫、Dryad公開數(shù)據(jù)平臺、癌癥基因組圖譜(The Cancer Genome Atlas,TCGA),常用的收費公共數(shù)據(jù)庫包括英國生物樣本數(shù)據(jù)庫(UK biobank)。下面簡單介紹各個數(shù)據(jù)庫情況和網(wǎng)址獲取途徑。網(wǎng)址:https://www.cpc./projects/china- 中國健康與營養(yǎng)調(diào)查(CHNS)是由美國北卡羅來納大學人口中心與中國疾控中心聯(lián)合進行的大規(guī)模的社會健康調(diào)查的隊列研究。旨在研究健康、營養(yǎng)、以及國家和地方政府實施的計劃生育政策和項目,并了解中國社會的社會和經(jīng)濟轉(zhuǎn)型如何影響其人口的健康和營養(yǎng)狀況。
- 調(diào)查的內(nèi)容涉及健康學、營養(yǎng)學、社會學、人口學、經(jīng)濟學、公共政策等多個學科,數(shù)據(jù)內(nèi)容包括社區(qū)調(diào)查、家庭戶調(diào)查、個人調(diào)查、健康調(diào)查、營養(yǎng)和體質(zhì)測驗、食品市場調(diào)查及健康和計劃生育調(diào)查。
- 項目分別于1989年、1991年、1993年、1997年、2000年、2004年、2006年、2009年、2011年、2015年開展項目調(diào)研和數(shù)據(jù)整理及發(fā)布。CHNS網(wǎng)站于2018年6月12日更新了數(shù)據(jù)集內(nèi)容,更新后的數(shù)據(jù)集涵蓋了1989年~2015年共10次調(diào)研數(shù)據(jù)。
網(wǎng)址:http://charls.pku.edu.cn/中國健康與養(yǎng)老追蹤調(diào)查(CHARLS)是由北京大學國家發(fā)展研究院主持、中國社會科學調(diào)查中心執(zhí)行的一項大型跨學科調(diào)查項目。該調(diào)查旨在收集一套代表中國45歲及以上中老年人家庭和個人的高質(zhì)量微觀數(shù)據(jù),以分析我國人口老齡化問題,推動老齡化問題的跨學科研究。CHARLS全國基線調(diào)查于2011年開展,約1萬戶家庭中的1.7萬人。這些樣本每兩到三年追蹤一次。CHARLS內(nèi)容包括:個人基本信息,家庭結(jié)構(gòu)和經(jīng)濟支持,健康狀況,體格測量,醫(yī)療服務(wù)利用和醫(yī)療保險,工作、退休和養(yǎng)老金、收入、消費、資產(chǎn),及社區(qū)基本情況等。網(wǎng)址:https://www./nchs/nhanes/index.htm美國國家健康與營養(yǎng)調(diào)查(NHANES)是一項基于人群的橫斷面調(diào)查,旨在收集有關(guān)美國家庭人口健康和營養(yǎng)的信息。項目每年調(diào)查一個全國代表性的樣本,約5000人,這些人群位于全國各縣。(1)訪談部分:包括人口統(tǒng)計學、社會經(jīng)濟學、飲食和健康相關(guān)問題。(2)體檢部分:包括生理測量、實驗室檢查等內(nèi)容。- NHANES采用分層多階段抽樣設(shè)計,收集了全國有關(guān)健康和營養(yǎng)狀況的代表性數(shù)據(jù)。同時調(diào)查了風險因素,一個人的生活方式、體質(zhì)、遺傳或環(huán)境可能會增加患某種疾病或病癥的機會。研究吸煙、飲酒、性行為、吸毒、身體健康和活動、體重和飲食攝入量。還收集了關(guān)于生殖健康某些方面的數(shù)據(jù),如使用口服避孕藥和母乳喂養(yǎng)做法。
- 研究的疾病和健康指標包括:貧血、心血管疾病、糖尿病、環(huán)境暴露眼疾、聽力損失、傳染性疾病、腎臟疾病、營養(yǎng)、肥胖、口腔健康、骨質(zhì)疏松、生育史和性行為、呼吸系統(tǒng)疾病(哮喘,慢性支氣管炎,肺氣腫)、性病、視力等。
使用較多的是MIMIC-II數(shù)據(jù)庫。該數(shù)據(jù)庫可以免費申請使用,包括2001-2012年之間重癥監(jiān)護室超過40000患者的相關(guān)數(shù)據(jù)。數(shù)據(jù)庫包含信息如人口統(tǒng)計學特征、床邊生命體征的測量,實驗室測試結(jié)果,各種操作、藥物、影像報告和死亡指標。網(wǎng)址:https//seer.cancer.gov/SEER腫瘤數(shù)據(jù)庫是北美最具代表性的大型腫瘤登記注冊數(shù)據(jù)庫之一,收集了大量醫(yī)學的相關(guān)原始數(shù)據(jù)。數(shù)據(jù)庫中的腫瘤可分為9類:乳腺、結(jié)腸&直腸、其他消化系統(tǒng)、女性生殖、淋巴&白血病、男性生殖、呼吸系統(tǒng)、泌尿系統(tǒng)及其它尚未確定的類型。臨床數(shù)據(jù)記錄中包括患者注冊編號、人口統(tǒng)計學特征、腫瘤特征、治療方案、死亡原因等信息。網(wǎng)址:https://biolincc.nhlbi./home/生物標本和數(shù)據(jù)采集信息中心數(shù)據(jù)庫包含兩類數(shù)據(jù),一類是NHBLI生物標本數(shù)據(jù),這類數(shù)據(jù)自1975年開始由血液疾病部門管理,一類是NHBLI數(shù)據(jù)。NHBLI臨床研究數(shù)據(jù)主要來源于最近70多年以來的流行病學研究和臨床研究,包含來自于145家中心臨床注冊研究和觀察性研究的數(shù)十萬患者數(shù)據(jù)。臨床注冊研究的數(shù)據(jù)包含患者基線資料、中期隨訪信息、輔助研究以及預(yù)后資料(包含實驗室檢查);流行病學研究數(shù)據(jù)包含在整個觀察周期內(nèi)獲得的所有監(jiān)測結(jié)果。Dryad數(shù)據(jù)庫受美國國家科學基金會資助,于2008年9月成立,是一家非營利性會員制組織。Dryad數(shù)據(jù)庫中儲存醫(yī)學、生物學、生態(tài)學領(lǐng)域的研究數(shù)據(jù),向全球開放,可免費下載其中的數(shù)據(jù)資源并可再次使用。八、UK biobank(英國生物樣本數(shù)據(jù)庫)2006—2010年英國22個評估中心招募了大約50萬40~69歲志愿者,收集疾病和生活方式信息及基因型數(shù)據(jù),將電子醫(yī)療記錄與遺傳數(shù)據(jù)聯(lián)系起來,是目前已建成的最大規(guī)模的人類遺傳隊列生物樣本庫。觸摸屏問卷調(diào)查;口頭采訪和血壓測量;身體測量;生物樣本采集;飲食問卷/online。- 2012-2013,通過電子郵件或信件邀請參與者進行第一次重復評估,2萬名參與者參與。通過觸摸屏問卷和簡短的口頭訪談收集參與者的健康和生活方式、聽力和認知功能的信息,還進行了一系列身體測量和生物樣本采集。
包含死亡登記、住院患者、癌癥登記、初級衛(wèi)生保健和COVID-19檢測結(jié)果。數(shù)據(jù)查找主要通過首頁中Browse按鈕查詢:公共數(shù)據(jù)庫是筆寶貴的資源,要想利用好它們,還得根據(jù)個體需求進行深度挖掘,進而進行科研成果的轉(zhuǎn)化,最終服務(wù)于臨床,以期為促進人類健康作貢獻。后期會重點對常用的單個數(shù)據(jù)庫進行詳細介紹,敬請期待!【特別聲明】 本公眾號文章注重原創(chuàng),非原創(chuàng)文章會注明出處。
|