本文作者:kaifamei

帕金森氏病的檢測方法與流程

更新時間:2025-12-27 12:06:42 0條評論

帕金森氏病的檢測方法與流程



1.本發明涉及一種使用帕金森氏病標記物檢測帕金森氏病的方法。


背景技術:



2.從病理學上來看,帕金森氏病是一種以lewy小體的形成和中腦黑質的多巴胺神經細胞的變性和細胞死亡為主的進行性神經退行性疾病,其中,lewy小體的形成以α-突觸核蛋白聚集體為主,臨床上來看,則是一種以肌肉強直、震顫、少動、行走障礙等運動障礙為主的疾病。
3.在神經退行性疾病中,帕金森氏病的數量僅次于阿爾茲海默癥,患病率達10萬人中120~130人,推測日本約有14萬患者。
4.目前,沒有能夠根治帕金森氏病的療法,通過l-dopa補充等對癥療法控制癥狀對保持qol被認為是重要的。
5.但是,出現運動障礙的自覺癥狀時,已經處于中晚期,所以需要早期診斷疾病并實現早期介入。
6.作為用于檢測帕金森氏病的生物標記物,除檢測α-突觸核蛋白積累之外,還提出了檢測源自循環血清的微rna(專利文獻1);測定血液中酪氨酸與苯基丙氨酸的濃度比率(專利文獻2)等。另外,據報道稱,在帕金森氏病患者的皮膚中,與大腦一樣可見形成α-突觸核蛋白聚集體(非專利文獻1);帕金森氏病患者會出現脂溢性皮炎、黑素瘤、水皰性天皰瘡、酒糟鼻等皮膚疾病或癥狀(非專利文獻2),考慮帕金森氏病與皮膚的狀態存在某種關系,但科學關聯性尚不明確。
7.另一方面,正在開發了通過分析生物試樣中的dna和rna等核酸來考察人體內當前和將來的生理狀態的技術。利用核酸的分析具有如下優點:已建立了全面的分析方法,一次分析即能得到豐富的信息;及容易基于與單堿基多態性和rna功能等相關的諸多研究報告實現分析結果的功能關聯。源自生物的核酸可以從血液等體液、分泌物、組織等中提取,最近有些報道中使用皮膚表層脂質(skin surface lipids;ssl)中所含的rna作為用于分析生物的樣本;從ssl能夠檢測到表皮、汗腺、毛囊和皮脂腺的標記基因(專利文獻3)。
8.專利文獻1:日本特表2019-506183號公報
9.專利文獻2:日本特開2016-75644號公報
10.專利文獻3:國際公開公報第2018/008319號
11.非專利文獻1:rodriguez-leyva i et al.ann clin transl neurol.2014(modified)
12.非專利文獻2:ravn ah et al.clin cosmet investig dermatol.2017


技術實現要素:



13.本發明涉及下面的1)~3)。
14.1)一種被檢驗者的帕金森氏病的檢測方法,包括:對于從被檢驗者采集的生物試
樣,測定選自snora16a、snora24、snora50和rexo1l2p這四種基因中的至少一種基因或其表達產物的表達水平的工序。
15.2)一種1)的方法中使用的用于檢測帕金森氏病的檢查用試劑盒,其中,
16.含有與所述基因特異性雜交的寡核苷酸或識別所述基因的表達產物的抗體。
17.3)一種帕金森氏病的檢測標記物,其由選自表3-1~3-4和表6-1~6-2所示的基因的至少一種基因或其表達產物構成。
附圖說明
18.圖1是由測試數據中的最佳預測模型中的預測值和實測值制成的混淆矩陣。
具體實施方式
19.本發明涉及一種用于檢測帕金森氏病的標記物和使用該標記物檢測帕金森氏病的方法。
20.本發明人等從帕金森氏病患者和健康者的皮膚上采集ssl,將ssl中所含的rna的表達狀態作為序列信息進行全面分析,結果發現,在兩者之間,特定的基因的表達水平存在顯著差異,可以以此為指標來檢測帕金森氏病。
21.根據本發明,可以簡單無創地在早期以高精度、靈敏度和特異度檢測帕金森氏病。
22.本文中引用的全部專利文獻、非專利文獻和其它刊物整體作為參考引用在本文中。
23.在本說明書中,術語“核酸”或“多核苷酸”表示dna或rna。dna中包括cdna、基因組dna和合成dna的全部,“rna”中包括total rna、mrna、rrna、trna、non-coding rna和合成rna的全部。
24.在本說明書中,“基因”除表示包含人基因組dna的雙鏈dna之外,還表示包含cdna的單鏈dna(正鏈)、具有與該正鏈互補的序列的單鏈dna(互補鏈)和包含這些片段的物質,并且,在構成dna的堿基的序列信息中包含一些生物學信息。
25.另外,該“基因”不僅包含特定的堿基序列所表示的“基因”,還包含它們的同源物(即,同系物或者直系同源物)、基因多型等變異體和編碼衍生物的核酸。
26.本說明書中所公開的基因名稱基于ncbi([www.ncbi.nlm.nih.gov/])所記載的官方代號(official symbol)。另一方面,關于基因本體(gene ontology、go),基于string([string-db.org/])所記載的pathway id.。
[0027]
在本說明書中,基因的“表達產物”是包含基因的轉錄產物和翻譯產物的概念。“轉錄產物”為從基因(dna)轉錄生成的rna,“翻譯產物”是指基于rna翻譯合成的被基因編碼的蛋白質。
[0028]
在本說明書中,“帕金森氏病”表示以黑質致密部多巴胺神經細胞的變性為主要主病變,緩慢進行性地表現出三種運動癥狀(靜息性震顫、強直、運動緩慢和運動不能)的特發性且進行性的疾病。
[0029]
在本說明書中,帕金森氏病的“檢測”是指明確帕金森氏病存在或不存在,也可以有檢查、測定、判定、評價或輔助評價這樣的術語替換。其中,在本說明書中,“判定”或“評價”這樣的術語不包括醫生進行的這些行為。
[0030]
本發明的由snora16a、snora24、snora50和rexo1l2p構成的四種基因是后述實施例所示的選自下述表a中記載的33種基因的基因,其是在帕金森氏病患者中,源自ssl的rna的表達量相比健康者顯著上升(up)或下降(down)的基因,并且是至今都沒有被知曉為與帕金森氏病有關聯的基因(表中由粗體表示)。
[0031]
[表a]
[0032][0033]
[0034]
將從兩個試驗(試驗1:健康者/帕金森氏病患者各15名,試驗2:健康者/帕金森氏病患者各50名)的被檢驗者的ssl中所提取的rna的表達量的數據(讀取計數值)轉換為經樣品間的總讀取數(總read數)的差異校正后的rpm值,將該rpm值轉換成以2為底的對數值,基于由此得到的值(log2rpm值),鑒定與健康者進相比在帕金森氏病患者中student’s t-test的p值為0.05以下的rna(試驗1:111種表達上升基因、68種表達下降基因(共計179種基因、表1-1~1-5);試驗2:565種表達上升基因、294種表達下降基因(共計859種基因、表1-6~1-27),選擇在試驗1和試驗2中均上升的基因(18種)和均下降的基因(15種),這些基因即是表a所示的33種基因。
[0035]
因此,選自由該179種基因和859種基因(除去重復后共計1005種基因)構成的組的基因或其表達產物可以作為用于檢測帕金森氏病的帕金森氏病標記物,其中,選自由表a所示的33種基因構成的組的基因或其表達產物是優選的帕金森氏病標記物。
[0036]
表a和下述表1中,“p值(p value)”表示在統計學檢驗中觀測到比在歸無假說下實際上根據數據算得的統計量更加極端的統計量的概率。因此,“p值”越小,則可以視為比較對象間存在顯著差異。
[0037]“up”所示的基因是帕金森氏病患者中表達水平升高的基因,而“down”所示的基因是帕金森氏病患者中表達水平降低的基因。
[0038]
經過利用了基因本體(go)富集分析的生物過程(biological process(bp))的探索和kegg pathway探索表明,上述表達變動的基因中包括與帕金森氏病(hsa05012)關聯的基因(參見下述表2)。另一方面,在上述表達變動的基因中,下述表3-1~3-4所示的基因是過去完全沒有被報道過與帕金森氏病的關系相關的基因。因此,選自這些基因的至少一種基因或其表達產物是用于檢測帕金森氏病的新型帕金森氏病標記物,特別優選將試驗1和試驗2中相同的選自由snora16a、snora24、snora50和rexo1l2p構成的組的至少一種基因或其表達產物用作新型帕金森氏病標記物。更優選選自該組的兩種以上,進一步優選三種以上,更進一步優選全部四種。另外,優選至少包含上述表a和下述表b中均包含的snora24。
[0039]
另外,作為rna的表達量的數據(讀取計數值),可以使用例如通過deseq2(love mi et al.genome biol.2014)校正的計數值(normalized count值、標準化計數值)或者加上整數1的以2為底的對數值(log2(count+1)值)來進行表達變動rna的鑒定。
[0040]
例如,從上述兩個試驗的被檢驗者的ssl中提取的rna的表達量的數據使用標準化計數值,鑒定與健康者相比在帕金森氏病患者中似然比檢驗的p值的校正值(fdr)為0.25以下的rna時,試驗1中得到74種表達上升的基因,209種表達下降的基因,共計283種基因(表4-1~4-8),試驗2中得到151種表達上升的基因,308種表達下降的基因,共計459種基因(表4-9~4-20)。并且,試驗1和試驗2中均上升的基因有7種(anxa1、aqp3、emp1、krt16、polr2l、serpinb4、snora24),均下降的基因有10種(atp6v0c、bhlhe40、ccl3、ccni、cxcr4、egr2、gabarapl1、rhoa、rnasek、serinc1),共計17種(表b)。
[0041]
因此,選自由該283種基因和459種基因(除去重復后共計725種基因)構成的組的基因或其表達產物可以作為用于檢測帕金森氏病的帕金森氏病標記物,其中,選自由表b所示的17種基因構成的組的基因或其表達產物是優選的帕金森氏病標記物,其中,與上述表a所示的基因相同的選自由下述表c所示的11種基因構成的組的基因或其表達產物是更優
選的帕金森氏病標記物。
[0042]
另外,在上述表達變動的基因中,下述表6-1~6-2所示的基因是目前完全沒有被報道過與帕金森氏病存在相關關系的基因。因此,選自這些基因的至少一種基因或其表達產物是用于檢測帕金森氏病的新型帕金森氏病標記物,特別是試驗1和試驗2中共有的snora24(表中由粗體表示)或其表達產物是優選的新型帕金森氏病標記物。
[0043]
[表b]
[0044][0045]
需要說明的是,只要可以作為用于檢測帕金森氏病的生物標記物,則上述可以作為帕金森氏病標記物的基因(下面也稱為“靶標基因”)也包括具有與構成該基因的dna的堿基序列基本相同的堿基序列的基因。其中,基本相同的堿基序列表示,在使用例如同源性計算算法ncbi blast,在期待值=10;允許缺失;過濾=on;匹配得分=1;錯配得分=-3的條件下進行檢索時,與構成該基因的dna的堿基序列具有90%以上、優選為95%以上、更優選為98%以上、進一步優選為99%以上的同一性。
[0046]
本發明的帕金森氏病的檢測方法包括下述工序:對于從被檢驗者采集的生物試樣,測定靶標基因的表達水平,在一種方案中,測定選自由snora16a、snora24、snora50和rexo1l2p構成的組的至少一種基因或其表達產物的表達水平。
[0047]
在本發明的帕金森氏病的檢測方法中,作為供采集生物試樣的被檢驗者,可列舉
包括人類和非人類哺乳動物的哺乳動物,優選為人類。在被檢驗者為人類的情況下,其性別、年齡和人種等不受特別限定,可以包括從嬰兒到老人。優選該被檢驗者為需要或希望進行帕金森氏病檢測的人。例如,該被檢驗者是懷疑帕金森氏病發病的人或具有帕金森氏病遺傳因素的人。
[0048]
本發明中使用的生物試樣只要為本發明的基因的表達隨著帕金森氏病的發生和發展產生變化的組織和生物材料即可。具體而言,可列舉:臟器、皮膚、血液、尿液、唾液、汗液、角質層、皮膚表層脂質(ssl)、組織滲出液等體液、由血液制備的血清、血漿、以及糞便、毛發等,優選列舉皮膚、角質層或皮膚表層脂質(ssl),更優選列舉皮膚表層脂質(ssl)。供ssl采集的皮膚的部位不受特別限定,可列舉:頭部、面部、頸部、軀干、四肢等身體的任意部位的皮膚,優選皮脂分泌較多的部位,例如頭部或面部的皮膚,更優選面部的皮膚。
[0049]
其中,“皮膚表層脂質(ssl)”是指存在于皮膚表面上的脂溶性組分,有時也稱為皮脂。通常,ssl主要包含由位于皮膚的皮脂腺等外分泌腺分泌的分泌物,以覆蓋皮膚表面的薄層的形式存在于皮膚表面上。ssl包含皮膚細胞中表達的rna(參見所述專利文獻3)。另外,在本文中,只要沒有特別限定,則“皮膚”是包括角質層、表皮、真皮、毛囊、以及汗腺、皮脂腺和其它腺體等組織在內的區域的總稱。
[0050]
可以采用用于從皮膚回收或除去ssl的任意手段來從被檢驗者的皮膚采集ssl。優選能夠使用后述的ssl吸收性素材、ssl粘附性素材或從皮膚刮取ssl的器具。ssl吸收性素材或ssl粘附性素材只要為對ssl具有親和性的素材,則不受特別限定,可列舉例如:聚丙烯、紙漿等。作為從皮膚采集ssl的流程的更詳細示例,可列舉:用吸油紙、吸油膜等片材吸收ssl的方法、使ssl粘附于玻璃板、膠帶等的方法、通過抹刀、刮刀等刮取并回收ssl的方法等。為了提高ssl的吸附性,也可以使用預先包含有高脂溶性溶劑的ssl吸收性素材。另一方面,ssl吸收性素材若包含水溶性高的溶劑或水分,則會抑制ssl的吸附,因此優選水溶性高的溶劑和水分的含量較少。ssl吸收性素材優選在干燥狀態下使用。供采集ssl的皮膚的部位不受特別限定,可列舉頭部、面部、頸部、軀干、四肢等身體的任意部位的皮膚,優選面部等皮脂分泌較多部位的皮膚。
[0051]
從被檢驗者采集的含rna的ssl可以保存一定時間。為了盡可能抑制所含有的rna分解,采集到的ssl優選在采集后盡可能快速保存在低溫條件下。本發明中,該含rna的ssl的保存溫度條件只要為0℃以下即可,優選為-20
±
20℃~-80
±
20℃,更優選為-20
±
10℃~-80
±
10℃,進一步優選為-20
±
20℃~-40
±
20℃,進一步優選為-20
±
10℃~-40
±
10℃,進一步優選為-20
±
10℃,進一步優選為-20
±
5℃。該含rna的ssl在該低溫條件下保存的時間不受特別限定,優選為12個月以下,例如6小時以上且12個月以下,更優選為6個月以下,例如1天以上且6個月以下,進一步優選為3個月以下,例如3天以上且3個月以下。
[0052]
在本說明書中,作為靶標基因或其表達產物的表達水平的測定對象,可列舉:由rna人工合成的cdna、編碼該rna的dna、被該rna編碼的蛋白質、與該蛋白質相互作用的分子、與該rna相互作用的分子、或與該dna相互作用的分子等。其中,作為與rna、dna或蛋白質相互作用的分子,可列舉:dna、rna、蛋白質、多糖、低聚糖、單糖、脂質、脂肪酸、和它們的磷酸化物、烷基化物、糖加成物等、以及上述任意的復合物。另外,表達水平全面地表示該基因或表達產物的表達量和活性。
[0053]
在本發明的方法中,作為優選方案,作為生物試樣使用ssl,在該情況下,分析ssl
中所含的rna的表達水平,具體而言,將rna通過逆轉錄轉換為cdna后,測定該cdna或其擴增產物。
[0054]
從ssl中提取rna時,可以使用通常用于從生物試樣提取或精制rna的方法,例如,苯酚/氯仿法、agpc(acid guanidinium thiocyanate-phenol-chloroform extraction,酸性硫氰酸胍-酚-氯仿提取)法或利用trizol(注冊商標)、rneasy(注冊商標)、qiazol(注冊商標)等譜柱的方法、使用包被有硅膠的特殊磁性體粒子的方法、使用固相載體可逆化固定(solid phase reversible immobilization)磁性體粒子的方法、利用isogen等市售rna提取試劑進行提取的方法等。
[0055]
該逆轉錄可以使用靶向待分析的特定rna的引物,為了進行更全面的核酸保存和分析,更優選使用隨機引物。該逆轉錄能夠使用通常的逆轉錄酶或逆轉錄試劑盒。優選使用準確性和效率較高的逆轉錄酶或逆轉錄試劑盒,作為其的示例,優選使用:m-mlv逆轉錄酶(reverse transcriptase)和其變體、或者市售的逆轉錄酶或逆轉錄試劑盒,例如primescript(注冊商標)逆轉錄酶系列(takara bio公司)、superscript(注冊商標)逆轉錄酶系列(thermo scientific社)等。優選使用superscript(注冊商標)iii逆轉錄酶、superscript(注冊商標)vilo cdna synthesis kit(均由thermo scientific公司制)等。
[0056]
優選地,該逆轉錄中的延伸反應將溫度調節為優選42℃
±
1℃、更優選42℃
±
0.5℃、進一步優選42℃
±
0.25℃,同時,將反應時間調節為優選60分鐘以上、更優選80~120分鐘。
[0057]
作為測定表達水平的方法,在以rna、cdna或dna為對象的情況下,可以選自下述方法:以與它們雜交的dna為引物的pcr法、實時rt-pcr法、多重pcr、smartamp法、lamp法等所代表的核酸擴增法、將與它們雜交的核酸用作探針的雜交法(dna芯片、dna微陣列、斑點印跡雜交、狹線印跡雜交、northern印跡雜交等)、確定堿基序列的方法(測序)、或以上的組合方法。
[0058]
在pcr中,可以使用以要分析的特定的dna為靶標的引物對,只擴增該特定的1種dna,也可以使用多個引物對,同時擴增多個特定的dna。優選該pcr為多重pcr。多重pcr是通過在pcr反應系統中同時使用多個引物對而同時擴增多個基因區域的方法。多重pcr可以使用市售的試劑盒(例如ion ampliseq轉錄組人基因表達試劑盒(transcriptome human gene expression kit);life technologies japan株式會社等)實施。
[0059]
該pcr的退火和延伸反應的溫度因依賴于所使用的引物而不能一概而論,在使用上述的多重pcr試劑盒的情況下,優選為62℃
±
1℃,更優選為62℃
±
0.5℃,進一步優選為62℃
±
0.25℃。因此,在該pcr中,優選退火和延伸反應在1個步驟中進行。該退火和延伸反應的步驟的時間可以根據所擴增的dna的大小等來調整,優選為14~18分鐘。該pcr中的變性反應的條件可以根據所擴增的dna來調整,優選以95~99℃進行10~60秒。上述那樣的溫度和時間條件下的逆轉錄和pcr可以使用常用于pcr的熱循環儀實施。
[0060]
利用該pcr得到的反應產物的精制優選通過反應產物的粒析(sizeseparation)進行。利用粒析,能夠將目標的pcr反應產物與pcr反應液中所含的引物和其它的雜質分離。dna的粒析例如可以利用粒析柱、粒析芯片、能夠用于粒析的磁珠等進行。作為能夠用于粒析的磁珠的優選的例子,可以列舉ampurexp等的固相可逆化固定(solid phase reversible immobilization,spri)磁珠。
[0061]
對于精制后的pcr反應產物,為了進行之后的定量分析,也可以進行必要的更進一步的處理。例如為了進行dna的測序,可以將精制后的pcr反應產物在適當的緩沖液溶液中進行制備,或切斷pcr擴增得到的dna所含的pcr引物區域,或向擴增得到的dna中進一步添加接頭序列。例如可以將精制后的pcr反應產物在緩沖液溶液中進行制備,對擴增dna進行pcr引物序列的除去和接頭連接,使所得到的反應產物根據需要擴增,制作用于定量分析的文庫(library)。例如可以使用superscript(注冊商標)vilo cdna合成試劑盒(life technologies japan株式會社)所附帶的5
×
vilo rt reaction mix和ion ampliseq轉錄組人基因表達試劑盒(life technologies japan株式會社)所附帶的的5
×
ion ampliseq hifi mix和ion ampliseq transcriptome human gene expression core panel,基于各試劑盒所帶的操作規程進行這些操作。
[0062]
在利用northern印跡雜交法測定靶標基因或來自其的核酸的表達量的情況下,例如,首先利用放射性同位素、熒光物質等對探針dna進行標記,接著,使所得到的標記dna與按照通常方法轉移至尼龍膜等的來自生物體試樣的rna雜交。之后,檢測來自標記物的信號,由此能夠對所形成的標記dna與rna的雙鏈進行測定。
[0063]
在利用rt-pcr法測定靶標基因或來自其的核酸的表達量的情況下,例如,首先按照通常方法由來自生物體試樣的rna制備cdna,以其為模板,使以本發明的靶標基因能夠擴增的方式制備的一對引物(與上述cdna(-鏈)結合的正鏈,與+鏈結合的反鏈)與其雜交。之后,按照通常方法進行pcr法,對所得到的擴增雙鏈dna進行檢測。在擴增得到的雙鏈dna的檢測中,可以采用對通過使用預先用ri、熒光物質等標記過的引物進行上述pcr而產生的標記雙鏈dna進行檢測的方法等。
[0064]
在利用dna微陣列測定靶標基因或來自其的核酸的表達量的情況下,例如將本發明的來自靶標基因的核酸(cdna或dna)的至少1種固定在支承體上,使用所得到的陣列,使由mrna制備的標記化cdna或crna結合在微陣列上,檢測微陣列上的標記,由此測定mrna的表達量。
[0065]
作為上述陣列所固定的核酸,只要是在嚴格的條件下特異性(即實質上只是目標核酸)地進行雜交的核酸即可,例如可以為具有本發明的靶標基因的全部序列的核酸,也可以為由部分序列構成的核酸。其中,“部分序列”可以列舉至少由15~25堿基構成的核酸。其中,嚴格的條件通??梢粤信e“1
×
ssc、0.1%sds、37℃”左右的清洗條件,作為更嚴格的雜交條件,可以列舉“0.5
×
ssc、0.1%sds、42℃”左右,作為進一步嚴格的雜交條件,可以列舉“0.1
×
ssc、0.1%sds、65℃”左右的條件。雜交條件記載于j.sambrook et al.,molecular cloning:a laboratory manual,thrd edition,cold spring harbor laboratory press(2001)等中。
[0066]
在利用測序測定靶標基因或來自其的核酸的表達量的情況下,例如可以列舉使用下一代測序儀(例如ion s5/xl系統、life technologies japan株式會社)進行分析?;跍y序中制作的讀取數(read count),能夠對rna表達進行定量。
[0067]
上述測定所使用的探針或引物、即本發明的用于特異性地識別并擴增靶標基因或來自其的核酸的引物、或用于特異性地檢測該rna或來自其的核酸的探針與其相當,它們可以基于構成該靶標基因的堿基序列進行設計。其中,“特異性識別”是指,例如在northern印跡法中,實質上只能夠檢測本發明的靶標基因或來自其的核酸,另外,例如在rt-pcr法中,
如實質上只擴增該核酸那樣,能夠判斷該檢測物或產物為該基因或來自其的核酸。
[0068]
具體而言,能夠利用含有與本發明的由構成靶標基因的堿基序列構成的dna或其互補鏈互補的一定數量的核苷酸的寡核苷酸。其中,“互補鏈”是指與由a:t(rna時為u)、g:c的堿基對構成的雙鏈dna的一條鏈相對應的另一條鏈。另外,“互補”并不限于在該一定數量的連續的核苷酸區域內完全是互補序列的情況,只要具有優選80%以上、更優選90%以上、進一步優選95%以上的堿基序列上的同一性即可。堿基序列的同一性可以利用上述blast等算法進行確定。
[0069]
在這樣的寡核苷酸作為引物使用的情況下,只要是特異性退火和鏈增長即可,通??梢粤信e具有例如10個堿基以上、優選15個堿基以上、更優選20個堿基以上并且例如100個堿基以下、優選50個堿基以下、更優選35個堿基以下的鏈長。
[0070]
另外,在作為探針使用的情況下,只要是特異性雜交即可,可以使用具有本發明的由構成靶標基因的堿基序列構成的dna(或其互補鏈)的至少部分或全部的序列、例如10個堿基以上、優選15個堿基以上并且例如100個堿基以下、優選50個堿基以下、更優選25個堿基以下的鏈長的寡核苷酸。
[0071]
另外,其中,“寡核苷酸”可以為dna或rna,既可以是合成的,也可以是天然的?;蛘?,雜交所使用的探針通常使用標記過的寡核苷酸。
[0072]
另外,在測定本發明的靶標基因的翻譯產物(蛋白質)、與該蛋白質發生相互作用的分子、與rna發生相互作用的分子、或與dna發生相互作用的分子的情況下,可以使用蛋白芯片分析、免疫測定法(例如elisa等)、質譜分析(例如lc-ms/ms、maldi-tof/ms)、單雜交法(pnas 100,12271-12276(2003))和雙雜交法(biol.reprod.58,302-311(1998))這樣的方法,并且可以根據對象適當選擇。
[0073]
例如在使用蛋白質作為測定對象的情況下,通過以下的方式實施:使與本發明的表達產物相對應的抗體與生物體試樣接觸,對與該抗體結合的試樣中的蛋白質進行檢測,測定其水平。例如利用蛋白質印跡法時,可以如下所述地進行:作為一次抗體,使用上述的抗體后,作為二次抗體,使用用放射性同位素、熒光物質或酶等標記了的與一次抗體結合的抗體,對其一次抗體進行標記,利用放射線測定器、熒光檢測器等測定來自這些標記物質的信號。
[0074]
另外,與上述翻譯產物相對的抗體可以為多克隆抗體,也可以為單克隆抗體。這些抗體可以按照公知的方法進行制造。具體而言,使用按照通常方法在大腸桿菌等中表達并精制得到的蛋白質,或者按照通常方法合成該蛋白質的部分多肽,使家兔等非人動物免疫后,能夠從該免疫動物的血清中按照通常方法得到多克隆抗體。
[0075]
另一方面,利用按照通常方法在大腸桿菌等中表達并精制得到的蛋白質或該蛋白質的部分多肽,使小鼠等非人動物免疫后,將所得到的脾細胞和骨髓瘤細胞進行細胞融合,能夠從所制備的雜交瘤細胞中得到單克隆抗體。另外,單克隆抗體也可以通過噬菌體展示來制作(griffiths,a.d.;duncan,a.r.,current opinion in biotechnology,volume 9,number 1,february 1998,pp.102-108(7))。
[0076]
這樣,能夠測定從被檢驗者采集的生物體試樣中的本發明的靶標基因或其表達產物的表達水平,并且基于該表達水平能夠檢測帕金森氏病。在一個實施方式中,檢測具體通過將所測得的本發明的靶標基因或其表達產物的表達水平與對照水平進行比較而進行。
[0077]
在通過測序對多種靶標基因的表達水平進行分析的情況下,如上所述,作為指標,優選使用作為表達量數據的讀取計數值(read count值)、對于該讀取計數值校正了樣品間的總讀取數的差異而得到的rpm值、將該rpm值轉換成以2為底的對數值的值(log2rpm值)或利用deseq2校正得到的計數值(normalized count值,標準化計數值)或加上整數1后以2為底的對數值(log2(count+1)值)。
[0078]
另外,作為rna-seq的定量值,也可以是一般的利用fragments per kilobase of exon per million reads mapped(fpkm)、reads per kilobase of exon per million reads mapped(rpkm)、transcripts per million(tpm)等算出的值。還可以為利用微陣列法得到的信號值和其校正值。另外,在通過rt-pcr等只對特定的靶標基因進行表達水平的分析的情況下,優選將對象基因的表達量轉換成以管家基因的表達量為基準的相對表達量(相對定量)后再進行分析的方法、或使用包含靶標基因區域的質粒對絕對復制數進行定量(絕對定量)并分析的方法。也可以為利用數字pcr法得到的復制數。
[0079]
其中,作為“對照水平”,例如可以列舉健康者的該靶標基因或其表達產物的表達水平。健康者的表達水平也可以為從健康者體中測得的該基因或其表達產物的表達水平的統計值(例如平均值等)。在靶標基因為多種的情況下,優選對于各基因或其表達產物,求出基準表達水平。
[0080]
另外,本發明中,帕金森氏病也可以通過本發明的靶標基因或其表達產物的表達水平的上升/減少來檢測。在這種情況下,來自被檢驗者的生物體試樣中的靶標基因或其表達產物的表達水平與各基因或其表達產物的截止值(參照值)進行比較。關于參照值,只要預先取得健康者的該靶標基因或其表達產物的表達水平作為基準數據,基于以其為基礎的表達水平的平均值或標準偏差等統計數值,適當確定即可。
[0081]
并且,可以利用源自帕金森氏病患者的靶標基因或其表達產物的表達水平和源自健康者的靶標基因或其表達產物的表達水平的測定值,構建區分帕金森氏病患者和健康者的判別公式(預測模型),并利用該判別公式來檢測帕金森氏病。即,將來自帕金森氏病患者的靶標基因或其表達產物的表達水平和源自健康者的靶標基因或其表達產物的表達水平的測定值作為訓練樣品,構建區分帕金森氏病患者和健康者的判別公式(預測模型),并基于該判別公式求得判別帕金森氏病患者和健康者的截止值(參照值)。需要說明的是,建立判別公式時,可以通過主成分分析(pca)進行降維,并將主要成分作為說明變量。
[0082]
接著,同樣由從被檢驗者采集的生物試樣測定靶標基因或其表達產物的水平,將得到的測定值代入該判別公式,將根據該判別公式得到的結果與截止值比較,由此能夠評價被檢驗者存在或不存在帕金森氏病。
[0083]
其中,作為構建判別式的算法,可以利用機械學習所使用的算法等公知的算法。作為機械學習算法的例子,可以列舉隨機森林(random forest)、線性核的支持向量機(svm linear)、rbf核的支持向量機(svm rbf)、神經網絡(nerural net)、一般線性模型(generalized linear model)、正則化線性判別分析(regularized linear discriminant analysis)、正則化邏輯回歸(regularized logistic regression)等。可以向所構建的預測模型輸入檢驗用的數據,算出預測值,選取該預測值與實測值最適合的模型、例如準確率(accuracy)最大的模型作為最佳預測模型。另外,可以根據預測值和實測值計算檢測率(recall)、精度(precision)和作為它們的調和平均的f值,選取其f值最大的模型作為最佳
預測模型。
[0084]
截止值(參照值)的確定方法沒有特別限制,可以按照公知的方法進行確定。例如,可以利用使用判別式所制作的roc(receiver operating characteristic curve、受試者操作特征曲線)曲線求出。在roc曲線中,在縱軸繪制陽性患者中出現陽性結果的概率(靈敏度),在橫軸繪制1減去陰性患者中出現陰性結果的概率(特異度)而得到的值(假陽性率)。關于roc曲線所示的“真陽性(靈敏度)”和“假陽性(1-特異度)”,可以將“真陽性(靈敏度)
”?“
假陽性(1-特異度)”最大的值(約登指數,youden index)作為截止值(參照值)。
[0085]
如后述的實施例所示,將根據表a所示的靶標基因(33種基因或選自其中的四種基因)的表達量的數據(log2rpm值)得到的各主成分的值作為說明變量,以健康者和帕金森氏病患者作為目標變量,使用機器學習算法構建預測模型之后,可以通過使用snora16a、snora24、snora50、rexo1l2p這四種的模型來預測帕金森氏病。另外還表明,也可以通過使用33種的模型來高精度地預測帕金森氏病。
[0086]
因此,在建立區分上述帕金森氏病患者和健康者的判別公式的情況下,作為靶標基因,除snora16a、snora24、snora50和rexo1l2p這四種靶標基因之外,適當添加選自表a所示的除以上四種靶標基因之外的29種基因的至少一種基因或其表達產物的表達數據,優選基于下面所示的表8所示的變量重要度,添加適當數量變量重要度較高的基因,能夠建立顯示較高檢測率和精度的判別公式,從而可以更高精度地檢測帕金森氏病。具體而言,優選egr2、rhoa、ccni、rnasek、csf2rb、serp1、ankrd12、slc25a3這8種,優選再加入cd83、cxcr4、itgax、uqcrh這4種后的12種,優選再加入kcnq1ot1、ccl3、c10orf116、serpinb4、lce3d、cnfn這6種后的18種,優選再加入全部29種。
[0087]
或者,作為靶標基因,除snora16a、snora24、snora50和rexo1l2p這四種靶標基因之外,還可以適當地加入至少一個除snora24之外的基因或其表達產物的表達數據,這些基因或表達產物選自下表c所示的11種基因,這些基因在前面的表a和表b中都顯示為表達變動基因。
[0088]
[表c]
[0089][0090]
并且,在建立區分帕金森氏病患者和健康者的判別公式的情況下,所用的靶標基因也可以使用選自表b所示的基因的至少一種基因或其表達產物的表達數據,優選包含snora24,并優選使用選自此外的至少一種基因,更優選使用表c所示的基因或其表達產物的表達數據,進一步優選使用表b所示的全部基因或其表達產物的表達數據。
[0091]
本發明的用于檢測帕金森氏病的檢查用試劑盒包括用于測定從患者分離出的生物試樣中本發明的靶標基因或其表達產物的表達水平的檢查試劑。具體而言,可列舉:包含與本發明的靶標基因或源自其的核酸特異性結合(雜交)的寡核苷酸(例如,用于pcr的引物)的、用于核酸擴增、雜交的試劑;或者包含識別本發明的靶標基因的表達產物(蛋白質)的抗體的、用于免疫學測定的試劑等。如上所述,該試劑盒中所包含的寡核苷酸、抗體等可以通過公知的方法獲得。
[0092]
另外,該檢查用試劑盒除了含有上述抗體以外,還可以含有標記試劑、緩沖液、顯底物、二次抗體、阻滯劑、試驗所需的器具以及對照、用于采集生物試樣的用具(例如,用于采集ssl的吸油膜等)等。
[0093]
下面示出本發明的方案和優選實施方案。
[0094]
《1》一種被檢驗者的帕金森氏病的檢測方法,其包括:
[0095]
對于從被檢驗者采集的生物試樣,測定選自snora16a、snora24、snora50和rexo1l2p這四種基因中的至少一種基因或其表達產物的表達水平的工序。
[0096]
《2》根據《1》的帕金森氏病的檢測方法,其中,至少包括測定snora24基因或其表達產物的表達水平。
[0097]
《3》根據《1》或《2》的方法,其中,基因或其表達產物的表達水平的測定為mrna的表達量的測定。
[0098]
《4》根據《1》~《3》中任一項的方法,其中,基因或其表達產物為所述被檢驗者的皮膚表層脂質中所含的rna。
[0099]
《5》根據《1》~《4》中任一項的方法,其中,將表達水平的測定值與所述各基因或其表達產物的參照值比較,評價存在或不存在帕金森氏病。
[0100]
《6》根據《1》~《4》中任一項的方法,其中,將來自帕金森氏病患者的所述基因或其表達產物的表達水平和源自健康者的所述基因或其表達產物的表達水平的測定值作為訓練樣品,制作能夠區分帕金森氏病患者和健康者的判別式,
[0101]
將由從被檢驗者采集的生物試樣得到的所述基因或其表達產物的表達水平的測定值代入該判別公式,將得到的結果與參照值比較,以評價被檢驗者存在或不存在帕金森氏病。
[0102]
《7》根據《6》的方法,其中,測定所述四種基因中的所有基因或其表達產物的表達水平。
[0103]
《8》根據《6》或《7》的方法,其中,除了測定選自所述四種基因中的至少一種基因之外,還測定選自下述29種基因中的至少一種基因或其表達產物的表達水平:
[0104]
ankrd12、c10orf116、ccl3、ccni、cd83、cnfn、cnn2、csf2rb、cxcr4、egr2、emp1、itgax、kcnq1ot1、lce3d、litaf、ndufa4l2、ndufs5、polr2l、rhoa、rnasek、rpl7a、rps26、serinc1、serp1、serpinb4、slc25a3、snrpg、srrm2、uqcrh。
[0105]
《9》根據《8》的方法,其中,除了測定選自所述四種基因中的至少一種基因之外,還測定選自下述10種基因中的至少一種基因或其表達產物的表達水平:
[0106]
ccl3、ccni、cxcr4、egr2、emp1、polr2l、rhoa、rnasek、serinc1、serpinb4。
[0107]
《10》根據《6》或《7》的方法,其中,除了測定選自所述四種基因中的至少一種基因之外,還測定選自下述16種基因中的至少一種基因或其表達產物的表達水平:
[0108]
anxa1、aqp3、atp6v0c、bhlhe40、ccl3、ccni、cxcr4、egr2、emp1、gabarapl1、krt16、polr2l、rhoa、rnasek、serinc1、serpinb4。
[0109]
《11》根據《6》或《7》的方法,其中,除了測定選自所述四種基因中的至少一種基因之外,還測定選自下述表3-1~3-4和下述表6-1~6-2所示的基因的至少一種基因(其中,所述四種基因除外。)或其表達產物的表達水平。
[0110]
《12》根據《6》或《7》的方法,其中,除了測定選自所述四種基因中的至少一種基因之外,還測定選自下述表1-1~1-27所示的1005種和下述表4-1~4-20所示的725種中除所述四種基因之外的基因的至少一種基因或其表達產物的表達水平。
[0111]
《13》一種《1》~《10》中任一項的方法中使用的用于檢測帕金森氏病的檢查用試劑盒,其中,含有與所述基因或源自其的核酸特異性雜交的寡核苷酸或識別所述基因的表達產物的抗體。
[0112]
《14》一種選自下述表3-1~3-4和下述表6-1~6-2所示的基因的至少一種基因或其表達產物作為帕金森氏病的檢測標記物的用途。
[0113]
《15》一種選自snora16a、snora24、snora50和rexo1l2p這四種基因中的至少一種基因或其表達產物作為帕金森氏病的檢測標記物的用途。
[0114]
《16》一種帕金森氏病的檢測標記物,其由選自下述表3-1~3-4和下述表6-1~6-2所示的基因的至少一種基因或其表達產物構成。
[0115]
《17》根據《16》的帕金森氏病的檢測標記物,其中,所述檢測標記物由選自snora16a、snora24、snora50和rexo1l2p這四種基因中的至少一種基因或其表達產物構
成。
[0116]
實施例
[0117]
下面,基于實施例對本發明進行更詳細說明,但本發明并不限定于此。
[0118]
實施例1使用從ssl提取的rna檢測帕金森氏病
[0119]
1)ssl采集
[0120]
進行以下的試驗1和試驗2各兩次。
[0121]
試驗1:將15名健康者(40~89歲男女)和15名帕金森氏病患者(pd)(40~89歲男女)作為被檢驗者。
[0122]
試驗2:將50名健康者(40~89歲男)和50名pd(40~89歲男)作為被檢驗者。
[0123]
pd提前由腦神經內科醫診斷為帕金森氏病(hoehn&yahri期或ii期)。使用吸油膜(5
×
8cm,聚丙烯制,3m公司)從各被檢驗者的全臉回收皮脂之后,將該吸油膜轉移至小瓶中,以-80℃保存至用于rna提取,期間約1個月。
[0124]
2)rna制備和測序
[0125]
將上述1)的吸油膜切成適當的大小,使用qiazol裂解試劑(lysis reagent)(qiagen),按照附帶的操作規程提取rna?;谒崛〉膔na,使用superscript vilo cdna合成試劑盒(synthesis kit)(life technologies japan株式會社),以42℃進行90分鐘逆轉錄,進行cdna的合成。逆轉錄反應的引物使用試劑盒所附帶的隨機引物。利用多重pcr,由所得到的cdna制作包含來自20802種基因的dna的文庫。使用ion ampliseq轉錄組人基因表達試劑盒(life technologies japan株式會社),在[99℃、2分鐘

(99℃、15秒

62℃、16分鐘)
×
20次循環

4℃、保持(hold)]的條件下進行多重pcr。所得到的pcr產物用ampure xp(beckman coulter株式會社)精制后,進行緩沖液的重構、引物序列的消化、接頭連接和精制、擴增,制作文庫。將所制作的文庫載入ion 540chip中,使用ion s5/xl系統(life technologies japan株式會社)進行測序。
[0126]
3)數據分析
[0127]
i)rna表達分析1
[0128]
在上述2)中測得的源自被檢驗者的rna的表達量的數據(讀取計數值)中,將讀取計數小于10的數據作為缺失值處理,將表達量的數據轉換為經樣品間的總讀取數的差異校正后的rpm值,然后,使用singular value decomposition(svd)imputation方式對缺失值進行填充。其中,只將在全部樣品的80%以上的樣品中得到了不是缺失值的表達量數據的基因用于以下的分析。分析時,為了使符合負二項分布的rpm值近似正態分布,使用將讀取計數的rpm值轉換成以2為底的對數值的rpm值(log2rpm值)。
[0129]
基于上述得到的來自健康者和pd的ssl的rna表達量(log2rpm值),鑒定與健康者相比pd中student’s t-test的p值為0.05以下的表達變動rna。試驗1中,與健康者相比pd中111種rna表達上升(表1-1~1-3),68種表達下降(表1-4~1-5)。另一方面,試驗2中,565種rna表達上升(表1-6~1-19),294種表達下降(表1-20~1-27)。以上試驗1和試驗2中均表達上升的rna有18種,均表達下降的rna有15種(表中粗體表示的基因)。
[0130]
[表1-1]
[0131][0132]
[表1-2]
[0133][0134]
[表1-3]
[0135][0136]
[表1-4]
[0137][0138]
[表1-5]
[0139][0140]
[表1-6]
[0141][0142]
[表1-7]
[0143][0144]
[表1-8]
[0145]
試驗2creld20.6850454830.009010899up試驗2cript0.6230886610.000802774up試驗2crnn1.4018841120.001214875up
試驗2cst60.5899665310.016466862up試驗2csta0.7842551160.002502729up試驗2cul4a0.4895584050.013487958up試驗2cuta0.5859871270.001016471up試驗2cyb5a0.6419394070.009668198up試驗2cyb5b0.5446801180.005232354up試驗2dancr0.431263360.041709971up試驗2dcaf120.5454546480.011615314up試驗2ddrgk10.3723477480.044309125up試驗2ddt0.4727600040.010925051up試驗2degs10.5459846890.037107489up試驗2dennd2c0.5022887920.047224257up試驗2dhps0.5188456830.012866877up試驗2dhx290.6821061050.006066935up試驗2dhx320.5065092590.033864568up試驗2dhx400.3965736040.015540946up試驗2dnaja10.2525523720.019713754up試驗2dnaja40.4830453510.044641278up試驗2dnajc130.4703629360.029093404up試驗2dnajc150.4692115630.013979287up試驗2dnajc210.4527090720.022814459up試驗2dnajc70.3196763870.022220543up試驗2dnajc90.5751269540.012161694up試驗2dock60.5457197830.03676478up試驗2dock90.6217579860.012261459up試驗2dph11.1580398186.72e-05up試驗2dpy300.3983177570.02828779up試驗2drg10.5812536410.004984247up試驗2dsg10.5673992180.037732972up試驗2dusp110.4733256180.006136292up試驗2dym0.8161785130.00274631up試驗2dync1li10.5832428580.0067388up試驗2dynll10.3746364060.035010075up試驗2dynlrb10.3300536740.027194242up試驗2echs10.3742192630.043974114up試驗2efnb20.6610196930.019887237up試驗2eif1ax0.6005238640.00135969up試驗2eif2s20.6669625340.008564954up
[0146]
[表1-9]
[0147][0148]
[表1-10]
[0149]
試驗2gtf2a20.3303726470.040423351up試驗2gtf2e20.5348550780.004830931up試驗2gtf2h50.6118792080.000741758up
試驗2gtf3c50.3889856630.032287492up試驗2gtf3c60.5628512940.008550842up試驗2h1fx0.382898240.039887459up試驗2hadh0.5968863840.031698277up試驗2hbegf0.358247570.029353225up試驗2hdac10.4129968260.019794177up試驗2hddc20.4810288650.038549638up試驗2heatr5a0.5416757690.004141004up試驗2hexb0.483266380.016112958up試驗2hibadh0.4914099110.028149152up試驗2hibch0.5889438010.025448145up試驗2hist1h1e0.4363344760.040849694up試驗2hist1h2ae0.4720221850.032486571up試驗2hist1h2ag0.5549521960.026912916up試驗2hist1h2ai0.537486170.034833553up試驗2hist1h2am0.5054659220.015356542up試驗2hist1h2bn0.5471503640.019828836up試驗2hist1h3b1.0614769480.000400823up試驗2hist1h3i0.6013093930.011107396up試驗2hist1h4b0.8395444680.00079634up試驗2hist1h4e0.7783350850.00020329up試驗2hist1h4f0.5511757910.032237462up試驗2hist1h4h0.7150817020.000190121up試驗2hmox20.3751245920.032277484up試驗2hnrnpa00.430122240.023849018up試驗2homer10.5720561220.027336542up試驗2hook10.6896474120.000609804up試驗2hpgd0.5314616620.034525209up試驗2hrsp120.7481638860.00429738up試驗2hsd17b100.5255804310.005390788up試驗2hsp90aa10.4506715140.012853222up試驗2hspd10.3535242680.038337878up試驗2hypk0.4955087320.000812946up試驗2ide0.5614864040.030266606up試驗2idh3a0.7157414830.000740982up試驗2ifi271.0887182710.000166105up試驗2il320.6354646480.022927371up試驗2il36a1.1935571690.000147742up
[0150]
[表1-11]
[0151][0152]
[表1-12]
[0153]
試驗2lce3e0.8365639720.000810209up試驗2lcmt10.6018428690.025859542up試驗2lcn20.733257720.003321up
試驗2lemd30.4409940150.016865308up試驗2leprotl10.3778795150.038317178up試驗2linc006750.5735233060.034073972up試驗2llph0.4849982990.007188702up試驗2lmbr10.6650833530.00191151up試驗2lnx10.9527134430.000293549up試驗2loc1005057380.4770537450.024409up試驗2loc5506430.6346724370.002533558up試驗2loc6468620.7475721650.025405318up試驗2lrba0.5292803510.038783597up試驗2lrrc150.9064566720.002321669up試驗2lsm100.5085072420.013416263up試驗2lsm20.6758782850.004242908up試驗2lsm70.5706177640.005193872up試驗2ltf0.7170426620.012011178up試驗2ly6d0.6389092470.038220601up試驗2lynx11.0060122620.002091327up試驗2mafa0.6465098390.018661569up試驗2mal1.1573936950.00203966up試驗2mall1.0828535460.000258882up試驗2maoa0.4894522890.017793881up試驗2map4k30.5674995350.022681249up試驗2map70.5977830190.034525239up試驗2mccc10.6777830160.008565533up試驗2mcts10.4994486750.013734219up試驗2micalcl0.5191282130.00748038up試驗2mnf10.4488900250.045325106up試驗2mphosph60.4314639620.044290704up試驗2mpv170.4620107920.022209637up試驗2mrpl110.4441699530.041198724up試驗2mrpl120.4592607380.023664309up試驗2mrpl240.494230420.034251269up試驗2mrpl320.5705275450.004685957up試驗2mrpl470.5222501560.004855696up試驗2mrps110.7235722330.000171238up試驗2mrps18b0.6066422850.003402311up試驗2mrps240.4246101030.027109976up試驗2mt1x0.9131478160.000517578up
[0154]
[表1-13]
[0155][0156]
[表1-14]
[0157][0158]
[表1-15]
[0159][0160]
[表1-16]
[0161][0162]
[表1-17]
[0163][0164]
[表1-18]
[0165][0166]
[表1-19]
[0167][0168]
[表1-20]
[0169][0170]
[表1-21]
[0171][0172]
[表1-22]
[0173]
試驗2fam53c-0.4146466520.043215387down試驗2fbxo11-0.5875676860.033095048down試驗2fcgrt-0.5931040230.019455764down
試驗2fgr-0.5736045180.025328892down試驗2flna-0.5039784570.020310777down試驗2fnip1-0.5592599470.024530856down試驗2fosb-1.0916223630.000150044down試驗2fosl2-0.7415466330.000377548down試驗2foxn3-0.3546371740.046745405down試驗2foxo4-0.46672230.043783003down試驗2furin-0.4591057150.001341881down試驗2fzr1-0.3641476220.028337243down試驗2gabarapl1-0.555975230.006898537down試驗2gadd45b-0.4704815270.001471104down試驗2gapvd1-0.4103698440.017202036down試驗2gatad2a-0.4270737710.023639602down試驗2gga1-0.3964271180.011108895down試驗2gla-0.4323861630.046129953down試驗2gmip-0.4392554430.025650159down試驗2gnb1-0.318475510.015581144down試驗2gnb2-0.3197211490.049773636down試驗2gpr108-0.4419033220.042000281down試驗2gpx1-0.4190154760.012872784down試驗2gramd1a-0.9322636431.44e-05down試驗2grk6-0.6546154240.008370268down試驗2grn-0.5515009850.014350263down試驗2gtpbp1-0.4035032040.015278622down試驗2hexim1-0.3659865020.049415504down試驗2hipk3-0.4632026590.018014847down試驗2hla.a-1.2367924060.020861464down試驗2hlx-0.6243230890.020911612down試驗2hspa4-0.596232710.022837699down試驗2ids-0.2408814110.028746962down試驗2ier3-0.2875208380.017217201down試驗2impdh1-0.6104056950.010620152down試驗2ino80d-0.375473780.007394184down試驗2inpp5k-0.4233725010.028673174down試驗2iqsec1-0.3904271360.017062257down試驗2irak2-0.6581698820.010698571down試驗2irs2-0.4204968940.042158917down試驗2iscu-0.2878691250.027433296down
[0174]
[表1-23]
[0175][0176]
[表1-24]
[0177]
試驗2nab1-0.416318670.034705696down試驗2nagk-0.4009389580.039418511down試驗2ncf1b-0.6329881610.032521317down
試驗2ncf1c-0.5649584340.023648103down試驗2ncoa1-0.352687490.025504935down試驗2nfkb2-0.6862259060.006490871down試驗2nfkbib-0.4173753310.020054211down試驗2nfkbid-0.5790202160.039512351down試驗2ninj1-0.6665213990.007758421down試驗2nlrc5-0.5182899680.04615466down試驗2notch2nl-0.3805269310.002073988down試驗2nrip1-1.3229583780.002632999down試驗2numb-0.4948707670.00364152down試驗2ogfr-0.4576660830.021935407down試驗2os9-0.4726493910.045293803down試驗2pan3-0.4907597140.037403044down試驗2patl1-0.4254941610.039431793down試驗2pcbp1-0.1768490950.0308842down試驗2pdpk1-0.3517648480.030720043down試驗2per1-0.5202149270.038720114down試驗2pfkfb3-0.3719379970.012048698down試驗2phf1-0.5094904180.018640047down試驗2pik3ap1-0.6304453340.004184868down試驗2pik3r5-0.6124464750.004720621down試驗2pim3-0.4675771740.002878904down試驗2pitpna-0.4744704220.00241514down試驗2plau-0.650310110.029875395down試驗2plekhb2-0.3055830540.044277802down試驗2plekhm3-0.3687944160.029647876down試驗2plin5-0.6769601810.015080446down試驗2ppp1r15a-0.4180723370.005793369down試驗2ppp1r18-0.5062619320.019385963down試驗2ppp2r5c-0.4715076430.029204209down試驗2ppp4r1-0.5786493710.006631286down試驗2prr14-0.460517950.0377872down試驗2prr24-0.394698830.038397986down試驗2prrc2c-0.3832432670.047022553down試驗2ptger4-0.4674315270.024894507down試驗2ptk2b-0.4294048020.005990901down試驗2pttg1ip-0.4815909330.044232468down試驗2rab11fip1-0.224579180.041085596down
[0178]
[表1-25]
[0179][0180]
[表1-26]
[0181][0182]
[表1-27]
[0183]
試驗2xpo6-0.5977093480.046102314down試驗2ypel5-0.2875063770.038298209down試驗2zc3h12a-0.5112174610.009065486down
試驗2zfp36-0.4685061720.020859393down試驗2zmiz1-0.6513370520.00341487down試驗2znfx1-0.4477276120.044337198down試驗2zzef1-0.3562474350.015261504down
[0184]
使用作為公共數據庫的string,進行了利用基因本體(go)富集分析的生物過程(bp)的探索。其結果顯示了,與pd患者中表達上升或者下降的基因關聯的kegg pathway在試驗1中得到30個,試驗2中得到39個,兩個試驗中均包含顯示帕金森氏病的項目hsa05012(parkinson’s disease)(表2-1~2-2)。
[0185]
[表2-1]
[0186][0187]
[表2-2]
[0188][0189]
針對所述表1-1~表1-27所示的試驗1或試驗2中至少任意一項試驗中發現表達變動的基因,就其與帕金森氏病的關聯性對現有文獻進行了確認,結果發現,試驗1中發現表達變動的基因中表3-1中所示的21種和試驗2中發現表達變動的基因中表3-2~3-4所示的92種目前尚未被報告有關它們與帕金森氏病的關聯性,表明它們可以用作帕金森氏病的新型檢測標記物。需要說明的是,表中粗體所表示的基因是試驗1和試驗2中共有的基因。
[0190]
[表3-1]
[0191][0192]
[表3-2]
[0193][0194]
[表3-3]
[0195][0196]
[表3-4]
[0197]
試驗2ino80ddown試驗2kiaa0232down試驗2map7d1down試驗2mllt6down
試驗2ncf1bdown試驗2prr24down試驗2sde2down試驗2sled1down試驗2smg1p1down試驗2tmem167bdown
[0198]
ii)rna表達分析2
[0199]
在上述2)中測得的源自被檢驗者的rna的表達量的數據(讀取計數值)中,使用deseq2方法進行校正。其中,排除未檢測到4161個以上基因的樣品,僅將排除后的全部樣品中被檢驗者的表達量的數據中90%以上的樣品被檢驗者不是缺失值的表達量的數據的基因用于以下分析。分析中使用通過deseq2方法校正后的計數值(標準化計數值)。
[0200]
基于上述得到的來自健康者和pd的ssl的rna表達量(標準化計數值),鑒定與健康者相比pd中似然比檢驗的p值的校正值(fdr)為0.25以下的表達變動rna。試驗1中,與健康者相比pd中74種rna表達上升(表4-1~4-2),209種表達下降(表4-3~4-8)。另一方面,試驗2中,151種rna表達上升(表4-9~4-12),308種表達下降(表4-13~4-20)。以上試驗1和試驗2中均表達上升的rna有7種,均表達下降的rna有10種(表中粗體表示的基因)。
[0201]
[表4-1]
[0202][0203]
[表4-2]
[0204][0205]
[表4-3]
[0206][0207]
[表4-4]
[0208][0209]
[表4-5]
[0210]
試驗1hbp1-1.6914818950.02450771down試驗1helz-2.6898663660.003678702down試驗1hif1a-1.2248277690.238174085down試驗1hint1-1.4537626920.04751536down
試驗1hint3-1.9471520320.140445468down試驗1hist1h1e-1.6701406060.103600407down試驗1hmgn1-2.0631656820.073126006down試驗1hnrnpa2b1-1.2742699150.142104577down試驗1hnrnpk-1.966404370.000238125down試驗1hnrnpu-1.7037156060.009237092down試驗1iars2-2.5025780810.04751536down試驗1icam1-2.3831303110.162465282down試驗1ide-1.8622232740.11590529down試驗1ier3ip1-2.1290408870.191902648down試驗1jak1-2.4784296770.04751536down試驗1jmy-2.2634968730.155218477down試驗1kat2b-1.5502569040.157035049down試驗1kiaa1551-1.3676282590.228182221down試驗1kif16b-1.7120883160.170079315down試驗1klf10-2.5079208550.01186505down試驗1klf3-2.6712240650.011682374down試驗1lgalsl-1.8682460090.165136091down試驗1march7-1.3581428670.242073043down試驗1mbd2-1.9663851720.008794332down試驗1mbd6-2.2431040330.157035049down試驗1mdm2-2.1749801920.067390396down試驗1med13l-1.639028930.104520242down試驗1med19-3.5810059560.007535427down試驗1mrpl15-2.3867658750.094888262down試驗1napa-1.4201334420.067390396down試驗1nr4a2-1.2567726970.231685231down試驗1nrbf2-0.8719163250.124019241down試驗1nrbp1-1.1225308810.242957593down試驗1nsfp1-1.1670247180.104520242down試驗1ogfrl1-1.4596131620.06499322down試驗1p4hb-0.9388007960.184113444down試驗1paip2-1.4844161160.04751536down試驗1pdxk-1.2652832010.246917684down試驗1pgk1-0.9211051780.135858235down試驗1pgrmc2-2.3090100580.142104577down試驗1phf20l1-2.0988093690.18841032down
[0211]
[表4-6]
[0212][0213]
[表4-7]
[0214]
試驗1sertad2-2.0298305020.192395571down試驗1set-1.9374447120.007533471down試驗1sh3bgrl3-0.6633057350.067390396down試驗1slmo2-1.813290580.137966894down
試驗1sms-2.7045178020.045626018down試驗1snap29-1.5900855810.16114262down試驗1snora53-1.5865126850.15598759down試驗1snx13-3.0044749610.000999599down試驗1snx9-1.7799580510.028713164down試驗1srek1ip1-1.8398555190.154290596down試驗1srsf5-0.9841136660.13064644down試驗1ssr2-1.7493372530.146923279down試驗1ssu72-1.2453251920.027093818down試驗1stk24-2.7349185840.000596053down試驗1stt3b-1.9518002280.150544954down試驗1taf10-1.324526470.094888262down試驗1taok1-1.9273490240.030576015down試驗1terf2ip-1.7928636030.084366841down試驗1tlk2-2.6059067070.170106979down試驗1tma7-1.3678951950.028713164down試驗1tmem106b-1.868359980.247784004down試驗1tmem127-1.1907037940.044486644down試驗1tmem167b-1.7967139660.116792089down試驗1tnfsf13b-1.788146540.131657412down試驗1tpgs2-1.8098746690.11590529down試驗1tram1-1.8395460050.092035865down試驗1trip12-1.7254353130.025949689down試驗1trpm7-2.0383577710.182595713down試驗1tsg101-1.0052379890.209643258down試驗1txnl1-1.5498712730.032012546down試驗1ube2a-1.5928299160.088783965down試驗1ube2b-1.4365133640.078520181down試驗1ube2h-3.4058186370.004532329down試驗1usmg5-1.0463901490.136226208down試驗1usp22-1.1815074830.174760541down試驗1usp53-3.7614886130.006574907down試驗1usp6nl-1.791260360.192642777down試驗1usp7-1.9937086290.079281961down試驗1wipf1-2.7424650490.000134039down試驗1wtap-1.4461703370.200942058down試驗1xbp1-1.3261238650.14231193down
[0215]
[表4-8]
[0216]
試驗1ywhaq-3.2301537290.000308536down
試驗1zcrb1-2.4551395760.104520242down試驗1zmat2-1.6355394880.104520242down試驗1znf148-2.2375739810.088783965down
[0217]
[表4-9]
[0218][0219]
[表4-10]
[0220][0221]
[表4-11]
[0222]
試驗2rpl110.2720493570.188973375up試驗2rpl120.2722314470.203917134up試驗2rpl13a0.3328828360.087496195up試驗2rpl180.236319010.203917134up
試驗2rpl210.2340572220.228358936up試驗2rpl260.2751784880.203917134up試驗2rpl270.253619320.203917134up試驗2rpl27a0.2860640330.203917134up試驗2rpl290.2273232010.202573111up試驗2rpl30.2679374050.185751097up試驗2rpl300.223031170.208405568up試驗2rpl320.3666980610.05120094up試驗2rpl350.3531611750.075426886up試驗2rpl360.3218428620.084037369up試驗2rpl36a0.3384768570.089104057up試驗2rpl37a0.4296271490.035341619up試驗2rpl380.3615051450.069516286up試驗2rpl70.4077221450.013807457up試驗2rpl7a0.38652740.033308231up試驗2rplp00.4758366970.00985997up試驗2rplp10.4662274570.019217132up試驗2rplp20.3516413720.151691535up試驗2rps100.2781009190.129200547up試驗2rps120.5572117650.001079959up試驗2rps150.3437735690.061406696up試驗2rps15a0.2413595390.204723138up試驗2rps180.5454563580.003707257up試驗2rps190.3048564290.188426153up試驗2rps210.2992950520.230255192up試驗2rps260.4953755450.056702789up試驗2rps280.3469427630.045753193up試驗2rps30.4679017370.121272078up試驗2rps4x0.4039821390.053047353up試驗2rps50.3604494080.079217394up試驗2rps60.3238630580.083321514up試驗2rps80.2761548050.156533343up試驗2s100a140.776723440.035341619up試驗2s100a70.493515680.203917134up試驗2s100a7a0.821074650.057323067up試驗2s100a90.4152038980.204723138up試驗2sbds0.4336291330.094970832up
[0223]
[表4-12]
[0224][0225]
[表4-13]
[0226][0227]
[表4-14]
[0228][0229]
[表4-15]
[0230][0231]
[表4-16]
[0232]
試驗2grn-0.5357152530.191525939down試驗2gtpbp1-0.463081940.148123279down試驗2hdac7-0.4908420460.248266371down試驗2hla-a-1.1048334250.203917134down
試驗2hpcal1-0.4477926450.216748647down試驗2hs3st6-0.5016631960.207332199down試驗2hspa4-0.9065817830.092289404down試驗2ids-0.2556741670.191525939down試驗2ier3-0.4417385960.034346406down試驗2impdh1-0.6187508530.202573111down試驗2inpp5k-0.391525190.179929185down試驗2irak2-0.9413100190.041102123down試驗2irf1-0.6333287230.219872648down試驗2itga5-0.6141005210.148123279down試驗2itgax-0.5843823780.191525939down試驗2itpk1-0.6816008430.167922188down試驗2junb-0.4056331070.174126215down試驗2kiaa0247-0.433540890.185751097down試驗2kiaa0368-0.3868519050.149347833down試驗2kiaa0494-0.3759613130.203917134down試驗2kiaa1191-0.7595706470.07612678down試驗2klf2-0.8296226720.095805056down試驗2klf6-0.6152370690.032647959down試驗2larp1-0.3716919280.191525939down試驗2lgals3-0.336607040.228358936down試驗2lilrb2-0.7132178290.141991209down試驗2lilrb3-0.5862520860.203917134down試驗2limk2-0.6938711450.19331656down試驗2litaf-0.4725820530.129200547down試驗2loc146880-0.5969533760.248133155down試驗2loc729737-0.6418144220.204723138down試驗2lpcat1-1.0108757420.013807457down試驗2lpin1-0.5208062570.196547493down試驗2lsp1-0.6695553470.066340963down試驗2ltbr-0.7151044480.155367959down試驗2maf1-0.4752688420.232304966down試驗2map4k4-0.5171398430.204723138down試驗2map7d1-0.4495599950.189823772down試驗2mapkapk2-0.4759838180.191525939down試驗2marcks-0.5644912320.18041519down試驗2mboat7-0.7511602660.145937048down
[0233]
[表4-17]
[0234]
試驗2mef2d-0.6264281060.045753193down
試驗2megf9-0.3629997140.203917134down試驗2mepce-0.8646152290.073987946down試驗2metrnl-0.2815068630.183513502down試驗2mgea5-0.3456550870.180032429down試驗2mknk2-0.4103647190.126316838down試驗2mlf2-0.3873930690.075659228down試驗2mllt6-0.8824912180.041252415down試驗2mmp25-0.7437211490.204723138down試驗2msrb1-0.3847338340.160228921down試驗2mthfs-0.578388180.191525939down試驗2mtmr14-0.6903690510.156533343down試驗2myo9b-0.6075026150.191525939down試驗2naa50-0.4447309060.019217132down試驗2nbeal2-0.5359654130.2421585down試驗2ncf1b-0.9295174740.094970832down試驗2nfkb2-0.9265777720.023042585down試驗2nfkbia-0.4946042510.189823772down試驗2nfkbib-0.5802666890.221139649down試驗2nfkbid-0.8613159020.050427226down試驗2nfkbie-0.7309711950.083321514down試驗2ninj1-0.820508450.035341619down試驗2nipbl-0.3908396960.188426153down試驗2nlrc5-0.7943667430.185751097down試驗2notch2nl-0.3343549650.094970832down試驗2nr4a3-0.5891587210.249272492down試驗2ntan1-0.6208257770.126316838down試驗2ogdh-0.4090530890.156533343down試驗2osm-0.6095225220.240103288down試驗2p2ry4-0.8300416870.204723138down試驗sin2-0.4303592530.196505966down試驗2pdhx-0.6814064830.24513842down試驗2pdlim7-0.6462657740.236147723down試驗2per1-0.7150315620.129200547down試驗2pfkl-0.4729249490.189087808down試驗2phf1-0.6160909550.203917134down試驗2pik3ap1-0.7549381390.131526721down試驗2pik3r5-0.6998132380.141991209down試驗2pilra-0.5782936450.221139649down試驗2pim2-0.5438632090.248133155down
試驗2pim3-0.6029223870.032647959down
[0235]
[表4-18]
[0236][0237]
[表4-19]
[0238]
試驗2shisa5-0.703130860.200987694down試驗2shkbp1-0.6100472610.203917134down
試驗2sirpa-0.5120225060.03912317down試驗2slc11a1-0.6563086160.199786172down試驗2slc15a3-0.6372806480.205001407down試驗2slc15a4-0.7162058450.130446509down試驗2slc31a1-0.4516798470.159048563down試驗2slc3a2-0.8285535430.079852349down試驗2slc41a1-1.0107837730.079217394down試驗2slc43a2-0.9401369090.032647959down試驗2slc43a3-0.6906134120.225295536down試驗2slc45a4-0.7490479690.093863146down試驗2slc6a6-0.7584008640.073352416down試驗2smg1p1-0.6932269770.094970832down試驗2snora8-0.5198458060.211019733down試驗2sort1-0.6230315990.050123349down試驗2sphk1-1.1084245010.016355202down試驗2spint2-0.3396701230.203917134down試驗2sqstm1-0.2768872280.240103288down試驗2srebf2-1.2274415480.007293838down試驗2srp54-0.3197710580.248266371down試驗2srrm2-0.4183038810.180898511down試驗2srxn1-0.5829797760.038524973down試驗2stk40-0.4880017790.0381434down試驗2stx11-0.6587240540.205349428down試驗2stx6-0.5136191310.230255192down試驗2stxbp2-0.5085856930.130446509down試驗2tagap-0.8014152080.118903158down試驗2tap1-0.6541260470.218710004down試驗2tcf25-0.4610704980.230255192down試驗2tcirg1-0.8041261360.079217394down試驗2tecpr2-0.8251393880.170236917down試驗2tex264-0.5054906450.227224075down試驗2tle3-0.4661449840.203917134down試驗2tmbim6-0.2912609170.207332199down試驗2tmem123-0.3952426630.05837947down試驗2tmem134-0.4724399080.204723138down試驗2tmem189-0.5636154640.204723138down試驗2tnfaip2-0.8915745630.035341619down試驗2tnfrsf14-0.7226119490.19331656down試驗2tnip1-0.4257196330.122393306down
[0239]
[表4-20]
[0240][0241][0242]
使用公共數據庫string進行基于基因本體(go)富集分析的生物過程(biological process(bp))和kegg pathway搜索。結果表明,與pd患者中表達上升或者下降的基因關聯的kegg pathway在試驗1中得到了30個、試驗2中得到了28個,兩個試驗中均包含顯示帕金森氏病的項目hsa05012(parkinson’s disease)(表5-1~5-2)。
[0243]
[表5-1]
[0244]
[0245][0246]
[表5-2]
[0247]
[0248][0249]
針對所述表4-1~表4-20所示的試驗1或試驗2中至少任意一項中發現表達變動的基因,就其與帕金森氏病的關聯性對現有文獻進行了確認,結果發現,試驗1中發現表達變動的基因中表6-1所示的19種和試驗2中發現表達變動的基因中表6-2所示的30種目前尚未被報告有關它們與帕金森氏病的關聯性,表明它們可以用作帕金森氏病的新型檢測標記物。需要說明的是,表中粗體所表示的基因是試驗1和試驗2中共有的基因。
[0250]
[表6-1]
[0251][0252]
[表6-2]
[0253][0254]
實施例2判別模型的制作和驗證1
[0255]
1)使用數據
[0256]
與實施例1的rna表達分析1相同地,在源自被檢驗者的ssl的rna的表達量的數據(讀取計數值)中,將讀取計數小于10的數據作為缺失值處理,將表達量的數據轉換為經樣品間的總讀取數的差異校正后的rpm值,然后,使用singular value decomposition(svd)imputation方法對缺失值進行填充。其中,只將在全部樣品的80%以上的樣品中得到了不是缺失值的表達量數據的基因用于以下的分析。構建機器學習模型時,為了使符合負二項分布的rpm值近似正態分布,使用轉換成以2為底的對數值的rpm值(log2rpm值)。
[0257]
2)數據集分割
[0258]
在由試驗1的被檢驗者得到的rna譜數據集中,將10名健康者和10名pd共計20名被檢驗者的rna譜數據作為pd預測模型的訓練數據,將剩余10名被檢驗者的rna譜數據作為用
于評價模型精度的測試數據。在由試驗2的被檢驗者得到的rna譜數據集中,將40名健康者和40名pd共計80名被檢驗者的rna譜數據作為pd預測模型的訓練數據,將剩余20名被檢驗者的rna譜數據作為用于評價模型精度的測試數據。
[0259]
3)特征量基因的選擇
[0260]
在實施例1的rna表達分析1中,將與健康者相比試驗1和試驗2中pd患者均表達上升的18種rna和均表達下降的15種rna(表1-1~1-27中粗體表示的基因)選作特征量基因,通過主成分分析將這些表達量的數據轉換為主成分之后,將第1主成分~第10主成分作為說明變量。另外,在試驗1和試驗2中pd患者均表達上升的18種rna和均表達下降的15種rna中,將snora16a、snora24、snora50、rexo1l2p這四種選作特征量基因,通過主成分分析將這些表達量的數據轉換為主成分之后,將第1主成分~第4主成分作為說明變量。
[0261]
4)模型構建
[0262]
將根據選自源自ssl的rna的所述特征量基因的表達量的數據(log2rpm值)得到的各主成分的值用作說明變量,其中,上述表達量的數據為訓練數據;將健康者(hl)和pd用作目標變量,構建預測模型。針對每個待預測項目,使用隨機森林(random forest)、線性核的支持矢量機(svm linear)、rbf核的支持矢量機(svm rbf)、神經網絡(nerural net)、一般線性模型(generalized linear model)、正則化線性判別分析(regularized linear discriminant analysis)、正則化邏輯回歸(regularized logistic regression)這7種算法,進行十折交叉驗證,使預測模型進行學習。在每種算法中,向學習后的模型中輸入根據測試數據的所述特征量基因表達量(log2rpm值)得到的各主成分的值,并計算各預測項目的目標預測值。根據預測值和實測值計算檢測率(recall)、精度(precision)和作為它們的調和平均的f值,并選擇該f值最大的模型作為最佳預測模型。
[0263]
5)結果
[0264]
表7中示出待預測項目的使用算法、檢測率、精度、f值。另外,測試數據中由最佳預測模型中的預測值和實測值制成的混淆矩陣示于圖1。需要說明的是,圖中的數值表示各象限的樣品數。
[0265]
表8中示出使用隨機森林構建模型時各特征量基因的變量重要度的計算結果。
[0266]
使用snora16a、snora24、snora50、rexo1l2p這四種基因的模型的f1在試驗1中為0.67,試驗2中為0.75,綜合試驗1+試驗2后達到0.76,表明其可以預測pd。使用pd患者中上升的18種rna和下降的15種rna這共計33種rna的模型的f1在試驗1中為0.91,試驗2中為0.80,綜合試驗1+試驗2后達到0.82,表明其可以更高精度地預測pd。
[0267]
[表7]
[0268][0269]
rf:隨機森林;svm linear:線性核的支持矢量機;svm rbf:rbf核的支持矢量機;nnet:神經網絡;glm:一般線性模型;rlda:正則化線性判別分析;rlogistic:正則化邏輯回

[0270]
[表8]
[0271][0272]
實施例3判別模型的制作和驗證2
[0273]
1)使用數據
[0274]
與實施例1的rna表達分析2相同地,在源自被檢驗者的ssl的rna的表達量的數據(讀取計數值)中,使用deseq2方法進行校正。其中,排除未檢測到4161個以上基因的樣品,僅將排除后的全部樣品中被檢驗者的表達量的數據中90%以上的樣品被檢驗者不是缺失值的表達量的數據的基因用于以下分析。分析中使用通過deseq2方法校正后的計數值(標準化計數值)。
[0275]
2)數據集分割
[0276]
在由試驗1的被檢驗者得到的rna譜數據集中,將9名健康者和6名pd共計15名被檢驗者的rna譜數據作為pd預測模型的訓練數據,將剩余4名健康者和1名pd共計5名被檢驗者
的rna譜數據作為用于評價模型精度的測試數據。在由試驗2的被檢驗者得到的rna譜數據集中,將37名健康者和35名pd共計72名被檢驗者的rna譜數據作為pd預測模型的訓練數據,將剩余13名健康者和11名pd共計24名被檢驗者的rna譜數據作為用于評價模型精度的測試數據。
[0277]
3)特征量基因的選擇
[0278]
在實施例1的rna表達分析2中,將與健康者相比試驗1和試驗2中pd患者均表達上升或下降的17種rna(表4-1~4-20的粗體表示的基因)選作特征量基因,通過主成分分析將這些表達量的數據轉換為主成分之后,將第1主成分~第4主成分作為說明變量。
[0279]
4)模型構建
[0280]
根據選自源自ssl的rna的所述特征量基因的表達量的數據(標準化計數值加1后制成以2為底的對數值后的值)得到的各主成分的值用作說明變量,其中,上述表達量的數據為訓練數據;將健康者(hl)和pd用作目標變量,構建預測模型。針對每個待預測項目,使用隨機森林(random forest)、線性核的支持矢量機(svm linear)、rbf核的支持矢量機(svm rbf)、神經網絡(nerural net)、一般線性模型(generalized linear model)、正則化線性判別分析(regularized linear discriminant analysis)、正則化邏輯回歸(regularized logistic regression)這7種算法,進行十折交叉驗證,使預測模型進行學習。在每種算法中,向學習后的模型輸入根據測試數據的所述特征量基因表達量(標準化計數值加1并制成以2為底的對數值后的值)得到的各主成分的值,并計算各預測項目的目標預測值。根據預測值和實測值計算檢測率(recall)、精度(precision)和作為它們的調和平均的f值,并選擇該f值最大的模型作為最佳預測模型。
[0281]
5)結果
[0282]
表9中示出待預測項目的使用算法、檢測率、精度、f值。
[0283]
使用在試驗1和試驗2中利用deseq2校正后的似然比檢驗的結果中均表達上升或下降的17種rna的模型的f值在試驗1中為1,在試驗2中達到0.87,表明其可以預測pd。
[0284]
[表9]
[0285][0286]
rf:隨機森林;svm linear:線性核的支持矢量機;svm rbf:rbf核的支持矢量機;nnet:神經網絡;glm:一般線性模型;rlda:正則化線性判別分析;rlogistic:正則化邏輯回歸
[0287]
實施例4判別模型的制作和驗證3
[0288]
1)使用數據
[0289]
與實施例1的rna表達分析2相同地,在源自被檢驗者的ssl的rna的表達量的數據(讀取計數值)中,使用deseq2方法進行校正。其中,排除未檢測到4161個以上基因的樣品,僅將排除后的全部樣品中被檢驗者的表達量的數據中90%以上的樣品被檢驗者不是缺失值的表達量的數據的基因用于以下分析。分析中使用通過deseq2方法校正后的計數值(標準化計數值)。
[0290]
2)數據集分割
[0291]
在由試驗1的被檢驗者得到的rna譜數據集中,將9名健康者和6名pd共計15名被檢驗者的rna譜數據作為pd預測模型的訓練數據,剩余4名健康者和1名pd共計5名被檢驗者的rna譜數據作為用于評價模型精度的測試數據。在由試驗2的被檢驗者得到的rna譜數據集中,將37名健康者和35名pd共計72名被檢驗者的rna譜數據作為pd預測模型的訓練數據,剩余13名健康者和11名pd共計24名被檢驗者的rna譜數據作為用于評價模型精度的測試數據。
[0292]
3)特征量基因的選擇
[0293]
在實施例1的rna表達分析2中,將與健康者相比在試驗1中pd患者表達上升或者下降的19種rna(表6-1所示的基因)、或與健康者相比在試驗2中pd患者表達上或者下降的30種rna(表6-2所示的基因)選作特征量基因,通過主成分分析將這些表達量的數據轉換為主成分之后,將第1主成分~第4主成分作為說明變量。
[0294]
4)模型構建
[0295]
將根據選自源自ssl的rna的所述特征量基因的表達量的數據(標準化計數值加1并制成以2為底的對數值后的值)得到的各主成分的值用作說明變量,上述表達量的數據為訓練數據;將健康者(hl)和pd用作目標變量,構建預測模型。針對每個待預測項目,使用隨機森林(random forest)、線性核的支持矢量機(svm linear)、rbf核的支持矢量機(svm rbf)、神經網絡(nerural net)、一般線性模型(generalized linear model)、正則化線性判別分析(regularized linear discriminant analysis)、正則化邏輯回歸(regularized logistic regression)這7種算法,進行十折交叉驗證,使預測模型進行學習。在每種算法中,向學習后的模型輸入根據測試數據的所述特征量基因表達量(標準化計數值加1并制成以2為底的對數值后的值)得到的各主成分的值,并計算各預測項目的目標預測值。根據預測值和實測值計算檢測率(recall)、精度(precision)和作為它們的調和平均的f值,并選擇該f值最大的模型作為最佳預測模型。
[0296]
5)結果
[0297]
表10、表11中示出待預測項目的使用算法、檢測率、精度、f值。
[0298]
使用試驗1中通過deseq2校正后的似然比檢驗的結果中,表達上升或下降的rna中目前未報道與帕金森氏病的關聯性的19種rna的模型的f值為1,表明可以預測pd。使用在試驗2中通過deseq2校正后的似然比檢驗的結果中,表達上升或下降的rna中目前尚未報道與帕金森氏病的關聯性的30種rna的模型的f值為0.87,表明可以預測pd。
[0299]
[表10]
[0300][0301]
rf:隨機森林;svm linear:線性核的支持矢量機;svm rbf:rbf核的支持矢量機;nnet:神經網絡;glm:一般線性模型;rlda:正則化線性判別分析;rlogistic:正則化邏輯回歸
[0302]
[表11]
[0303][0304]
rf:隨機森林;svm linear:線性核的支持矢量機;svm rbf:rbf核的支持矢量機;nnet:神經網絡;glm:一般線性模型;rlda:正則化線性判別分析;rlogistic:正則化邏輯回歸
[0305]
實施例5判別模型的制作和驗證4
[0306]
1)使用數據
[0307]
與實施例1的rna表達分析1相同地,在源自被檢驗者的ssl的rna的表達量的數據(讀取計數值)中,將讀取計數小于10的數據作為缺失值處理,將表達量的數據轉換為經樣品間的總讀取數的差異校正后的rpm值,然后,使用singular value decomposition(svd)imputation方法對缺失值進行填充。其中,只將在全部樣品的80%以上的樣品中得到了不是缺失值的表達量數據的基因用于以下的分析。構建機器學習模型時,為了使符合負二項分布的rpm值近似正態分布,使用轉換為以2為底的對數值的rpm值(log2rpm值)。
[0308]
2)數據集分割
[0309]
在由試驗1的被檢驗者得到的rna譜數據集中,將10名健康者和10名pd共計20名被檢驗者的rna譜數據作為pd預測模型的訓練數據,將剩余10名被檢驗者的rna譜數據作為用于評價模型精度的測試數據。在由試驗2的被檢驗者得到的rna譜數據集中,將40名健康者和40名pd共計80名被檢驗者的rna譜數據作為pd預測模型的訓練數據,將剩余20名被檢驗者的rna譜數據作為用于評價模型精度的測試數據。
[0310]
3)特征量基因的選擇
[0311]
在實施例1的rna表達分析1中,將與健康者相比在試驗1中pd患者表達上升或者下降的21種rna(表3-1所示的基因)、或與健康者相比在試驗2中pd患者表達上升或者下降的92種rna(表3-2~3-4所示的基因)選作特征量基因,通過主成分分析將這些表達量的數據轉換為主成分之后,將第1主成分~第4主成分作為說明變量。
[0312]
4)模型構建
[0313]
將根據選自源自ssl的rna的所述特征量基因的表達量的數據(log2rpm值)得到的各主成分的值用作說明變量,其中,上述表達量的數據為訓練數據;將健康者(hl)和pd用作目標變量,構建預測模型。針對每個待預測項目,使用隨機森林(random forest)、線性核的支持矢量機(svm linear)、rbf核的支持矢量機(svm rbf)、神經網絡(nerural net)、一般線性模型(generalized linear model)、正則化線性判別分析(regularized linear discriminant analysis)、正則化邏輯回歸(regularized logistic regression)這7種算法,進行十折交叉驗證,使預測模型進行學習。在每種算法中,向學習后的模型輸入根據測試數據的所述特征量基因表達量(log2rpm值)得到的各主成分的值,并計算各預測項目的目標預測值。根據預測值和實測值計算檢測率(recall)、精度(precision)和作為它們的調和平均的f值,并選擇該f值最大的模型作為最佳預測模型。
[0314]
5)結果
[0315]
表12、表13中示出待預測項目的使用算法、檢測率、精度、f值。
[0316]
使用試驗1中通過log2rpm校正后的檢驗結果中,表達上升或者下降的rna中目前尚未報道與帕金森氏病的關聯性的21種rna的模型的f值為0.91,表明其可以預測pd。使用試驗2中通過log2rpm校正后的檢驗結果中,表達上升或者下降的rna中目前尚未報道與帕金森氏病的關聯性的92種rna的模型的f值為0.9,表明其可以預測pd。
[0317]
[表12]
[0318][0319]
rf:隨機森林;svm linear:線性核的支持矢量機;svm rbf:rbf核的支持矢量機;nnet:神經網絡;glm:一般線性模型;rlda:正則化線性判別分析;rlogistic:正則化邏輯回歸
[0320]
[表13]
[0321][0322]
rf:隨機森林;svm linear:線性核的支持矢量機;svm rbf:rbf核的支持矢量機;nnet:神經網絡;glm:一般線性模型;rlda:正則化線性判別分析;rlogistic:正則化邏輯回歸

技術特征:


1.一種被檢驗者的帕金森氏病的檢測方法,其包括:對于從被檢驗者采集的生物試樣,測定選自snora16a、snora24、snora50和rexo1l2p這四種基因中的至少一種基因或其表達產物的表達水平的工序。2.如權利要求1所述的帕金森氏病的檢測方法,其中:至少包括測定snora24基因或其表達產物的表達水平。3.如權利要求1或2所述的方法,其中:基因或其表達產物的表達水平的測定為mrna的表達量的測定。4.如權利要求1~3中任一項所述的方法,其中:基因或其表達產物為所述被檢驗者的皮膚表層脂質中所含的rna。5.如權利要求1~4中任一項所述的方法,其中:將表達水平的測定值與所述各基因或其表達產物的參照值比較,評價存在或不存在帕金森氏病。6.如權利要求1~4中任一項所述的方法,其中:將來自帕金森氏病患者的所述基因或其表達產物的表達水平和源自健康者的所述基因或其表達產物的表達水平的測定值作為訓練樣品,制作能夠區分帕金森氏病患者和健康者的判別式,將由從被檢驗者采集的生物試樣得到的所述基因或其表達產物的表達水平的測定值代入該判別公式,將得到的結果與參照值比較,以評價被檢驗者存在或不存在帕金森氏病。7.如權利要求6所述的方法,其中:測定所述四種基因中的所有基因或其表達產物的表達水平。8.如權利要求6或7所述的方法,其中:除了測定選自所述四種基因中的至少一種基因之外,還測定選自下述29種基因中的至少一種基因或其表達產物的表達水平:ankrd12、c10orf116、ccl3、ccni、cd83、cnfn、cnn2、csf2rb、cxcr4、egr2、emp1、itgax、kcnq1ot1、lce3d、litaf、ndufa4l2、ndufs5、polr2l、rhoa、rnasek、rpl7a、rps26、serinc1、serp1、serpinb4、slc25a3、snrpg、srrm2、uqcrh。9.如權利要求8所述的方法,其中:除了測定選自所述四種基因中的至少一種基因之外,還測定選自下述10種基因中的至少一種基因或其表達產物的表達水平:ccl3、ccni、cxcr4、egr2、emp1、polr2l、rhoa、rnasek、serinc1、serpinb4。10.如權利要求6或7所述的方法,其中:除了測定選自所述四種基因中的至少一種基因之外,還測定選自下述表1-1~1-27所示的1005種和下表4-1~4-20所示的725種中除所述四種基因之外的基因的至少一種基因或其表達產物的表達水平,
11.一種用于檢測帕金森氏病的檢查用試劑盒,其能夠在權利要求1~9中任一項所述的方法中使用,該檢查用試劑盒中:含有與所述基因或源自其的核酸特異性雜交的寡核苷酸或識別所述基因的表達產物的抗體。12.一種帕金森氏病的檢測標記物,其中:
由選自下表3-1~3-4及下表6-1~6-2所示的基因的至少一種基因或其表達產物構成,
13.如權利要求12所述的帕金森氏病的檢測標記物,其中,所述檢測標記物由選自snora16a、snora24、snora50和rexo1l2p的四種基因中的至少一種基因或其表達產物構成。

技術總結


本發明提供一種用于檢測帕金森氏病的標記基因和使用該標記基因的帕金森氏病的檢測方法。一種被檢驗者的帕金森氏病的檢測方法,包括:對于從被檢驗者采集的生物試樣,測定選自SORA16A、SORA24、SORA50和REXO1L2P這四種基因中的至少一種基因或其表達產物的表達水平的工序。達水平的工序。


技術研發人員:

上原裕也 井上高良 服部信孝 齊木臣二 上野真一 竹重遙香

受保護的技術使用者:

學校法人順天堂

技術研發日:

2021.05.14

技術公布日:

2023/1/13


文章投稿或轉載聲明

本文鏈接:http://m.newhan.cn/zhuanli/patent-1-83888-0.html

來源:專利查詢檢索下載-實用文體寫作網版權所有,轉載請保留出處。本站文章發布于 2023-01-28 05:54:38

發表評論

驗證碼:
用戶名: 密碼: 匿名發表
評論列表 (有 條評論
,2人圍觀
參與討論