本文作者:kaifamei

一種輔助診斷癌癥的潛在分子標志物的制作方法

更新時間:2025-12-27 04:36:35 0條評論

一種輔助診斷癌癥的潛在分子標志物的制作方法



1.本發明涉及醫學領域,特別涉及一種輔助診斷癌癥的潛在分子標志物。


背景技術:



2.乳腺癌為乳腺上皮細胞發生增殖失控引起的惡性腫瘤。一方面,乳腺癌在世界范圍內為女性最常見的惡性腫瘤之一,發病率位居女性惡性腫瘤首位。另一方面,乳腺癌的生存率與腫瘤類別和分期有關。早期階段乳腺癌5年生存預后通常高于60%,但是對于晚期乳腺癌,該數值降至40-60%。對于轉移性乳腺癌,5年生存預后通常為約15%。因此,提高乳腺癌早期檢出率對乳腺癌后期有效診治十分必要?,F階段,臨床醫學對乳腺癌的早期篩查診斷主要有影像學和病理學兩種方式。影像學診斷中b型超聲成像無輻射,但是受超聲成像機理限制,該方法對體積較小、回聲改變不明顯的病灶分辨率較差,容易漏診。乳腺鉬靶檢查技術為一種低劑量乳腺x光拍攝乳房技術,它能清晰顯示乳腺各層組織結構情況,但乳腺鉬靶檢查有較高假陽性率,需要對患者乳腺進行穿刺以進行更準確判斷,此外乳腺鉬靶對患者還存在電離輻射等危害。乳腺核磁共振成像利用磁能和無線電波查看乳腺組織并生成內部圖像的技術,主要適用于乳腺癌高危人篩查。病理學診斷主要有乳腺活檢,是指取病變組織進行病理診斷的方法,然而活檢手術因對人有創傷令患者十分抗拒。此外,還有一些常用腫瘤標志物,如腫瘤抗原15-3、腫瘤抗原27.29、癌胚抗原、腫瘤抗原125和循環腫瘤細胞等被用于乳腺癌診斷,但其特異性和靈敏度有待提高,一般結合影像學研究使用。因此,更為敏感、特異的早期乳腺癌分子標記亟待發掘。
3.肺癌為一種發生于支氣管粘膜上皮的惡性腫瘤,近幾十年來,其發病率和死亡率一直呈上升趨勢,是全世界發病率和死亡率最高的癌癥。盡管最近幾年來在診斷方法、手術技術及化療藥物等方面均有新的進展,但肺癌患者總的5年生存率僅為16%,主要是由于大部分肺癌患者就診時已發生轉移從而失去了手術根治機會。研究表明,肺癌預后與分期直接相關,i期肺癌5年生存率為83%,ii期為53%,iii期為26%,iv期為6%。因此,降低肺癌患者死亡率的關鍵在于早診斷早。
4.目前主要的肺癌診斷方法有如下幾種:1、影像學方法:例如,胸部x射線和低劑量螺旋ct。但胸部x射線很難發現早期肺癌。低劑量螺旋ct雖然可以發現肺內小結節,但是假陽性率高達96.4%,給被檢查者帶來不必要的心理負擔。同時,胸部x射線和低劑量螺旋ct由于輻射原因不宜頻繁使用。另外,影像學方法也往往受設備和醫生經驗,及有效讀片時間影響。2、細胞學方法:例如,痰液細胞學檢查、支氣管鏡下刷片或取活檢、支氣管肺泡灌洗液細胞學檢查等。痰液細胞學檢查和支氣管鏡下刷片或取活檢對于周圍性肺癌的靈敏度較低。同時,支氣管鏡下刷片或取活檢、支氣管肺泡灌洗液細胞學檢查操作比較繁瑣,且體檢者舒適度不佳。3、目前常用的血清腫瘤標志物:癌胚抗原(cea)、糖類抗原(ca125/153/199)、細胞角蛋白19片段抗原(cyfra21-1)和神經元特異性烯醇化酶(nse)等。這些血清腫瘤標志物對肺癌的靈敏度有限,一般為30%-40%,對于i期腫瘤甚至更低。而且腫瘤特異性也比較有限,受許多良性病變如良性腫瘤、炎癥、退行性疾病等影響。目前,腫瘤標志物主要
用于惡性腫瘤篩查和腫瘤效果復查。因此需要進一步開發高效特異的肺癌早期診斷技術。
5.目前,國際公認的肺部結節診斷的最有效方法是胸部低劑量螺旋ct篩查。但是低劑量螺旋ct靈敏度高,能發現大量小結節,卻難以進行良惡性判別。在發現的小結節中,惡性的比例還不到4%。目前,臨床上對肺結節的良惡性鑒定需要長期隨訪、反復ct檢查或者依賴肺部結節活組織取樣(包括胸壁細針穿刺活檢、支氣管鏡組織活檢、胸腔鏡或開胸手術肺活檢)等創傷性檢查方法。ct引導或超聲引導經胸穿刺活檢有較高的靈敏度,但對于《2cm的結節診斷率較低,有30~70%漏診率,且氣胸和出血發生率較高。氣管鏡針吸活檢并發癥發生率相對較低,但對周圍型結節診斷率有限,對≤2cm的結節診斷率僅為34%,大于2cm的結節診斷率為63%。手術切除診斷率高且可直接對結節進行處理,但會造成患者肺功能出現短暫減退,若結節為良性,則患者進行了不必要的手術,導致了過度醫療。因此,目前迫切需要新的體外診斷分子標志物來輔助進行肺部結節鑒別,在降低漏診率的同時也盡量減少不必要穿刺或者手術。
6.dna甲基化是基因上重要的一種化學修飾,影響著基因轉錄的調控過程和細胞核結構。dna甲基化的改變是癌癥發展的早期事件和伴隨事件,主要體現在腫瘤組織上抑癌基因的高甲基化和原癌基因的低甲基化等。但是血液中的dna甲基化跟腫瘤發生發展的相關性則報道的較少。此外,血液容易收集,dna甲基化較穩定,如果可以發現腫瘤特異的血液dna甲基化分子標志物則有巨大臨床應用價值。因此,探索和開發適用于臨床檢測需要的血液dna甲基化診斷技術對提高肺癌和乳腺癌早期診療效果和降低死亡率均有重要的臨床應用價值和社會意義。


技術實現要素:



7.本發明的目的是提供一種用于輔助診斷癌癥的cd44基因(cd44 molecule,cd44)甲基化標志物及試劑盒。
8.第一方面,本發明要求保護甲基化cd44基因作為標志物在制備產品中的應用。所述產品的用途為如下中的至少一種:
9.(1)輔助診斷癌癥或預測癌癥患病風險;
10.(2)輔助區分良性結節和癌癥;
11.(3)輔助區分癌癥不同亞型;
12.(4)輔助區分癌癥不同分期;
13.(5)輔助診斷肺癌或預測肺癌患病風險;
14.(6)輔助區分肺部良性結節和肺癌;
15.(7)輔助區分肺癌不同亞型;
16.(8)輔助區分肺癌不同分期;
17.(9)輔助診斷乳腺癌或預測乳腺癌患病風險;
18.(10)輔助區分乳腺癌不同分期;
19.(11)輔助區分肺癌和乳腺癌;
20.(12)確定待測物對癌癥的發生是否存在阻礙或促進作用。
21.進一步地,(1)中所述輔助診斷癌癥具體可體現為如下中的至少一種:輔助區分癌
癥患者和無癌對照(可理解為現在及曾經均沒有患過癌癥且沒有報告肺部或乳腺良性結節且血常規指標都在參考范圍內);輔助區分不同癌癥。
22.進一步地,(2)中所述良性結節為(2)中所述癌癥對應的良性結節,如肺部良性結節和肺癌。
23.進一步地,(3)中所述癌癥不同亞型可為病理分型,如組織學分型。
24.進一步地,(4)中所述癌癥不同分期可為臨床分期或tnm分期。
25.在本發明的具體實施方式中,(5)中所述輔助診斷肺癌具體體現為如下中的至少一種:可輔助區分肺癌患者和無癌對照、可輔助區分肺腺癌患者和無癌對照、可輔助區分肺鱗癌患者和無癌對照、可輔助區分小細胞肺癌患者和無癌對照、可輔助區分i期肺癌患者和無癌對照、可輔助區分ii-iii期肺癌患者和無癌對照、可輔助區分無淋巴結浸潤的肺癌患者和無癌對照、可輔助區分有淋巴結浸潤的肺癌患者和無癌對照。其中,所述無癌對照可理解為現在及曾經均沒有患過癌癥且沒有報告肺部或乳腺良性結節且血常規指標都在參考范圍內。
26.在本發明的具體實施方式中,(6)中所述輔助區分肺部良性結節和肺癌具體體現為如下中的至少一種:可輔助區分肺癌和肺部良性結節、可輔助區分肺腺癌和肺部良性結節、可輔助區分肺鱗癌和肺部良性結節、可輔助區分小細胞肺癌和肺部良性結節、可輔助區分i期肺癌和肺部良性結節、可輔助區分ii-iii期肺癌和肺部良性結節、可輔助區分無淋巴結浸潤的肺癌和肺部良性結節、可輔助區分有淋巴結浸潤的肺癌和肺部良性結節。
27.在本發明的具體實施方式中,(7)中所述輔助區分肺癌不同亞型具體體現為:可輔助區分肺腺癌、肺鱗癌和小細胞肺癌中的任意兩種。
28.在本發明的具體實施方式中,(8)中所述輔助區分肺癌不同分期具體體現為如下中的至少一種:可輔助區分t1期肺癌、t2期肺癌和t3肺癌中的任意兩種;可輔助區分無淋巴結浸潤的肺癌和有淋巴結浸潤的肺癌;可輔助區分臨床i期肺癌、臨床ii期肺癌和臨床iii期肺癌中的任意兩種。
29.在本發明的具體實施方式中,(9)中所述輔助診斷乳腺癌具體體現為如下中的至少一種:可輔助區分乳腺癌患者和無癌女性對照。其中,所述無癌女性對照可理解為現在及曾經均沒有患過癌癥且沒有報告肺部或乳腺良性結節且血常規指標都在參考范圍內。
30.在本發明的具體實施方式中,(10)中所述輔助區分乳腺癌不同分期具體體現為如下中的至少一種:可輔助區分t1期乳腺癌、t2期乳腺癌和t3乳腺癌中的任意兩種;可輔助區分無淋巴結浸潤的乳腺癌和有淋巴結浸潤的乳腺癌;可輔助區分臨床i期乳腺癌、臨床ii期乳腺癌和臨床iii期乳腺癌中的任意兩種。
31.在上述(1)-(12)中,所述癌癥可為能夠引起機體內cd44基因甲基化水平降低的癌癥,如肺癌、乳腺癌等。
32.第二方面,本發明要求保護用于檢測cd44基因甲基化水平的物質在制備產品中的應用;所述產品的用途為前文(1)-(12)中的至少一種。
33.第三方面,本發明要求保護用于檢測cd44基因甲基化水平的物質和記載有數學模型建立方法和/或使用方法的介質在制備產品中的應用;所述產品的用途為前文(1)-(12)中的至少一種。
34.所述數學模型可按照包括如下步驟的方法獲得:
35.(a1)分別檢測n1個a類型樣本和n2個b類型樣本的cd44基因甲基化水平(訓練集)。
36.(a2)取步驟(a1)獲得的所有樣本的cd44基因甲基化水平數據,按照a類型和b類型的分類方式,通過二分類邏輯回歸法建立數學模型,確定分類判定的閾值。
37.所述數學模型的使用方法可包括如下步驟:
38.(b1)檢測待測樣本的cd44基因甲基化水平;
39.(b2)將步驟(b1)獲得的所述待測樣本的cd44基因甲基化水平數據代入所述數學模型,得到檢測指數;然后比較檢測指數和閾值的大小,根據比較結果確定所述待測樣本的類型是a類型還是b類型。
40.在本發明的具體實施方式中,所述閾值設為0.5。大于0.5歸為一類,小于0.5歸為另外一類,等于0.5作為不確定的灰區。其中a類型和b類型為相對應的兩分類,二分類的分組,哪一組是a類型,哪一組是b類型,要根據具體的數學模型來確定,無需約定。
41.在實際應用中,所述閾值也可根據最大約登指數確定(具體可為最大約登指數對應的數值)。大于閾值歸為一類,小于閾值歸為另外一類,等于閾值作為不確定的灰區。其中a類型和b類型為相對應的兩分類,二分類的分組,哪一組a類型,哪一組是b類型,要根據具體的數學模型來確定,無需約定。
42.所述a類型樣本和所述b類型樣本可為如下中的任一種:
43.(c1)肺癌樣本和無癌對照;
44.(c2)肺癌樣本和肺良性結節樣本;
45.(c3)肺癌不同亞型樣本;
46.(c4)肺癌不同分期樣本;
47.(c5)肺癌樣本和乳腺癌樣本;
48.(c6)乳腺癌樣本和無癌女性對照;
49.(c7)乳腺癌不同分期樣本。
50.第四方面,本發明要求保護前文第三方面中所述的“記載有數學模型建立方法和/或使用方法的介質”在制備產品中的應用;所述產品的用途為前文(1)-(12)中的至少一種。
51.第五方面,本發明要求保護一種試劑盒。
52.本發明要求保護的試劑盒包括用于檢測cd44基因甲基化水平的物質;所述試劑盒的用途為前文(1)-(12)中的至少一種。
53.進一步地,所述試劑盒中還含有前文第三方面或第四方面中所述的“記載有數學模型建立方法和/或使用方法的介質”。
54.第六方面,本發明要求保護一種系統。
55.本發明要求保護的系統,包括:
56.(d1)用于檢測cd44基因甲基化水平的試劑和/或儀器;
57.(d2)裝置,所述裝置包括單元x和單元y。
58.所述單元x用于建立數學模型,包括數據采集模塊、數據分析處理模塊和模型輸出模塊。
59.所述數據采集模塊被配置為采集(d1)檢測得到的n1個a類型樣本和n2個b類型樣本的cd44基因甲基化水平數據。
60.所述數據分析處理模塊被配置為接收來自于所述數據采集模塊發送的所述n1個a
類型樣本和n2個b類型樣本的cd44基因甲基化水平數據,按照a類型和b類型的分類方式,通過二分類邏輯回歸法建立數學模型,確定分類判定的閾值。
61.所述模型輸出模塊被配置為接收來自于所述數據分析處理模塊建立的所述數學模型,并進行輸出。
62.所述單元y用于確定待測樣本類型,包括數據輸入模塊、數據運算模塊、數據比較模塊和結論輸出模塊。
63.所述數據輸入模塊被配置為輸入(d1)檢測得到的待測者的cd44基因甲基化水平數據。
64.所述數據運算模塊被配置為接收來自于所述數據輸入模塊發送的所述待測者的cd44基因甲基化水平數據,并將所述待測者的cd44基因甲基化水平數據代入所述單元x中的所述數據分析處理模塊建立的所述數學模型,計算得到檢測指數。
65.所述數據比較模塊被配置為接收來自于所述數據運算模塊發送的所述檢測指數,并將所述檢測指數與所述單元x中的所述數據分析處理模塊中確定的所述閾值進行比較。
66.所述結論輸出模塊被配置為接收來自于所述數據比較模塊發送的比較結果,并根據所述比較結果輸出所述待測樣本的類型是a類型還是b類型的結論。
67.所述a類型樣本和所述b類型樣本為如下中的任一種:
68.(c1)肺癌樣本和無癌對照;
69.(c2)肺癌樣本和肺良性結節樣本;
70.(c3)肺癌不同亞型樣本;
71.(c4)肺癌不同分期樣本;
72.(c5)肺癌樣本和乳腺癌樣本;
73.(c6)乳腺癌樣本和無癌女性對照;
74.(c7)乳腺癌不同分期樣本。
75.其中,n1和n2均可為50以上正整數。
76.在本發明的具體實施方式中,所述閾值設為0.5。大于0.5歸為一類,小于0.5歸為另外一類,等于0.5作為不確定的灰區。其中a類型和b類型為相對應的兩分類,二分類的分組,哪一組是a類型,哪一組是b類型,要根據具體的數學模型來確定,無需約定。
77.在實際應用中,所述閾值也可根據最大約登指數確定(具體可為最大約登指數對應的數值)。大于閾值歸為一類,小于閾值歸為另外一類,等于閾值作為不確定的灰區。其中a類型和b類型為相對應的兩分類,二分類的分組,哪一組是a類型,哪一組是b類型,要根據具體的數學模型來確定,無需約定。
78.在上述各方面中,所述cd44基因甲基化水平為cd44基因中如下(e1)-(e3)所示片段中全部或部分cpg位點的甲基化水平。所述甲基化cd44基因為cd44基因中如下(e1)-(e3)所示片段中全部或部分cpg位點甲基化。
79.(e1)seq id no.1所示的dna片段或與其具有80%以上同一性的dna片段;
80.(e2)seq id no.2所示的dna片段或與其具有80%以上同一性的dna片段;
81.(e3)seq id no.3所示的dna片段或與其具有80%以上同一性的dna片段。
82.進一步地,所述“全部或部分cpg位點”為cd44基因中seq id no.1至seq id no.3所示3個dna片段中的任意一個或多個cpg位點。此處所述“多個cpg位點”的上限為cd44基因
中seq id no.1至seq id no.3所示3個dna片段中所有cpg位點。seq id no.1所示的dna片段中所有cpg位點見表1,seq id no.2所示的dna片段中所有cpg位點見表2,seq id no.3所示的dna片段中所有cpg位點見表3。
83.或,所述“全部或部分cpg位點”為seq id no.1所示的dna片段中所有cpg位點(見表1)和seq id no.2所示的dna片段中所有cpg位點(見表2);
84.或,所述“全部或部分cpg位點”為seq id no.1所示的dna片段中所有cpg位點(見表1)和seq id no.3所示的dna片段中所有cpg位點(見表3);
85.或,所述“全部或部分cpg位點”為seq id no.2所示的dna片段中所有cpg位點(見表2)和seq id no.3所示的dna片段中所有cpg位點(見表3);
86.或,所述“全部或部分cpg位點”為seq id no.1所示的dna片段中所有cpg位點(見表1)和seq id no.2所示的dna片段中所有cpg位點(見表2)和seq id no.3所示的dna片段中所有cpg位點(見表3);
87.或,所述“全部或部分cpg位點”為cd44基因中所述seq id no.3所示的dna片段中的全部或任意6個或任意5個或任意4個或任意3個或任意2個或任意1個;
88.或,所述“全部或部分cpg位點”為seq id no.3所示的dna片段中如下5項所示cpg位點的全部或任意4項或任意3項或任意2項或任意1項:
89.(f1)seq id no.3所示的dna片段自5’端第130-131位所示cpg位點(cd44_c_2);
90.(f2)seq id no.3所示的dna片段自5’端第158-159位所示cpg位點(cd44_c_3);
91.(f3)seq id no.3所示的dna片段自5’端第198-199位所示cpg位點(cd44_c_4);
92.(f4)seq id no.3所示的dna片段自5’端第316-317位所示cpg位點(cd44_c_5);
93.(f5)seq id no.3所示的dna片段自5’端第346-347位所示cpg位點(cd44_c_6)。
94.在上述各方面中,所述用于檢測cd44基因甲基化水平的物質可包含(或為)用于擴增cd44基因全長或部分片段的引物組合。所述用于檢測cd44基因甲基化水平的試劑可包含(或為)用于擴增cd44基因全長或部分片段的引物組合。所述用于檢測cd44基因甲基化水平的儀器可為飛行時間質譜檢測儀。當然所述用于檢測cd44基因甲基化水平的試劑中還可包含進行飛行時間質譜所用的其他常規試劑。
95.進一步地,所述部分片段可為如下中至少一個片段:
96.(g1)seq id no.1所示的dna片段或其包含的dna片段;
97.(g2)seq id no.2所示的dna片段或其包含的dna片段;
98.(g3)seq id no.3所示的dna片段或其包含的dna片段;
99.(g4)與seq id no.1所示的dna片段或其包含的dna片段具有80%以上同一性的dna片段;
100.(g5)與seq id no.2所示的dna片段或其包含的dna片段具有80%以上同一性的dna片段;
101.(g6)與seq id no.3所示的dna片段或其包含的dna片段具有80%以上同一性的dna片段;
102.更進一步地,所述引物組合可為引物對a和/或引物對b和/或引物對c。
103.所述引物對a為引物a1和引物a2組成的引物對;所述引物a1為seq id no.4或seq id no.4的第11-35位核苷酸所示的單鏈dna;所述引物a2為seq id no.5或seq id no.5的
第32-56位核苷酸所示的單鏈dna。
104.所述引物對b為引物b1和引物b2組成的引物對;所述引物b1為seq id no.6或seq id no.6的第11-35位核苷酸所示的單鏈dna;所述引物b2為seq id no.7或seq id no.7的第32-56位核苷酸所示的單鏈dna。
105.所述引物對c為引物c1和引物c2組成的引物對;所述引物c1為seq id no.8或seq id no.8的第11-35位核苷酸所示的單鏈dna;所述引物c2為seq id no.9或seq id no.9的第32-56位核苷酸所示的單鏈dna。
106.另外,本發明還要求保護一種區分待測樣本為a類型樣本還是b類型樣本的方法。該方法可包括如下步驟:
107.(a)可按照包括如下步驟的方法建立數學模型:
108.(a1)分別檢測n1個a類型樣本和n2個b類型樣本的cd44基因甲基化水平(訓練集);
109.(a2)取步驟(a1)獲得的所有樣本的cd44基因甲基化水平數據,按照a類型和b類型的分類方式,通過二分類邏輯回歸法建立數學模型,確定分類判定的閾值。
110.其中,(a1)中的n1和n2均為50以上的正整數。
111.(b)可按照包括如下步驟的方法確定所述待測樣本為a類型樣本還是b類型樣本:
112.(b1)檢測所述待測樣本的cd44基因甲基化水平;
113.(b2)將步驟(b1)獲得的所述待測樣本的cd44基因甲基化水平數據代入所述數學模型,得到檢測指數;然后比較檢測指數和閾值的大小,根據比較結果確定所述待測樣本的類型是a類型還是b類型。
114.在本發明的具體實施方式中,所述閾值設為0.5。大于0.5歸為一類,小于0.5歸為另外一類,等于0.5作為不確定的灰區。其中a類型和b類型為相對應的兩分類,二分類的分組,哪一組是a類型,哪一組是b類型,要根據具體的數學模型來確定,無需約定。
115.在實際應用中,所述閾值也可根據最大約登指數確定(具體可為最大約登指數對應的數值)。大于閾值歸為一類,小于閾值歸為另外一類,等于閾值作為不確定的灰區。其中a類型和b類型為相對應的兩分類,二分類的分組,哪一組是a類型,哪一組是b類型,要根據具體的數學模型來確定,無需約定。
116.所述a類型樣本和所述b類型樣本可為如下中的任一種:
117.(c1)肺癌樣本和無癌對照;
118.(c2)肺癌樣本和肺良性結節樣本;
119.(c3)肺癌不同亞型樣本;
120.(c4)肺癌不同分期樣本;
121.(c5)肺癌樣本和乳腺癌樣本;
122.(c6)乳腺癌樣本和無癌女性對照;
123.(c7)乳腺癌不同分期樣本。
124.以上任一所述數學模型在實際應用中可能會根據dna甲基化的檢測方法以及擬合方式不同有所改變,要根據具體的數學模型來確定,無需約定。
125.在本發明的實施例中,所述模型具體為log(y/(1-y))=b0+b1x1+b2x2+b3x3+

+bnxn,其中y為因變量即將待測樣品的一個或者多個甲基化位點的甲基化值代入模型以后得出的檢測指數,b0為常量,x1~xn為自變量即為該測試樣品的一個或者多個甲基化位點
的甲基化值(每一個值為0-1之間的數值),b1~bn為模型賦予每一個位點甲基化值的權重。
126.在本發明的實施例中,所述模型的建立還可酌情加入年齡、性別、白細胞計數等已知參數來提高判別效率。本發明的實施例中建立的一個具體模型為用于輔助區分肺部良性結節和肺癌的模型,所述模型具體為:log(y/(1-y))=-0.672-0.711*cd44_c_2-0.076*cd44_c_3+0.082*cd44_c_4+0.918*cd44_c_5-0.052*cd44_c_6+0.027*年齡+0.747*性別(男性賦值為1,女性賦值為0)+0.014*白細胞個數。所述cd44_c_2為seq id no.3所示的dna片段自5’端第130-131位所示cpg位點的甲基化水平;所述cd44_c_3為seq id no.3所示的dna片段自5’端第158-159位所示cpg位點的甲基化水平;所述cd44_c_4為seq id no.3所示的dna片段自5’端第198-199位所示cpg位點的甲基化水平;所述cd44_c_5為seq id no.3所示的dna片段自5’端第316-317位所示cpg位點的甲基化水平;所述cd44_c_6為seq id no.3所示的dna片段自5’端第346-347位所示cpg位點的甲基化水平。所述模型的閾值為0.5。通過模型計算的檢測指數大于0.5的患者候選為肺癌患者,小于0.5的患者候選為肺良性結節患者。
127.在上述各方面中,所述檢測cd44基因甲基化水平為檢測血液中cd44基因甲基化水平。
128.在上述各方面中,當所述a類型樣本和所述b類型樣本為(c3)中肺癌不同亞型樣本時,所述a類型樣本和所述b類型樣本具體可為肺腺癌樣本、肺鱗癌樣本和小細胞肺癌樣本中的任意兩種。
129.在上述各方面中,當所述a類型樣本和所述b類型樣本為(c4)中肺癌不同分期樣本時,所述a類型樣本和所述b類型樣本具體可為臨床i期肺癌樣本、臨床ii期肺癌樣本和臨床iii期肺癌樣本中的任意兩種。
130.在上述各方面中,當所述a類型樣本和所述b類型樣本為(c7)中乳腺癌不同分期樣本時,所述a類型樣本和所述b類型樣本具體可為t1期乳腺癌樣本、t2期乳腺癌樣本和t3期乳腺癌樣本中的任意兩種,或者為無淋巴結浸潤乳腺癌樣本和有淋巴結浸潤乳腺癌樣本,或者為臨床i期乳腺癌樣本、臨床ii期乳腺癌樣本和臨床iii期乳腺癌樣本中的任意兩種。
131.以上任一所述cd44基因具體可包括genbank登錄號:nm_000610.4,轉錄物變體1;nm_001001389.2,轉錄物變體2;nm_001001390.2,轉錄物變體3;nm_001001391.2,轉錄物變體4;nm_001001392.2,轉錄物變體5;nm_001202555.2,轉錄物變體6;nm_001202556.2,轉錄物變體7;nm_001202557.2,轉錄物變體8。
132.本發明提供了肺癌患者和乳腺癌血液中cd44基因的低甲基化現象。實驗證明,以血液為樣本就能夠區分癌癥(肺癌和乳腺癌)患者和無癌對照、區分肺部良性結節和肺癌、區分肺癌不同亞型和不同分期,并且能夠區分肺癌和乳腺癌,以及乳腺癌不同分期。本發明對于提高肺癌和乳腺癌早期診療效果和降低死亡率均有重要的科學意義和臨床應用價值。
附圖說明
133.圖1為數學模型示意圖。
134.圖2為數學模型舉例說明。
具體實施方式
135.下面結合具體實施方式對本發明進行進一步的詳細描述,給出的實施例僅為了闡明本發明,而不是為了限制本發明的范圍。以下提供的實施例可作為本技術領域普通技術人員進行進一步改進的指南,并不以任何方式構成對本發明的限制。
136.下述實施例中的實驗方法,如無特殊說明,均為常規方法,按照本領域內的文獻所描述的技術或條件或者按照產品說明書進行。下述實施例中所用的材料、試劑等,如無特殊說明,均可從商業途徑得到。
137.以下實施例中的cd44基因(cd44 molecule,cd44)定量試驗,均設置三次重復實驗,結果取平均值。
138.實施例1、用于檢測cd44基因甲基化位點的引物設計
139.經過大量序列和功能分析,選擇了cd44基因中的四個片段(cd44_a片段、cd44_b片段、cd44_c片段)進行甲基化水平和癌癥相關性分析。
140.cd44_a片段(seq id no.1)位于hg19參考基因組chr11:35187705-35188468,正義鏈。
141.cd44_b片段(seq id no.2)位于hg19參考基因組chr11:35239651-35240354,正義鏈。
142.cd44_c片段(seq id no.3)位于hg19參考基因組chr11:35249620-35250287,正義鏈。
143.cd44_a片段中的cpg位點信息如表1所示。
144.cd44_b片段中的cpg位點信息如表2所示。
145.cd44_c片段中的cpg位點信息如表3所示。
146.表1、cd44_a片段中cpg位點信息
147.cpg位點cpg位點在序列中的位置cd44_a_1seq id no.1自5’端第26-27位cd44_a_2seq id no.1自5’端第48-49位cd44_a_3seq id no.1自5’端第121-122位cd44_a_4seq id no.1自5’端第127-128位cd44_a_5seq id no.1自5’端第455-456位cd44_a_6seq id no.1自5’端第486-487位cd44_a_7seq id no.1自5’端第523-524位cd44_a_8seq id no.1自5’端第531-532位cd44_a_9seq id no.1自5’端第681-682位cd44_a_10seq id no.1自5’端第733-734位cd44_a_11seq id no.1自5’端第738-739位
148.表2、cd44_b片段中cpg位點信息
149.cpg位點cpg位點在序列中的位置cd44_b_1seq id no.2自5’端第26-27位cd44_b_2seq id no.2自5’端第66-67位cd44_b_3seq id no.2自5’端第219-220位
cd44_b_4seq id no.2自5’端第257-258位cd44_b_5seq id no.2自5’端第350-351位cd44_b_6seq id no.2自5’端第414-415位cd44_b_7seq id no.2自5’端第466-467位cd44_b_8seq id no.2自5’端第503-504位cd44_b_9seq id no.2自5’端第593-594位cd44_b_10seq id no.2自5’端第677-678位
150.表3、cd44 c片段中cpg位點信息
151.cpg位點cpg位點在序列中的位置cd44_c_1seq id no.3自5’端第31-32位cd44_c_2seq id no.3自5’端第130-131位cd44_c_3seq id no.3自5’端第158-159位cd44_c_4seq id no.3自5’端第198-199位cd44_c_5seq id no.3自5’端第316-317位cd44_c_6seq id no.3自5’端第346-347位cd44_c_7seq id no.3自5’端第641-642位
152.針對三個片段(cd44_a片段、cd44_b片段和cd44_c片段)設計特異pcr引物,如表4所示。其中,seq id no.4、seq id no.6和seq id no.8為正向引物,seq id no.5、seq id no.7和seq id no.9為反向引物;seq id no.4、seq id no.6和seq id no.8中自5’端第1至10位為非特異標簽,第11至35位為特異引物序列;seq id no.5、seq id no.7和seq id no.9中自5’第1至31位為非特異標簽,第32至56位為特異引物序列。引物序列中不包含snp和cpg位點。
153.表4、cd44甲基化引物序列
[0154][0155][0156]
實施例2、cd44基因甲基化檢測及結果分析
[0157]
一、研究樣本
[0158]
經患者知情同意,共收集722例肺癌患者、152例肺部出現良性結節患者、227例乳腺癌患者和945例無癌對照(無癌對照即以前和現在沒有患過癌癥且沒有報道過肺小結節患者且血常規指標都在參考范圍內)的離體血液樣本。
[0159]
所有患者樣本都是手術前收集的且都經過影像學和病理確診。
[0160]
肺癌和乳腺癌亞型根據病理組織學進行判斷。
[0161]
肺癌和乳腺癌分期以ajcc第8版分期系統為判斷標準。
[0162]
722例肺癌患者按照分型劃分:肺腺癌619例,肺鱗癌42例,小細胞肺癌49例,其他12例。
[0163]
722例肺癌患者按照分期劃分:i期649例,ii期41例,iii期32例。
[0164]
722例肺癌患者按照肺癌腫瘤大小(t)劃分:t1 603例,t2 83例,t3 36例。
[0165]
722例肺癌患者按照有無肺癌淋巴結浸潤(n)劃分:無肺癌淋巴結浸潤688例,有肺癌淋巴結浸潤34例。
[0166]
227例乳腺癌患者按照分型劃分:乳腺導管原位癌34例,浸潤性導管癌165例,浸潤性小葉癌28例。
[0167]
227例乳腺癌患者按照分期劃分:i期198例,ii期20例,iii期9例。
[0168]
227例乳腺癌患者按照肺癌腫瘤大小(t)劃分:t1 189例,t2 27例,t3 11例。
[0169]
227例乳腺癌患者按照有無乳腺癌淋巴結浸潤(n)劃分:無乳腺癌淋巴結浸潤201例,有乳腺癌淋巴結浸潤26例。
[0170]
無癌人、肺部良性結節、肺癌和乳腺癌患者各自年齡的中位數分別為56、57、58和56歲,無癌人、肺部良性結節和肺癌這3種體中各自的男女比例都約為1:1,乳腺癌患者全部為女性。
[0171]
二、甲基化檢測
[0172]
1、提取血液樣本的總dna。
[0173]
2、將步驟1制備的血液樣本總dna進行重亞硫酸鹽處理(參照qiagen的dna甲基化試劑盒說明書操作)。重亞硫酸鹽處理后,未發生甲基化的胞嘧啶(c)被轉化成尿嘧啶(u),而甲基化的胞嘧啶保持不變,即原來cpg位點的c堿基經重亞硫酸鹽處理后轉化為c或u。
[0174]
3、以步驟2經過重亞硫酸鹽處理的dna為模板,采用表4中的3對特異引物對通過dna聚合酶按照常規pcr反應要求的反應體系進行pcr擴增,3對引物都采用相同的常規pcr體系,且3對引物都按照以下程序進行擴增。
[0175]
pcr反應程序為:95℃,4min

(95℃,20s

56℃,30s

72℃,2min)45個循環

72℃,5min

4℃,1h。
[0176]
4、取步驟3的擴增產物,通過飛行時間質譜進行dna甲基化分析,具體方法如下:
[0177]
(1)向5μl pcr產物中加入2μl蝦堿性磷酸鹽(sap)溶液(0.3ml sap[0.5u]+1.7ml h2o)然后按照以下程序在pcr儀中孵育(37℃,20min

85℃,5min

4℃,5min);
[0178]
(2)取出2μl步驟(1)得到的sap處理后的產物,根據說明書加入5μl t-cleavage反應體系中,然后在37℃孵育3h;
[0179]
(3)取步驟(2)的產物,加入19μl去離子水,再用6μg resin在旋轉搖床進行去離子化孵育1h;
[0180]
(4)2000rpm室溫離心5min,將微量上清由nanodispenser機械手臂上樣384spectrochip;
[0181]
(5)飛行時間質譜分析;獲得的數據用spectroacquire v3.3.1.3軟件收集,通過massarray epityper v1.2軟件實現可視化。
[0182]
上述飛行時間質譜檢測使用的試劑均來試劑盒(t-cleavage masscleave reagent auto kit,貨號:10129a);上述飛行時間質譜檢測使用的檢測儀器為analyzer chip prep module 384,型號:41243;上述數據分析軟件為檢測
儀器自帶軟件。
[0183]
5、對步驟4得到的數據進行分析。
[0184]
數據統計分析由spss statistics 23.0進行。
[0185]
非參數檢驗用于兩組之間的比較分析。
[0186]
多個cpg位點的組合對于不同樣品分組的鑒別效果通過邏輯回歸和受試者曲線的統計學方法得以實現。
[0187]
所有的統計檢驗都是雙側的,p值《0.05被認為具有統計學意義。
[0188]
通過質譜實驗,共獲得28個可以區別的甲基化片段的峰圖。采用spectroacquire v3.3.1.3軟件根據“甲基化水平=甲基化片段的峰面積/(非甲基化片段的峰面積+甲基化片段的峰面積)”公式可自動通過計算峰面積得到每個樣本在每個cpg位點的甲基化水平。
[0189]
三、結果分析
[0190]
1、無癌對照、良性結節和肺癌血液中cd44基因甲基化水平
[0191]
以722位肺癌患者、152位肺部出現良性結節患者和945名無癌對照的血液為研究材料進行分析cd44基因中所有cpg位點的甲基化水平(表5)。結果表明,cd44基因中所有cpg位點在無癌對照組中甲基化水平中位數為0.48(iqr=0.19-0.69),良性結節中甲基化水平中位數為0.45(iqr=0.17-0.65),肺癌患者中甲基化水平中位數為0.44(iqr=0.15-0.65)。
[0192]
2、血液中cd44基因甲基化水平可以區分無癌對照和肺癌患者
[0193]
通過比較分析722位肺癌患者和945名無癌對照的cd44基因的甲基化水平,結果發現肺癌患者cd44基因中所有cpg位點甲基化水平顯著低于無癌對照(p《0.05,表6)。此外,肺癌不同亞型(肺腺癌,肺鱗癌,小細胞肺癌)中cd44基因所有cpg位點的甲基化水平分別都與無癌對照有顯著性差異。肺癌不同分期(臨床i期、ii-iii期)中cd44基因所有cpg位點的甲基化水平分別都與無癌對照有顯著性差異(p《0.05,表6)。此外,無淋巴結浸潤的肺癌患者和有淋巴結浸潤的肺癌患者的甲基化水平分別與無癌對照之間有顯著性差異(p《0.05,表6)。因此,cd44基因的甲基化水平可以用于肺癌的臨床診斷,尤其可用于肺癌的早期診斷。
[0194]
3、血液中cd44基因甲基化水平可以區分肺部良性結節和肺癌患者
[0195]
通過比較分析722位肺癌患者和152名良性結節中cd44基因的甲基化水平,結果發現良性結節患者中cd44基因所有cpg位點甲基化水平顯著高于肺癌患者(p《0.05,表7)。此外還發現肺癌不同亞型(肺腺癌,肺鱗癌,小細胞肺癌)、不同臨床時期(i期或ii-iii期)和有無淋巴結浸潤的肺癌患者的cd44基因中所有cpg的甲基化水平分別都與良性結節有顯著性差異(p《0.05,表7)。因此,cd44基因的甲基化水平可應用于區分肺癌患者和良性結節患者,是非常有潛在價值的標志物。
[0196]
4、血液中cd44基因甲基化水平區分肺癌不同亞型或者肺癌不同分期
[0197]
通過比較分析不同亞型肺癌患者(肺腺癌,肺鱗癌,小細胞肺癌)和不同分期肺癌患者中cd44基因的甲基化水平,發現cd44基因中所有cpg位點甲基化水平分別在肺癌不同亞型(肺腺癌患者,肺鱗癌患者,小細胞肺癌患者)、腫瘤大小(t1、t2和t3)、不同分期(臨床i期、ii期和iii期)、有無淋巴結浸潤條件下存在顯著性差異(p《0.05,表8)。因此,cd44基因的甲基化水平可以用于區分肺癌不同亞型或者肺癌不同分期。
[0198]
5、血液中cd44基因甲基化水平可以用于診斷乳腺癌
[0199]
以227名乳腺癌患者和472例無癌女性對照的血液為研究材料進行分析乳腺癌患者和無癌女性對照之間的cd44基因中cpg位點甲基化水平差異(表9)。結果表明,乳腺癌患者中所有目標cpg位點的甲基化水平中位數為0.46(iqr=0.19-0.66),無癌女性對照組甲基化水平中位數為0.48(iqr=0.19-0.69),乳腺癌患者中所有cpg位點甲基化水平顯著低于無癌女性對照(p《0.05)。此外,cd44基因中所有cpg位點甲基化水平分別在乳腺癌不同分期(臨床i期、ii-iii期)、腫瘤大小(t1、t2和t3)、有無淋巴結浸潤條件下有顯著性差異(p《0.05,表10)。因此,cd44基因的甲基化水平可以用于乳腺癌的臨床診斷。
[0200]
6、血液中cd44甲基化水平可以區分乳腺癌患者和肺癌患者
[0201]
以227名乳腺癌患者和722名肺癌患者的血液為研究材料進行分析乳腺癌患者和肺癌患者血液cd44基因中甲基化水平差異(表11)。結果表明,乳腺癌患者中所有目標cpg位點的甲基化水平中位數為0.46(iqr=0.19-0.66),肺癌患者甲基化水平中位數為0.44(iqr=0.15-0.65),乳腺癌患者中所有cpg位點甲基化水平顯著高于肺癌患者(p《0.05)。因此,cd44基因的甲基化水平可以用于區分乳腺癌和肺癌患者。
[0202]
7、用于輔助癌癥診斷的數學模型的建立
[0203]
本發明建立的數學模型可以用于達到如下目的:
[0204]
(1)區分肺癌患者和無癌對照;
[0205]
(2)區分肺癌患者和肺良性結節患者;
[0206]
(3)區分乳腺癌患者和無癌女性對照;
[0207]
(4)區分乳腺癌患者和肺癌患者
[0208]
(5)區分肺癌亞型;
[0209]
(6)區分肺癌分期;
[0210]
(7)區分乳腺癌分期。
[0211]
數學模型的建立方法如下:
[0212]
(a)數據來源:步驟一中列出的722例肺癌患者、152例肺部出現良性結節患者、227例乳腺癌患者和945例無癌對照的離體血液樣本的目標cpg位點(表1-表3中的一種或多種的組合)甲基化水平(檢測方法同步驟二)。
[0213]
數據可根據實際需要加入年齡、性別、白細胞計數等已知參數來提高判別效率。
[0214]
(b)模型建立
[0215]
根據需要選取任意兩類不同類型患者數據即訓練集(例如:無癌對照和肺癌患者、無癌女性對照和乳腺癌患者、肺良性結節患者和肺癌患者、肺癌患者和乳腺癌患者、肺腺癌和肺鱗癌患者、肺腺癌和小細胞肺癌患者、肺鱗癌和小細胞肺癌患者、i期肺癌和ii期肺癌患者、i期肺癌和iii期肺癌患者、ii期肺癌和iii期肺癌患者、i期乳腺癌和ii期乳腺癌患者、i期乳腺癌和iii期乳腺癌患者、ii期乳腺癌和iii期乳腺癌患者、t1期乳腺癌和t2期乳腺癌患者、t1期乳腺癌和t3期乳腺癌患者、t2期乳腺癌和t3期乳腺癌患者、無淋巴結浸潤乳腺癌和有淋巴結浸潤乳腺癌患者)作為用于建立模型的數據,使用sas,r,spss等統計軟件使用二分類邏輯回歸的統計方法通過公式建立數學模型。數學模型公式計算出的最大約登指數對應的數值為閾值或直接設定0.5為閾值,待測樣品經過測試和代入模型計算后得到的檢測指數大于閾值歸為一類(b類),小于閾值歸為另外一類(a類),等于閾值作為不確定的灰區。在對新的待測樣品進行預測來判斷屬于哪一類時,首先通過dna甲基化的測定方法
檢測該待測樣品cd44基因上一個或者多個cpg位點的甲基化水平,然后將這些甲基化水平的數據代入上述數學模型(如果構建模型時納入了年齡、性別、白細胞計數等已知參數,則該步驟同時向模型公式中代入該待測樣品的相應參數的具體數值),計算得到所述待測樣本對應的檢測指數,然后比較所述待測樣本對應的檢測指數和閾值的大小,根據比較結果確定所述待測樣本屬于哪一類樣本。
[0216]
舉例:如圖1所示,將訓練集中cd44基因單個cpg位點的甲基化水平或者多個cpg位點組合的甲基化水平的數據通過sas、r、spss等統計軟件使用二分類邏輯回歸的公式建立用于區分a類和b類的數學模型。該數學模型在此為二類邏輯回歸模型,具體為:log(y/1-y)=b0+b1x1+b2x2+b3x3+

+bnxn,其中y為因變量即將待測樣品的一個或者多個甲基化位點的甲基化值代入模型以后得出的檢測指數,b0為常量,x1~xn為自變量即為該測試樣品的一個或者多個甲基化位點的甲基化值(每一個值為0-1之間的數值),b1~bn為模型賦予每一個位點甲基化值的權重。具體應用時,先根據訓練集中已經檢測的樣本的一個或者多個dna甲基化位點的甲基化程度(x1~xn)及其已知的分類情況(a類或者b類,分別對y賦值0和1)建立數學模型,由此確定該數學模型的常量b0以及各個甲基化位點的權重b1~bn,并由該數學模型計算出的以最大約登指數對應的檢測指數(在此例中為0.5)為劃分的閾值。待測樣品經過測試和代入模型計算后得到的檢測指數即y值大于0.5歸為b類,小于0.5歸為a類,等于0.5作為不確定的灰區。其中a類和b類為相對應的兩分類(二分類的分組,哪一組a類,哪一組是b類,要根據具體的數學模型來確定,在此不做約定),比如無癌對照和肺癌患者、無癌女性對照和乳腺癌患者、肺良性結節患者和肺癌患者、肺癌患者和乳腺癌患者、肺腺癌和肺鱗癌患者、肺腺癌和小細胞肺癌患者、肺鱗癌和小細胞肺癌患者、i期肺癌和ii期肺癌患者、i期肺癌和iii期肺癌患者、ii期肺癌和iii期肺癌患者、i期乳腺癌和ii期乳腺癌患者、i期乳腺癌和iii期乳腺癌患者、ii期乳腺癌和iii期乳腺癌患者、t1期乳腺癌和t2期乳腺癌患者、t1期乳腺癌和t3期乳腺癌患者、t2期乳腺癌和t3期乳腺癌患者、無淋巴結浸潤乳腺癌和有淋巴結浸潤乳腺癌患者。對受試者的樣品進行預測來判斷屬于哪一類時,首先采集受試者的血液,然后從中提取dna。將提取的dna通過重亞硫酸鹽轉化后,用dna甲基化的測定方法對受試者的cd44基因的單個cpg位點的甲基化水平或者多個cpg位點組合的甲基化水平進行檢測,然后將檢測得到的甲基化數據代入上述數學模型。如果該受試者的cd44基因一個或者多個cpg位點的甲基化水平代入上述數學模型后計算出來的檢測指數大于閾值,則該受試者判定與訓練集中檢測指數大于0.5的歸屬于一類(b類);如果該受試者的cd44基因一個或者多個cpg位點的甲基化水平數據代入上述數學模型后計算出來的值即檢測指數小于閾值,則該受試者跟訓練集中檢測指數小于0.5的歸屬于一類(a類);如果該受試者的cd44基因一個或者多個cpg位點的甲基化水平數據代入上述數學模型后計算出來的值即檢測指數等于閾值,則不能判斷該受試者是a類還是b類。
[0217]
舉例:圖2的示意圖舉例說明cd44_c的優選cpg位點(cd44_c_2、cd44_c_3、cd44_c_4、cd44_c_5、cd44_c_6)的甲基化以及數學建模在用于肺部良惡性結節判別的應用:將肺癌患者和肺良性結節患者訓練集(在此為:722名肺癌患者和152位肺良性結節患者)中已經檢測的5個可區分的優選cpg位點組合的甲基化水平的數據以及患者的年齡、性別(男性賦值為1,女性賦值為0)、白細胞計數通過r軟件使用二分類邏輯回歸的公式建立用于區分肺癌患者和肺良性結節患者的數學模型。該數學模型在此為二類邏輯回歸模型,由此確定該數
學模型的常量b0以及各個甲基化位點的權重b1~bn,在此例中具體為:log(y/(1-y))=-0.672-0.711*cd44_c_2-0.076*cd44_c_3+0.082*cd44_c_4+0.918*cd44_c_5-0.052*cd44_c_6+0.027*年齡+0.747*性別(男性賦值為1,女性賦值為0)+0.014*白細胞個數。其中y為因變量即將待測樣品的5個可區分的甲基化位點的甲基化值以及年齡、性別、白細胞計數代入模型以后得出的檢測指數。在設定0.5為閾值的情況下,待測樣品的cd44_c_2、cd44_c_3、cd44_c_4、cd44_c_5、cd44_c_6這5個可區分的cpg位點的甲基化水平經過測試后連同其年齡、性別、白細胞計數的信息代入模型進行計算,得到的檢測指數即y值大于0.5歸為肺癌患者,小于0.5歸為肺良性結節患者,等于0.5則不確定為肺癌患者還是肺良性結節患者。此模型的曲線下面積(auc)計算結果為0.69(表15)。具體受試者判斷方法舉例如圖2所示,從兩位受試者(甲,乙)分別采集血液提取dna,將提取的dna通過重亞硫酸鹽轉化后,用dna甲基化的測定方法對受試者的cd44_c_2、cd44_c_3、cd44_c_4、cd44_c_5、cd44_c_6這5個可區分的cpg位點的甲基化水平進行檢測。然后將檢測得到的甲基化水平數據連同受試者的年齡、性別和白細胞計數的信息代入上述數學模型。甲受試者經數學模型后計算出來的值為0.82大于0.5,則甲受試者判定為肺癌患者(與臨床判定結果相符);乙受試者的cd44基因一個或者多個cpg位點的甲基化水平數據代入上述數學模型后計算出來的值為0.21小于0.5,則乙受試者判定肺良性結節患者(與臨床判定結果相符)。
[0218]
(c)模型效果評價
[0219]
根據上述方法,分別建立用于區分無癌對照和肺癌患者、無癌女性對照和乳腺癌患者、肺良性結節患者和肺癌患者、肺癌患者和乳腺癌患者、肺腺癌和肺鱗癌患者、肺腺癌和小細胞肺癌患者、肺鱗癌和小細胞肺癌患者、i期肺癌和ii期肺癌患者、i期肺癌和iii期肺癌患者、ii期肺癌和iii期肺癌患者、i期乳腺癌和ii期乳腺癌患者、i期乳腺癌和iii期乳腺癌患者、ii期乳腺癌和iii期乳腺癌患者、t1期乳腺癌和t2期乳腺癌患者、t1期乳腺癌和t3期乳腺癌患者、t2期乳腺癌和t3期乳腺癌患者、無淋巴結浸潤乳腺癌和有淋巴結浸潤乳腺癌患者的數學模型,并且通過受試者曲線(roc曲線)對其有效性進行評價。roc曲線得出的曲線下面積(auc)越大,說明模型的區分度越好,分子標志物越有效。采用不同cpg位點進行數學模型構建后的評價結果如表12、表13和表14所示。表12、表13和表14中,1個cpg位點代表cd44_c擴增片段中任意一個cpg位點的位點,2個cpg位點代表cd44_c中任意2個cpg位點的組合,3個cpg位點代表cd44_c任意3個cpg位點的組合,
……
以此類推。表中的數值為不同位點組合評價結果的范圍值(即任意個cpg位點組合方式的結果均在此范圍內)。
[0220]
上述結果顯示,cd44基因對于各組的鑒別能力(無癌對照和肺癌患者、無癌女性對照和乳腺癌患者、肺良性結節患者和肺癌患者、肺癌患者和乳腺癌患者、肺腺癌和肺鱗癌患者、肺腺癌和小細胞肺癌患者、肺鱗癌和小細胞肺癌患者、i期肺癌和ii期肺癌患者、i期肺癌和iii期肺癌患者、ii期肺癌和iii期肺癌患者、i期乳腺癌和ii期乳腺癌患者、i期乳腺癌和iii期乳腺癌患者、ii期乳腺癌和iii期乳腺癌患者、t1期乳腺癌和t2期乳腺癌患者、t1期乳腺癌和t3期乳腺癌患者、t2期乳腺癌和t3期乳腺癌患者、無淋巴結浸潤乳腺癌和有淋巴結浸潤乳腺癌患者)隨著位點數的增加而增加。
[0221]
除此以外,在表1-表3所示的cpg位點中,還存在少數幾個較優位點的組合比多個非較優位點組合的鑒別能力更好的情況。例如表15、表16和表17所示的cd44_c_2、cd44_c_3、cd44_c_4、cd44_c_5、cd44_c_6這5個可區分的最優位點的組合是cd44_c中任意5個組合
的優選位點。
[0222]
綜上所述,cd44基因上的cpg位點及其各種組合,cd44_a片段上的cpg位點及其各種組合,cd44_b片段上的cpg位點及其各種組合,cd44_c片段上的cpg位點及其各種組合,cd44_c片段上cd44_c_2、cd44_c_3、cd44_c_4、cd44_c_5、cd44_c_6位點及其各種組合,以及cd44_a、cd44_b和cd44_c上的cpg位點及其各種組合的甲基化水平都對無癌對照和肺癌患者、無癌女性對照和乳腺癌患者、肺良性結節患者和肺癌患者、肺癌患者和乳腺癌患者、肺腺癌和肺鱗癌患者、肺腺癌和小細胞肺癌患者、肺鱗癌和小細胞肺癌患者、i期肺癌和ii期肺癌患者、i期肺癌和iii期肺癌患者、ii期肺癌和iii期肺癌患者、i期乳腺癌和ii期乳腺癌患者、i期乳腺癌和iii期乳腺癌患者、ii期乳腺癌和iii期乳腺癌患者、t1期乳腺癌和t2期乳腺癌患者、t1期乳腺癌和t3期乳腺癌患者、t2期乳腺癌和t3期乳腺癌患者、無淋巴結浸潤乳腺癌和有淋巴結浸潤乳腺癌患者有判別能力。
[0223]
表5、比較無癌對照、良性結節和肺癌的甲基化水平
[0224][0225][0226]
表6、比較無癌對照和肺癌的甲基化水平差異
[0227][0228]
表7、比較良性結節和肺癌的甲基化水平差異
[0229][0230]
表8、比較肺癌不同亞型或者肺癌不同分期的甲基化水平差異
[0231]
[0232][0233]
表9、比較無癌女性對照和乳腺癌的甲基化水平差異
[0234]
[0235][0236]
表10、比較乳腺癌不同分期的甲基化水平差異
[0237][0238]
表11、比較肺癌、乳腺癌的甲基化水平差異
[0239]
[0240][0241]
表12、cd44_c的cpg位點及其組合用于區分肺癌和無癌對照、肺癌和良性結節、乳腺癌和無癌女性對照、肺癌和乳腺癌
[0242]
[0243][0244]
表13、cd44_c的cpg位點及其自由組合用于區分肺癌患者不同亞型和分期
[0245][0246]
表14、cd44_c的cpg位點及其組合用于區分乳腺癌的不同分期
[0247]
[0248][0249]
表15、cd44_c的最佳cpg位點及其組合用于區分肺癌和無癌對照,肺癌和良性結節,乳腺癌和無癌女性對照,以及肺癌和乳腺癌
[0250][0251]
表16、cd44_c的最佳cpg位點及其組合用于區分肺癌患者不同亞型和分期
[0252][0253]
表17、cd44_c的最佳cpg位點及其組合用于區分乳腺癌不同分期
[0254][0255]
以上對本發明進行了詳述。對于本領域技術人員來說,在不脫離本發明的宗旨和范圍,以及無需進行不必要的實驗情況下,可在等同參數、濃度和條件下,在較寬范圍內實施本發明。雖然本發明給出了特殊的實施例,應該理解為,可以對本發明作進一步的改進??傊?,按本發明的原理,本技術欲包括任何變更、用途或對本發明的改進,包括脫離了本技術中已公開范圍,而用本領域已知的常規技術進行的改變。按以下附帶的權利要求的范圍,可以進行一些基本特征的應用。

技術特征:


1.甲基化cd44基因作為標志物在制備產品中的應用;所述產品的用途為如下中的至少一種:(1)輔助診斷癌癥或預測癌癥患病風險;(2)輔助區分良性結節和癌癥;(3)輔助區分癌癥不同亞型;(4)輔助區分癌癥不同分期;(5)輔助診斷肺癌或預測肺癌患病風險;(6)輔助區分肺部良性結節和肺癌;(7)輔助區分肺癌不同亞型;(8)輔助區分肺癌不同分期;(9)輔助診斷乳腺癌或預測乳腺癌患病風險;(10)輔助區分乳腺癌不同分期;(11)輔助區分肺癌和乳腺癌;(12)確定待測物對癌癥的發生是否存在阻礙或促進作用。2.用于檢測cd44基因甲基化水平的物質在制備產品中的應用;所述產品的用途為如下中的至少一種:(1)輔助診斷癌癥或預測癌癥患病風險;(2)輔助區分良性結節和癌癥;(3)輔助區分癌癥不同亞型;(4)輔助區分癌癥不同分期;(5)輔助診斷肺癌或預測肺癌患病風險;(6)輔助區分肺部良性結節和肺癌;(7)輔助區分肺癌不同亞型;(8)輔助區分肺癌不同分期;(9)輔助診斷乳腺癌或預測乳腺癌患病風險;(10)輔助區分乳腺癌不同分期;(11)輔助區分肺癌和乳腺癌;(12)確定待測物對癌癥的發生是否存在阻礙或促進作用。3.用于檢測cd44基因甲基化水平的物質和記載有數學模型建立方法和/或使用方法的介質在制備產品中的應用;所述產品的用途為如下中的至少一種:(1)輔助診斷癌癥或預測癌癥患病風險;(2)輔助區分良性結節和癌癥;(3)輔助區分癌癥不同亞型;(4)輔助區分癌癥不同分期;(5)輔助診斷肺癌或預測肺癌患病風險;(6)輔助區分肺部良性結節和肺癌;(7)輔助區分肺癌不同亞型;(8)輔助區分肺癌不同分期;(9)輔助診斷乳腺癌或預測乳腺癌患病風險;
(10)輔助區分乳腺癌不同分期;(11)輔助區分肺癌和乳腺癌;(12)確定待測物對癌癥的發生是否存在阻礙或促進作用;所述數學模型按照包括如下步驟的方法獲得:(a1)分別檢測n1個a類型樣本和n2個b類型樣本的cd44基因甲基化水平;(a2)取步驟(a1)獲得的所有樣本的cd44基因甲基化水平數據,按照a類型和b類型的分類方式,通過二分類邏輯回歸法建立數學模型,確定分類判定的閾值;所述數學模型的使用方法包括如下步驟:(b1)檢測待測樣本的cd44基因甲基化水平;(b2)將步驟(b1)獲得的所述待測樣本的cd44基因甲基化水平數據代入所述數學模型,得到檢測指數;然后比較檢測指數和閾值的大小,根據比較結果確定所述待測樣本的類型是a類型還是b類型;所述a類型樣本和所述b類型樣本為如下中的任一種:(c1)肺癌樣本和無癌對照;(c2)肺癌樣本和肺良性結節樣本;(c3)肺癌不同亞型樣本;(c4)肺癌不同分期樣本;(c5)肺癌樣本和乳腺癌樣本;(c6)乳腺癌樣本和無癌女性對照;(c7)乳腺癌不同分期樣本。4.記載有數學模型建立方法和/或使用方法的介質在制備產品中的應用;所述產品的用途為如下中的至少一種:(1)輔助診斷癌癥或預測癌癥患病風險;(2)輔助區分良性結節和癌癥;(3)輔助區分癌癥不同亞型;(4)輔助區分癌癥不同分期;(5)輔助診斷肺癌或預測肺癌患病風險;(6)輔助區分肺部良性結節和肺癌;(7)輔助區分肺癌不同亞型;(8)輔助區分肺癌不同分期;(9)輔助診斷乳腺癌或預測乳腺癌患病風險;(10)輔助區分乳腺癌不同分期;(11)輔助區分肺癌和乳腺癌;(12)確定待測物對癌癥的發生是否存在阻礙或促進作用;所述數學模型按照包括如下步驟的方法獲得:(a1)分別檢測n1個a類型樣本和n2個b類型樣本的cd44基因甲基化水平;(a2)取步驟(a1)獲得的所有樣本的cd44基因甲基化水平數據,按照a類型和b類型的分類方式,通過二分類邏輯回歸法建立數學模型,確定分類判定的閾值;所述數學模型的使用方法包括如下步驟:
(b1)檢測待測樣本的cd44基因甲基化水平;(b2)將步驟(b1)獲得的所述待測樣本的cd44基因甲基化水平數據代入所述數學模型,得到檢測指數;然后比較檢測指數和閾值的大小,根據比較結果確定所述待測樣本的類型是a類型還是b類型;所述a類型樣本和所述b類型樣本為如下中的任一種:(c1)肺癌樣本和無癌對照;(c2)肺癌樣本和肺良性結節樣本;(c3)肺癌不同亞型樣本;(c4)肺癌不同分期樣本;(c5)肺癌樣本和乳腺癌樣本;(c6)乳腺癌樣本和無癌女性對照;(c7)乳腺癌不同分期樣本。5.試劑盒,包括用于檢測cd44基因甲基化水平的物質;所述試劑盒的用途為如下中的至少一種:(1)輔助診斷癌癥或預測癌癥患病風險;(2)輔助區分良性結節和癌癥;(3)輔助區分癌癥不同亞型;(4)輔助區分癌癥不同分期;(5)輔助診斷肺癌或預測肺癌患病風險;(6)輔助區分肺部良性結節和肺癌;(7)輔助區分肺癌不同亞型;(8)輔助區分肺癌不同分期;(9)輔助診斷乳腺癌或預測乳腺癌患病風險;(10)輔助區分乳腺癌不同分期;(11)輔助區分肺癌和乳腺癌;(12)確定待測物對癌癥的發生是否存在阻礙或促進作用。6.根據權利要求5所述的試劑盒,其特征在于:所述試劑盒中還含有權利要求3或4中所述的記載有數學模型建立方法和/或使用方法的介質。7.系統,包括:(d1)用于檢測cd44基因甲基化水平的試劑和/或儀器;(d2)裝置,所述裝置包括單元x和單元y;所述單元x用于建立數學模型,包括數據采集模塊、數據分析處理模塊和模型輸出模塊;所述數據采集模塊被配置為采集(d1)檢測得到的n1個a類型樣本和n2個b類型樣本的cd44基因甲基化水平數據;所述數據分析處理模塊被配置為接收來自于所述數據采集模塊發送的所述n1個a類型樣本和n2個b類型樣本的cd44基因甲基化水平數據,按照a類型和b類型的分類方式,通過二分類邏輯回歸法建立數學模型,確定分類判定的閾值;所述模型輸出模塊被配置為接收來自于所述數據分析處理模塊建立的所述數學模型,
并進行輸出;所述單元y用于確定待測樣本類型,包括數據輸入模塊、數據運算模塊、數據比較模塊和結論輸出模塊;所述數據輸入模塊被配置為輸入(d1)檢測得到的待測者的cd44基因甲基化水平數據;所述數據運算模塊被配置為接收來自于所述數據輸入模塊發送的所述待測者的cd44基因甲基化水平數據,并將所述待測者的cd44基因甲基化水平數據代入所述單元x中的所述數據分析處理模塊建立的所述數學模型,計算得到檢測指數;所述數據比較模塊被配置為接收來自于所述數據運算模塊發送的所述檢測指數,并將所述檢測指數與所述單元x中的所述數據分析處理模塊中確定的所述閾值進行比較;所述結論輸出模塊被配置為接收來自于所述數據比較模塊發送的比較結果,并根據所述比較結果輸出所述待測樣本的類型是a類型還是b類型的結論;所述a類型樣本和所述b類型樣本為如下中的任一種:(c1)肺癌樣本和無癌對照;(c2)肺癌樣本和肺良性結節樣本;(c3)肺癌不同亞型樣本;(c4)肺癌不同分期樣本;(c5)肺癌樣本和乳腺癌樣本;(c6)乳腺癌樣本和無癌女性對照;(c7)乳腺癌不同分期樣本。8.根據權利要求1-7中任一所述的應用或試劑盒或系統,其特征在于:所述cd44基因甲基化水平為cd44基因中如下(e1)-(e3)所示片段中全部或部分cpg位點的甲基化水平;所述甲基化cd44基因為cd44基因中如下(e1)-(e3)所示片段中全部或部分cpg位點甲基化;(e1)seq id no.1所示的dna片段或與其具有80%以上同一性的dna片段;(e2)seq id no.2所示的dna片段或與其具有80%以上同一性的dna片段;(e3)seq id no.3所示的dna片段或與其具有80%以上同一性的dna片段。9.根據權利要求8所述的應用或試劑盒或系統,其特征在于:所述“全部或部分cpg位點”為cd44基因中seq id no.1至seq id no.3所示3個dna片段中的任意一個或多個cpg位點;或所述“全部或部分cpg位點”為seq id no.1所示的dna片段中所有cpg位點和seq id no.2所示的dna片段中所有cpg位點;或所述“全部或部分cpg位點”為seq id no.1所示的dna片段中所有cpg位點和seq id no.3所示的dna片段中所有cpg位點;或所述“全部或部分cpg位點”為seq id no.2所示的dna片段中所有cpg位點和seq id no.3所示的dna片段中所有cpg位點;或
所述“全部或部分cpg位點”為seq id no.1所示的dna片段中所有cpg位點、seq id no.2所示的dna片段中所有cpg位點和seq id no.3所示的dna片段中所有cpg位點;或所述“全部或部分cpg位點”為cd44基因中所述seq id no.3所示的dna片段中的全部或任意6個或任意5個或任意4個或任意3個或任意2個或任意1個;或所述“全部或部分cpg位點”為seq id no.3所示的dna片段中如下5項所示cpg位點的全部或任意4項或任意3項或任意2項或任意1項:(f1)seq id no.3所示的dna片段自5’端第130-131位所示cpg位點;(f2)seq id no.3所示的dna片段自5’端第158-159位所示cpg位點;(f3)seq id no.3所示的dna片段自5’端第198-199位所示cpg位點;(f4)seq id no.3所示的dna片段自5’端第316-317位所示cpg位點;(f5)seq id no.3所示的dna片段自5’端第346-347位所示cpg位點。10.根據權利要求1-9中任一所述的應用或試劑盒或系統,其特征在于:所述用于檢測cd44基因甲基化水平的物質包含用于擴增cd44基因全長或部分片段的引物組合;所述用于檢測cd44基因甲基化水平的試劑包含用于擴增cd44基因全長或部分片段的引物組合;進一步地,所述部分片段為如下中至少一個片段:(g1)seq id no.1所示的dna片段或其包含的dna片段;(g2)seq id no.2所示的dna片段或其包含的dna片段;(g3)seq id no.3所示的dna片段或其包含的dna片段;(g4)與seq id no.1所示的dna片段或其包含的dna片段具有80%以上同一性的dna片段;(g5)與seq id no.2所示的dna片段或其包含的dna片段具有80%以上同一性的dna片段;(g6)與seq id no.3所示的dna片段或其包含的dna片段具有80%以上同一性的dna片段;更進一步地,所述引物組合為引物對a和/或引物對b和/或引物對c;所述引物對a為引物a1和引物a2組成的引物對;所述引物a1為seq id no.4或seq id no.4的第11-35位核苷酸所示的單鏈dna;所述引物a2為seq id no.5或seq id no.5的第32-56位核苷酸所示的單鏈dna;所述引物對b為引物b1和引物b2組成的引物對;所述引物b1為seq id no.6或seq id no.6的第11-35位核苷酸所示的單鏈dna;所述引物b2為seq id no.7或seq id no.7的第32-56位核苷酸所示的單鏈dna;所述引物對c為引物c1和引物c2組成的引物對;所述引物c1為seq id no.8或seq id no.8的第11-35位核苷酸所示的單鏈dna;所述引物c2為seq id no.9或seq id no.9的第32-56位核苷酸所示的單鏈dna。

技術總結


本發明公開了一種輔助診斷癌癥的潛在分子標志物。本發明提供了甲基化CD44基因作為標志物在制備產品中的應用;所述產品的用途為如下至少一種:輔助診斷癌癥或預測癌癥患病風險;輔助區分良性結節和癌癥;輔助區分癌癥不同亞型;輔助區分癌癥不同分期;輔助區分不同癌癥;確定待測物對癌癥的發生是否存在阻礙或促進作用;所述癌癥可為肺癌或乳腺癌。本發明研究發現了肺癌和乳腺癌患者血液中CD44基因的低甲基化現象,本發明對提高肺癌和乳腺癌早期診療效果和降低死亡率均有重要的科學意義和臨床應用價值。和臨床應用價值。


技術研發人員:

張晶 狄飛飛 張箏

受保護的技術使用者:

南京騰辰生物科技有限公司

技術研發日:

2021.07.15

技術公布日:

2023/1/16


文章投稿或轉載聲明

本文鏈接:http://m.newhan.cn/zhuanli/patent-1-87454-0.html

來源:專利查詢檢索下載-實用文體寫作網版權所有,轉載請保留出處。本站文章發布于 2023-01-29 17:02:06

發表評論

驗證碼:
用戶名: 密碼: 匿名發表
評論列表 (有 條評論
,2人圍觀
參與討論