使用核酸甲基化的差異的標記物篩選方法、甲基化或去甲基化標記物和使用標記物的診斷方法與流程

更新時間:2025-12-25 05:05:44 0條評論

默認

使用核酸甲基化的差異的標記物篩選方法、甲基化或去甲基化標記物和使用標記物的診斷方法與流程

1.本技術(shù)要求韓國專利申請第10-2020-0020974號的優(yōu)先權(quán)，所述韓國專利申請于2020年2月20日提交，并且其全部說明書整體引入本文作為參考。
2.本發(fā)明涉及使用核酸甲基化的差異的標記物篩選方法、去甲基化標記物和使用標記物的診斷方法，更具體而言，涉及使用游離核酸中的甲基化差異篩選疾病特異性去甲基化標記物的新型方法，并且涉及通過計算經(jīng)由該方法篩選的去甲基化標記物和標記物的頻率，通過甲基化檢測用于確定癌癥的新癌癥診斷方法，并且涉及所選cfdna中的癌癥特異性去甲基化標記物。

背景技術(shù)：

3.癌癥指由于各種原因通過破壞細胞分裂和死亡之間的平衡，通過連續(xù)分裂和增殖而生成的一組異常細胞，并且也稱為腫瘤或瘤形成。它通常影響身體的100多個不同部位，包括器官、白血細胞、骨骼、淋巴結(jié)等，并且通過浸潤到周圍組織和轉(zhuǎn)移到其它器官而發(fā)展成嚴重癥狀。
4.即使在醫(yī)學(xué)科學(xué)進步的今天，關(guān)于人癌癥，特別是占大多數(shù)的實體瘤(除血液癌癥外的癌癥)的5年存活率也小于50％。所有癌癥患者中的約三分之二在晚期時發(fā)現(xiàn)，并且其中大多數(shù)在診斷的兩年內(nèi)死亡。癌癥的此類弱效應(yīng)不僅是方法的問題，還因為到用于早期診斷實際癌癥、準確診斷晚期癌癥、以及后跟蹤的方法并不容易。
5.在目前的臨床環(huán)境中，癌癥診斷通過病史獲得、體格檢查和臨床病理學(xué)檢查來進行，并且一旦懷疑，就進行放射照相檢查和內(nèi)窺鏡檢查，最后通過活組織檢查來確診。然而，以現(xiàn)有的臨床測試方法，癌細胞的數(shù)目必須是10億個細胞，并且癌癥的直徑必須是1厘米或更多以被診斷。在這種情況下，癌細胞已經(jīng)具有轉(zhuǎn)移的能力，并且實際上，超過一半的癌癥已經(jīng)轉(zhuǎn)移。另一方面，在血液中發(fā)現(xiàn)由癌癥直接或間接產(chǎn)生的物質(zhì)的腫瘤標記物用于癌癥篩查，但這在準確性方面具有局限性，所以即使當(dāng)存在癌癥時，它也看起來正常到一半左右，并且即使當(dāng)不存在癌癥時，經(jīng)常看起來是良性的，引起混亂。另外，在主要用于癌癥的抗癌劑的情況下，存在僅當(dāng)癌癥的體積很小時才顯示效應(yīng)的問題。
6.如上文所述，癌癥的診斷和均很困難，因為存在與正常細胞的許多差異，而且它是非常復(fù)雜和多樣的。癌癥繼續(xù)隨意過量生長，免于死亡且繼續(xù)存活，侵入周圍組織并擴散(轉(zhuǎn)移)至遠處器官，導(dǎo)致人死亡。它存活過免疫機制或化學(xué)療法的攻擊，繼續(xù)進化，并且對于存活最有利的細胞體(克隆)選擇性地增殖。癌細胞是由許多基因中的突變引起的具有高活力的活生物。為了使單個細胞變成癌細胞并發(fā)展成臨床實踐中可見的惡性癌腫塊，必須發(fā)生多重基因中的突變。因此，有必要在遺傳水平下著手，以便從根本上診斷且癌癥。
7.相應(yīng)地，最近已提出了通過dna甲基化測量用于診斷癌癥的方法。dna甲基化主要在特定基因的啟動子區(qū)的cpg島的胞嘧啶中發(fā)生。結(jié)果，轉(zhuǎn)錄因子的結(jié)合受到干擾，并且特
定基因的表達被阻斷(基因沉默)。這是基因功能通過其喪失而無體內(nèi)基因的蛋白質(zhì)特異性編碼序列的突變的主要機制，并且已解釋為人癌癥中的許多癌癥抑制基因的功能喪失的原因。關(guān)于啟動子cpg島的甲基化是直接誘導(dǎo)癌發(fā)生還是癌發(fā)生的繼發(fā)性變化存在爭議，但在各種癌細胞包括前列腺癌、結(jié)腸癌、子宮癌和乳腺癌等中，已報告了cpg島中的此類異常甲基化/去甲基化。因此，它可以用于各個領(lǐng)域中，例如癌癥的早期診斷、癌癥風(fēng)險的預(yù)測、癌癥預(yù)后的預(yù)測、后的隨訪以及對化學(xué)療法的應(yīng)答的預(yù)測。最佳已積極進行通過經(jīng)由方法例如甲基化特異性pcr(下文被稱為msp)、自動測序或亞硫酸氫鹽焦磷酸測序測試，使用其用于癌癥診斷和篩查的嘗試，但大多局限于用于檢測且分析少數(shù)特定基因或啟動子區(qū)的甲基化的方法(例如韓國專利第1557183號、韓國專利第1119947號)，并且存在診斷的效率和準確性的局限性。
8.特別地，在癌細胞的基因組中發(fā)生了整體甲基化變化，并且在重復(fù)序列中發(fā)生了最廣泛的變化。存在各種類型的基因組重復(fù)序列，例如轉(zhuǎn)座子、逆轉(zhuǎn)錄轉(zhuǎn)座子、line和sine，并且它們占據(jù)很大的比例，以占據(jù)整個基因組的多于一半，但研究還沒有相對完成。原因在于重復(fù)序列難以進行功能分析，并未良好地組裝，并且由于存在參考序列(參考標準序列)中并未包括的許多區(qū)域，很容易從分析中排除。為此，關(guān)于重復(fù)序列的甲基化研究還沒有相對良好地進行，并且關(guān)于重復(fù)序列中頻繁出現(xiàn)的癌癥有關(guān)甲基化的標記物的意義和開發(fā)的研究也相對較不活躍。然而，在使用各種基因組分析技術(shù)的研究中，已積累了各種研究結(jié)果：dna的低甲基化隨著癌癥進展而廣泛發(fā)生(epigenomics.2009年12月；1(2):239
–
259，clin chem lab med.2012oct 1；50(10):1733-42)，因此重復(fù)序列中的低甲基化預(yù)計用作癌癥的診斷標記物。
9.在本說明書自始至終引用了眾多論文和專利文件，并且指示了它們的引用。所引用的論文和專利文件的公開內(nèi)容整體引入本文作為參考，以更清楚地描述本發(fā)明所屬技術(shù)領(lǐng)域的水平和本發(fā)明的內(nèi)容。
具體實施方式
10.技術(shù)問題
11.相應(yīng)地，本發(fā)明人正在研究開發(fā)在用甲基化敏感性限制性酶處理cfdna以切割且測序限制性酶靶序列中的非甲基化序列后，能夠以非侵入性方式準確地診斷癌癥的新型方法。在使用解碼序列中的一定長度的序列信息對每個序列進行分類的情況下，將血液中的cfdna類型對于疾病，尤其是疾病例如癌癥進行分類是可能的。通過這一點，確認了它可以充當(dāng)疾病的cfdna標記物，本發(fā)明通過開發(fā)用于篩選與cfdna中的甲基化相關(guān)的癌癥特異性標記物，特別是癌癥特異性去甲基化標記物的方法來完成。
12.相應(yīng)地，本發(fā)明的一個目的是提供用于在cfdna中篩選癌癥特異性去甲基化標記物的新型方法。
13.本發(fā)明的另一個目的是提供通過計算篩選的cfdna中的癌癥特異性去甲基化標記物的頻率，通過去甲基化檢測用于確定癌癥的新型癌癥診斷方法。
14.本發(fā)明的另一個目的是提供測序且分析從對象的血液中分離的cfdna的甲基化敏感性限制性酶片段的n末端處的預(yù)定長度的序列信息，以提供關(guān)于癌癥診斷所需的信息的方法。
15.本發(fā)明的另一個目的是提供通過本發(fā)明的方法選擇的cfdna中的癌癥特異性去甲基化標記物，其中所述癌癥特異性去甲基化標記物的n末端是甲基化敏感性限制性酶的識別位點的粘端的序列，并且由25至150個堿基的序列組成。
16.技術(shù)方案
17.為了實現(xiàn)上述目的，本發(fā)明提供了在cfdna中篩選癌癥特異性去甲基化標記物的方法，其包括：用甲基化敏感性限制性酶處理從對象的血液中分離的cfdna(無細胞dna)；分析每個片段的序列；獲得來自片段的n末端的預(yù)定長度的序列信息；計數(shù)每個序列信息的頻率；篩選癌癥特異性序列信息作為cfdna中的癌癥特異性去甲基化標記物。
18.另外，為了實現(xiàn)本發(fā)明的另一個目的，本發(fā)明提供了通過計算篩選的cfdna中的癌癥特異性去甲基化標記物的頻率，通過去甲基化檢測用于確定癌癥的新型癌癥診斷方法。
19.為了實現(xiàn)本發(fā)明的另一個目的，本發(fā)明提供了分析從對象的血液中分離的cfdna的甲基化敏感性限制性酶片段的n末端處的預(yù)定長度的序列信息，以提供關(guān)于癌癥診斷所需的信息的方法。
20.為了實現(xiàn)本發(fā)明的另一個目的，本發(fā)明提供了通過本發(fā)明的方法選擇的cfdna中的癌癥特異性去甲基化標記物，其中所述癌癥特異性去甲基化標記物的n末端是甲基化敏感性限制性酶的識別位點的粘端的序列，并且由25至150個堿基的序列組成。
21.除非另有定義，否則本文使用的所有技術(shù)和科學(xué)術(shù)語都具有與本領(lǐng)域普通技術(shù)人員通常理解相同的含義。下述參考文獻為技術(shù)人員提供了本說明書中使用的各種術(shù)語的一般定義：singleton等人，dictionary of microbiology and molecular bioloty(第2版1994)；the cambridge dictionary of science and technology(walkered.，1988)；以及hale&marham，the harper collins dictionaryof biology。
22.在下文中，將詳細描述本發(fā)明。
23.本發(fā)明涉及在cfdna中篩選癌癥特異性去甲基化標記物的方法，其包括：(a)用甲基化敏感性限制性酶處理從對象的血液中分離的cfdna(無細胞dna)；(b)分析每個片段的序列；(c)獲得來自片段的n末端處的預(yù)定長度的序列信息；(d)計數(shù)每個序列信息的頻率；并且(e)篩選癌癥特異性序列信息作為cfdna中的癌癥特異性去甲基化標記物。
24.甲基化
25.可以使用本發(fā)明中的以純化或未純化形式的任何核酸，并且可以使用包含或懷疑包含含有靶位點的核酸序列的任何核酸(例如，含有cpg的核酸)。可以差異地甲基化的核酸位點是cpg序列的c位置，并且甲基化在其中g(shù)pg密集的cpg島中是特別高的。在某些位點處，cpg島的密度是基因組的其它區(qū)域的10倍。cpg島具有約60％的平均g*c比率，而正常dna顯示出40％的平均g*c比率。cpg島的長度通常為約1-2kb，并且在人基因組中存在約45,000個cpg島。
26.通常，樣品核酸是dna。然而，也可以使用核酸混合物。待檢測的特定核酸序列可以是大分子的一部分，并且該特定序列可以從一開始就以構(gòu)成整個核酸序列的分離分子的形式存在。核酸序列無需是以純形式存在的核酸，并且核酸可以是例如含有完整的人dna的復(fù)雜混合物內(nèi)的小部分。用于測量樣品中包含的核酸的甲基化程度或用于檢測甲基化cpg島的樣品中包含的核酸可以通過本領(lǐng)域已知的常規(guī)方法進行提取。
27.測序
28.測序方法包括例如桑格測序、高通量測序、焦磷酸測序、邊合成邊測序、單分子測序、納米孔測序、半導(dǎo)體測序、邊連接邊測序、雜交測序、rna-seq(illumina)、數(shù)字基因表達(helicos)、下一代測序(ngs)、通過合成的單分子測序(smss)(helicose)、大規(guī)模平行測序、克隆單分子陣列[solexa]、鳥法測序、ion torrent、oxford nanopores、roche genia、maxim-gilbert測序、引物步移；pacbio、solid、ion torrent或使用納米孔平臺的測序。測序反應(yīng)可以在各種樣品加工單元中進行，所述單元可以是多重泳道、多重通道、多重孔、或基本上同時加工多組樣品的其它手段。樣品加工單元還可以包括允許同時加工多重進行的多重樣品腔室。
[0029]
可以對一種或多種類型的核酸進行測序反應(yīng)，所述核酸中的至少一種已知含有疾病的標記物。測序反應(yīng)也可以對樣品中存在的任何核酸片段進行。
[0030]
可以使用多重測序進行同時測序反應(yīng)。在一些情況下，可以在至少1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000個測序反應(yīng)中，對無細胞核酸進行測序。在其它情況下，可以在少于1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000個測序反應(yīng)中，對無細胞核酸進行測序。測序反應(yīng)可以序貫或同時進行。可以對測序反應(yīng)的全部或部分進行后續(xù)數(shù)據(jù)分析。在一些情況下，可以對至少1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000個測序反應(yīng)進行數(shù)據(jù)分析。在其它情況下，可以對小于1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000個測序反應(yīng)進行數(shù)據(jù)分析。示例性讀取深度是每個基因座(堿基)1000-50000個讀數(shù)。
[0031]
樣品
[0032]
樣品可以是從對象中分離的任何生物樣品。樣品可以是身體樣品。樣品可以包括身體組織，例如已知或疑似實體瘤、全血、血清、血漿、糞便、白細胞或淋巴細胞、內(nèi)皮細胞、組織活組織檢查、腦脊髓液、滑液、淋巴液、腹水、間質(zhì)液或細胞外液、細胞間隙液(包括來自牙齦的流體)、骨髓、胸膜滲出物、腦脊髓液、唾液、粘液、痰、精液、汗、尿。樣品可以以最初從對象中分離的形式進行進一步加工，或者去除或添加組分例如細胞，或者與另一種組分相比，使一種組分富集。樣品可以從對象中分離或獲得并運輸?shù)綐悠贩治鰣鏊悠房梢栽谒铚囟壤缡覝亍?℃、-20℃和/或-80℃下貯存且運送。樣品可以在樣品分析場所從對象中進行分離或獲得。
[0033]
對象可以是人、哺乳動物、動物、寵物動物、服務(wù)動物或?qū)櫸铩ο罂赡芑加屑膊　ο罂赡軟]有疾病或可檢測到的疾病癥狀。個體可能已用一種或多種療法進行，所述療法例如手術(shù)、、給藥、化學(xué)療法、抗體、疫苗或生物制劑中的任何一種或多種。對象可能處于緩解中或可能并未處于緩解中。
[0034]
血液樣品中的無細胞核酸
[0035]
血液樣品可能含有不同量的含有基因組當(dāng)量的核酸。例如，約33ng dna的樣品可能包含約10,000(104)個單倍體人基因組當(dāng)量，并且在cfdna的情況下，約2000億(2x10
11
)個個別多核苷酸分子。類似地，約100ng dna的樣品可能含有約30,000個單倍體人基因組當(dāng)量，并且在cfdna的情況下，約6000億個個別分子。
[0036]
在擴增之前的樣品中的無細胞核酸的示例性量范圍為約1fg至約1μg，例如1pg至200ng、1ng至100ng、10ng至1000ng。例如，該量可以是約600ng或更少、約500ng或更少、約
400ng或更少、約300ng或更少、約200ng或更少、約100ng或更少、約50ng或更少、或約20ng或更少、或約10ng或更少、或約5ng或更少、或約1ng或更少的無細胞核酸分子。該量可以是至少1fg、至少10fg、至少100fg、至少1pg、至少10pg、至少100pg、至少1ng、至少10ng、至少100ng、至少150ng、或至少200ng的無細胞核酸分子。該量可以是1飛克(fg)、10fg、100fg、1皮克(pg)、10pg、100pg、1ng、10ng、100ng、150ng或200ng或更少的無細胞核酸分子。該方法可以包括獲得1飛克(fg)至200ng。
[0037]
無細胞核酸是不包含在細胞內(nèi)或不以其它方式與細胞結(jié)合的核酸，或者是在去除完整細胞后保留在樣品中的核酸。無細胞核酸包括dna、rna及其雜合物，包括基因組dna、線粒體dna、sirna、mirna、循環(huán)rna(crna)、trna、rrna、小核仁rna(snorna)、piwi相互作用rna(pirna)、長鏈非編碼rna(長ncrna)、或這些中的任一種的片段。無細胞核酸可以是雙鏈的、單鏈的或其雜合物。無細胞核酸可以通過分泌或細胞死亡過程如細胞壞死和凋亡而釋放到體液內(nèi)。一些無細胞核酸從癌細胞釋放到體液內(nèi)，例如循環(huán)腫瘤dna(ctdna)。其它的從健康細胞中釋放。在一些實施方案中，無細胞核酸由腫瘤細胞產(chǎn)生。在一些實施方案中，無細胞核酸由腫瘤細胞和非腫瘤細胞的混合物產(chǎn)生。
[0038]
無細胞核酸顯示出例如約100至500個核苷酸的長度分布，并且110至約230個核苷酸的分子構(gòu)成這些分子的約90％，隨后為在240至440個核苷酸的范圍內(nèi)的第二個小峰。
[0039]
無細胞核酸可以通過分級分離或拆分步驟從體液中分離，并且如本文在溶液中發(fā)現(xiàn)的無細胞核酸與完整細胞和體液的其它不溶性組分分開。拆分可以包括技術(shù)如離心或過濾。可替代地，可以裂解體液中的細胞，并且無細胞核酸和細胞核酸可以一起進行加工。一般而言，在緩沖液添加和洗滌步驟后，核酸可以用乙醇進行沉淀。另外的純化步驟可以去除污染物或鹽，例如使用基于硅的柱。在反應(yīng)自始至終添加非特異性大部分載體核酸，例如cot-1 dna，dna或用于亞硫酸氫鹽測序、雜交和/或連接的蛋白質(zhì)，使得可以優(yōu)化該程序的某些方面，例如產(chǎn)率。
[0040]
在此類加工后，樣品可以含有以各種形式的核酸，包括雙鏈dna、單鏈dna和單鏈rna。在一些實施方案中，單鏈dna和rna可以轉(zhuǎn)換為雙鏈形式，使得它們包括在后續(xù)加工和分析步驟中。
[0041]
在本發(fā)明的一個實施方案中，cfdna可以衍生自人基因組dna，或者它可以衍生自與人共存或被人感染的除人外的細胞、細菌、真菌或病毒的dna。
[0042]
在本發(fā)明的一個實施方案中，用于在cfdna中篩選癌癥特異性去甲基化標記物的方法可以包括下述步驟：
[0043]
(a)用甲基化敏感性限制性酶處理從對象的血液中分離的cfdna(無細胞dna)；
[0044]
(b)分析每個片段的序列；
[0045]
(c)獲得來自片段的n末端處的預(yù)定長度的序列信息；
[0046]
(d)計數(shù)每個序列信息的頻率；
[0047]
(e)篩選癌癥特異性序列信息作為cfdna中的癌癥特異性去甲基化標記物。
[0048]
步驟(a)是處理從血液中分離的cfdna(無細胞dna)中的甲基化敏感性限制性酶的步驟。
[0049]
cfdna從對象中進行分離。優(yōu)選地，cfdna可以從血漿中進行分離。分離方法可以通過本領(lǐng)域已知的常規(guī)dna分離方法進行，其中可以獲得適合于限制性酶處理和測序的純度。
[0050]
在本發(fā)明的一個實施方案中，甲基化敏感性限制性酶是aatii、acli、agei、aor13hi i、asci、asisi、avai、bsahi、bsiei、bsiwi、bspdi、bsrfi、bsshii、bstbi、clai、cpo i、eagi、fsei、haeii、hhai、hinp1i、hpaii(或hapii)、hpych4iv、hpy99i、kasi、mlui、nari、ngomiv、noti、paer7i、pluti、pvui、rsrii、sacii、sali、sgrai或tspmi。優(yōu)選地，本發(fā)明的甲基化敏感性限制性酶i)選擇性地切割未甲基化的靶區(qū)域，ii)切割的端部形成粘端(不是平端)，因此銜接子與互補粘端的綴合效率可以是增加的，因此它可以具有可以制備高質(zhì)量文庫的特性。
[0051]
在本發(fā)明的一個實施方案中，甲基化敏感性限制性酶優(yōu)選為能夠選擇性地切割cpg甲基化的酶，即能夠特異性地切割包括去甲基化cpg的限制性酶識別位點的酶。然而，取決于基因組中存在多少限制性酶識別位點，需要整個基因組的覆蓋和測序的分析成本可能不同，使得可以根據(jù)目的選擇適當(dāng)?shù)南拗菩悦浮?br/>[0052]
表1.
[0053][0054]
(
↓
指示限制位點)
[0055]
步驟(b)是對每個片段進行測序的步驟。
[0056]
在本發(fā)明的一個實施方案中，序列翻譯通過本領(lǐng)域已知的序列翻譯方法進行。序列翻譯翻譯通過甲基化敏感性限制性酶切割或未切割的每個片段的序列。由于序列翻譯讀取大量片段，優(yōu)選至少10000或更多、至少20000或更多、至少30000或更多、至少40000或更多、至少50000或更多、至少100000或更多、至少1000000或更多個片段，因此用于此的合適測序方法是優(yōu)選的。
[0057]
對于測序，可以使用本領(lǐng)域已知的測序方法，但可以使用大量序列的任何可能測序方法，以便對足夠數(shù)量的每個片段進行測序，而無限制。例如，如果使用下一代測序方法(ngs)，則它具有下述優(yōu)點：可以在18小時內(nèi)以低成本測序大量序列，并且在讀取足夠量的序列時準確性非常高,并且可以對測序數(shù)據(jù)進行定性和定量分析。
[0058]
對于序列翻譯，優(yōu)選地，可以附著適當(dāng)?shù)你暯幼樱沟每梢苑g僅通過甲基化敏感
性限制性酶切割的dna片段。取決于甲基化狀態(tài)，樣品中的dna可能通過甲基化敏感性限制性酶進行切割或可能不被切割。例如，它在正常人cfdna中是甲基化的，但在檢測癌變和去甲基化的癌癥dna的情況下，如果僅去甲基化和切割的片段可以進行測序，則很容易檢測到以極低比率混合的cfdna。因此，如果使用具有與通過經(jīng)由甲基化敏感性限制性酶切割產(chǎn)生的粘端互補的結(jié)構(gòu)的銜接子，則由于文庫僅由切割片段制備，因此在翻譯階段選擇性地解釋癌癥誘導(dǎo)的片段是可能的。
[0059]
步驟(c)是獲得來自片段的5'端的預(yù)定長度的序列信息的步驟。
[0060]
在本發(fā)明的一個實施方案中，術(shù)語
‘
預(yù)定長度’指示來自每個序列翻譯片段的5'端的堿基或堿基對的長度，并且可以優(yōu)選為25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150個堿基。同時，取決于待篩查或分析的癌癥、樣品的類型等等，預(yù)定長度可以是小于25的自然數(shù)和大于150的自然數(shù)之一。更優(yōu)選地，預(yù)定長度可以是30、60、80或90個堿基。另外，在本發(fā)明的一個實施方案中，
‘
預(yù)定長度’可以是從5到1000的任何自然數(shù)。
[0061]
步驟(d)是計數(shù)每個序列信息的頻率的步驟。
[0062]
在所得到的序列信息中，將從5'端開始的每個序列信息的頻率計數(shù)為通過限制性酶切割生成的粘端序列(在hpaii的情況下為cgg)。即，計數(shù)通過對一個樣品測序獲得的來自所有序列的一個預(yù)定長度(例如30)的序列類型(在30nt的情況下，4
30
種序列理論上是可能的)，計數(shù)每種序列出現(xiàn)的次數(shù)。對計數(shù)的每個序列的值進行歸一化，用于與其它樣品的值的比較。這種歸一化是將每個聚集值除以與測序的量成比例的值，用于在關(guān)于每個樣品的讀出量不同時，樣品之間的直接定量比較。在這種情況下，各種值是可能的，例如每個樣品中翻譯的序列總數(shù)和映射到看家基因區(qū)域的序列數(shù)目，作為與翻譯的量成比例的值。
[0063]
步驟(e)是篩選癌癥特異性序列信息作為cfdna中的癌癥特異性去甲基化標記物的步驟。
[0064]
在正常樣品組和癌癥樣品組中，比較關(guān)于預(yù)定長度的每個序列組合的計數(shù)且歸一化的值，以選擇癌癥樣品組中顯著更高的預(yù)定長度的序列作為標記物。最簡單的是，在每個預(yù)定長度的序列組合中，使用正常樣品組和癌癥樣品組的平均值之間的差異，或者使用各種統(tǒng)計技術(shù)例如t檢驗、曼懷二氏檢驗、威爾科克森檢驗或cohen氏d檢驗等等，來選擇在兩個樣品組中具有顯著差異的序列。在該實施方案中，對于乳腺癌和肺癌，我們分析了平均值中的差異。
[0065]
篩選的癌癥特異性去甲基化標記物可以是對于提供樣品的對象定制的標記物，并且可以是通常應(yīng)用于癌癥類型、階段、種族或家族的標記物。
[0066]
在本發(fā)明的一個實施方案中，cfdna中的癌癥特異性去甲基化標記物是n末端序列在限制性酶的識別位點中切割后的剩余區(qū)域的序列，并且它由與預(yù)定長度具有相同長度的核苷酸序列組成。例如，hpaii限制性酶識別ccgg堿基并且在c和c之間進行切割。因此，限制性片段的n末端以cgg開始。由于癌癥特異性去甲基化標記物具有預(yù)定長度的核苷酸序列，
因此如果預(yù)定長度為30，則它選自cggnnnnnnnnnnnnnnnnnnnnnnnnnnn(seq id no:38)的序列(n為任意堿基，30bp)。在這種情況下，由于n為27，因此理論上可以存在4
27
(＝18,014,398,509,481,984)個片段，并且在其中篩選癌癥特異性去甲基化標記物。如果預(yù)定長度為60，則癌癥特異性去甲基化標記物的長度為60個堿基，并且預(yù)定長度與癌癥特異性去甲基化標記物的長度是相同的。
[0067]
另外，本發(fā)明涉及癌癥診斷方法，其包括：
[0068]
從對象中分離的血液中分離cfdna；用甲基化敏感性限制性酶處理分離的cfdna(無細胞dna)；分析每個片段的序列；獲得來自片段的n末端處的預(yù)定長度的序列信息；計數(shù)每個序列信息的頻率；計算cfdna中的癌癥特異性去甲基化標記物的頻率并確定癌癥。
[0069]
在本發(fā)明的一個實施方案中，對象是需要診斷癌癥的患者。在本發(fā)明的一個實施方案中，預(yù)定長度是與cfdna中的癌癥特異性去甲基化標記物相同的長度。在本發(fā)明的一個實施方案中，cfdna中的癌癥特異性去甲基化標記物是由1至50種，優(yōu)選3至40種，更優(yōu)選5至30種標記物組成的標記物集合。
[0070]
另外，本發(fā)明涉及分析從對象中分離的cfdna的甲基化敏感性限制性酶片段的n末端處的預(yù)定長度的序列信息，以提供關(guān)于癌癥診斷所需的信息的方法。
[0071]
另外，根據(jù)本發(fā)明，n末端是甲基化敏感性限制性酶的識別位點的粘端的序列(例如cgg的序列)，由連續(xù)的25至150個堿基(優(yōu)選30個堿基、35個堿基、40個堿基、45個堿基或50個堿基)的序列組成，它提供了通過本發(fā)明的方法篩選的cfdna中的癌癥特異性去甲基化標記物，本段落的粘端的序列可以選自acgtc(seq id no:39)、atcg(seq id no:40)、atcgc(seq id no:41)、ccgga(seq id no:42)、ccggc(seq id no:43)、ccggcc(seq id no:44)、ccggg(seq id no:45)、ccggt(seq id no:46)、ccggy(seq id no:47)、ccggyg(seq id no:48)、cg(seq id no:49)、cgaa(seq id no:50)、cgat(seq id no:51)、cgc(seq id no:52)、cgcc(seq id no:53)、cgcgc(seq id no:54)、cgcgcc(seq id no:55)、cgcgt(seq id no:56)、cgg(seq id no:57)、cgt(seq id no:58)、cgtt(seq id no:59)、cgwcg(seq id no:60)、cgyc(seq id no:61)、gcgcc(seq id no:62)、gcgcy(seq id no:63)、gcgg(seq id no:64)、ggccg(seq id no:65)、ggccgc(seq id no:66)、gtacg(seq id no:67)、gwccg(seq id no:68)、rycg(seq id no:69)、tcgac(seq id no:70)、tcgag(seq id no:71)和ycgrg(seq id no:72)。在這種情況下，堿基的指示遵循標準符號，例如，a代表腺嘌呤，c是胞嘧啶，t是胸腺嘧啶，g是鳥嘌呤，y是c或t，w是a或t，r是a或g。
[0072]
在本發(fā)明的一個實施方案中，癌癥可以是但不限于宮頸癌、肺癌、胰腺癌、肝癌、結(jié)腸癌、骨癌、皮膚癌、頭或頸癌、皮膚或眼內(nèi)黑素瘤、子宮癌、卵巢癌、直腸癌、胃癌、肛門癌、結(jié)腸癌、乳腺癌、輸卵管癌、子宮內(nèi)膜癌、陰道癌、外陰癌、食道癌、小腸癌、內(nèi)分泌腺癌、甲狀腺癌、甲狀旁腺癌、腎上腺癌、軟組織肉瘤、尿道癌、陰莖癌、前列腺癌、膀胱癌、腎癌或輸尿管癌。
[0073]
用于癌癥疾病診斷的分析
[0074]
診斷方法可以用于診斷對象中狀況，特別是疾病的存在，或表征狀況(例如，確定癌癥的分期或確定癌癥的異質(zhì)性)，或監(jiān)測對狀況的的應(yīng)答，或者預(yù)測發(fā)展狀況或狀況的后續(xù)過程的風(fēng)險。本公開內(nèi)容還可以用于確定特定療法的功效。在另一個實例中，特定療法可能與在一段時間內(nèi)癌癥的遺傳譜相關(guān)聯(lián)。此類相關(guān)性可能可用于選擇療法。另外，如果
在后觀察到癌癥處于緩解中，則診斷方法可以用于監(jiān)測殘留疾病或疾病的復(fù)發(fā)。
[0075]
遺傳數(shù)據(jù)也可以用于表征癌癥的特定形式。癌癥在組成和分期兩個方面經(jīng)常是異質(zhì)的。遺傳譜數(shù)據(jù)可能允許表征癌癥的特定亞型，其在診斷或該特定亞型的癌癥中可能是重要的。此類信息還可以為對象或從業(yè)者提供關(guān)于癌癥的特定類型的預(yù)后的線索，并且允許對象或從業(yè)者在疾病進展時采用選項。一些癌癥可以進展以變得更具侵襲性和遺傳不穩(wěn)定。其它癌癥可以保持良性、不活躍或休眠。本公開內(nèi)容的系統(tǒng)和方法可以用于確定疾病進展。
[0076]
標記物和實驗對象組
[0077]
本發(fā)明將每種標記物個別地用作診斷或預(yù)測標記物，或者可以通過將幾種標記物組合用作實驗對象組展示形式，并且可以通過甲基化位點的整體模式或列表來鑒定幾種標記物以改善可靠性和效率。本發(fā)明中鑒定的標記物可以個別地使用或作為組合的標記物集合使用。可以根據(jù)一起甲基化的標記物的數(shù)目和重要性，對標記物進行排序、加權(quán)和發(fā)展疾病的可能性水平。此類算法屬于本發(fā)明。
[0078]
基底
[0079]
靶核酸位點可以與在固體支持物(基底)上固定的已知探針雜交。
[0080]
如本文使用的，“基底”意指包含物質(zhì)、結(jié)構(gòu)、表面或材料、非生物、合成、無生命、平面、球形或特異性結(jié)合的材料，平面表面的混合物，它可以包括超出雜交或酶識別位點的許多其它識別位點，或者許多其它識別位點或眾多其它分子種類由表面、結(jié)構(gòu)或材料構(gòu)成。基底可以是例如半導(dǎo)體、(有機)合成金屬、合成半導(dǎo)體、絕緣體和摻雜劑；金屬、合金、元素、化合物和礦物質(zhì)；合成、拆卸、蝕刻、平版印刷、印刷、微型制造的載玻片、裝置、結(jié)構(gòu)和表面；工業(yè)聚合物、塑料、膜、硅酮、硅酸鹽、玻璃、金屬和陶瓷；木材、紙、紙板、棉花、羊毛、布、織造和非織造纖維、材料和織物，但不限于此。
[0081]
本領(lǐng)域已知某些類型的膜對核酸序列具有粘附性。此類膜的一個具體的非限制性實例是用于檢測基因表達的膜，例如商業(yè)上使用的膜如硝酸纖維素或聚氯乙烯、重氮化紙以及商品名genescreen、商品名zetaprobe和商品名nytran等等。還包括珠、玻璃、晶片和金屬基底。用于將核酸粘附到此類物體的方法是本領(lǐng)域眾所周知的。可替代地，篩選也可以在液相中進行。
[0082]
有益效果
[0083]
因此，本發(fā)明的方法可以在cfdna中篩選癌癥特異性去甲基化標記物，并且篩選的標記物可以提供關(guān)于癌癥的診斷、方案的監(jiān)測和癌癥患者的預(yù)后所需的信息，并且因此可以有用地用于抗癌。
附圖說明
[0084]
圖1a是在乳腺癌患者樣品組和正常樣品組中，通過用hpaii處理的分析結(jié)果的實例，并且圖1b是其示意圖。
[0085]
圖2a通過標準化(z評分)映射到乳腺癌患者樣品組和正常樣品組中用sacii處理的酶限制位點的讀數(shù)數(shù)目，顯示了在兩個樣品組之間具有統(tǒng)計學(xué)顯著差異的區(qū)域。圖2b是通過使用在圖2a的過程中提取的乳腺癌特異性標記物，以計算乳腺癌預(yù)測概率值(0.0至1.0)創(chuàng)建機器學(xué)習(xí)模型，來說明正常組和乳腺癌組之間的概率值差異的圖解。圖2c顯示了
通過使模型重復(fù)學(xué)習(xí)20次，經(jīng)由每個測試樣品的平均概率值的roc(接受者操作特性)曲線，并且表示了auc(曲線下面積：0.0至1.0)值。
[0086]
圖3a是在乳腺癌患者樣品組和正常樣品組中，通過用hpaii處理的分析結(jié)果的實例，圖3b是其示意圖。
[0087]
圖4a通過標準化(z評分)映射到肺癌患者樣品組和正常樣品組中用sacii處理的酶限制位點的讀數(shù)數(shù)目，顯示了在兩個樣品組之間具有統(tǒng)計學(xué)顯著差異的區(qū)域。圖4b是通過使用在圖2a的過程中提取的肺癌特異性標記物，以計算肺癌預(yù)測概率值(0.0至1.0)創(chuàng)建機器學(xué)習(xí)模型，來說明正常組和肺癌組之間的概率值差異的圖解。圖4c顯示了通過使模型重復(fù)學(xué)習(xí)20次，經(jīng)由每個測試樣品的平均概率值的roc(接受者操作特性)曲線，并且表示了auc(曲線下面積：0.0至1.0)值。圖4d是關(guān)于肺癌分類的每個階段的roc曲線圖解。
[0088]
實施發(fā)明的方式
[0089]
在下文中，將詳細描述本發(fā)明。
[0090]
然而，下述實施例僅說明本發(fā)明，并且本發(fā)明的內(nèi)容并不限于下述實施例。
[0091]
實驗方法
[0092]
1.從血液中分離cfdna
[0093]
乳腺癌患者(n＝102)、肺癌患者(n＝75)和健康人(n＝139)經(jīng)受在僅cfdna血管收集中的血液收集。分離的血液以2000rpm離心20分鐘，以分離血漿。將分離的血漿(上清液)轉(zhuǎn)移到1.5ml管中，并且以16000rpm離心10分鐘。其后，根據(jù)制造商的說明書，使用chemagen cfdna prep設(shè)備分離cfdna。
[0094]
2.文庫產(chǎn)生
[0095]
在將分離的cfdna的端部制備成平端后，誘導(dǎo)a拖尾，并且在此誘導(dǎo)p7銜接子與cfdna的連接。進行限制性酶hpaii處理，以切割去甲基化的ccgg位點。在此時，在甲基化cpg的情況下，它不受hpaii的限制。向其中添加具有hpaii粘端的p5銜接子，并且連接通過hpaii切割的cfdna片段，并且將這用作分析文庫。
[0096]
3.序列信息的分析
[0097]
關(guān)于每個樣品的分析文庫用作ngs，以獲得關(guān)于文庫中包括的每個序列的序列信息。從每個樣品的解碼序列中，選擇以限制性酶識別序列(對于hpaii為cgg，對于sacii為gc)開始的序列，并且從所選序列的5'獲得一定長度(例如30、60、80等)的序列信息，并且根據(jù)預(yù)定長度對序列進行分類。對每個樣品中的分類序列的頻率進行計數(shù)且歸一化，用于樣品之間的比較。對于每個序列候選物，與正常樣品組相比，在癌癥樣品組中鑒定了顯著更高的讀取序列，在此時，由于該序列在癌癥樣品組中特異性地去甲基化，因此它可以被選擇作為去甲基化標記物(在hpaii的情況下；在切割甲基化位點的限制性酶的情況下的甲基化標記物)。對于給定標記物對于每個樣品獲得平均值(dhm評分)，并且確定可以區(qū)分癌癥樣品與正常樣品的dhm評分的參考值。該dhm評分用于樣品的判斷。
[0098]
4.樣品的檢查和癌癥發(fā)生率的確定
[0099]
根據(jù)上述實驗方法和分析方法，對未知樣品進行測序且分析。獲得dhm評分，其是對應(yīng)于序列信息的分析(第3項)中選擇的標記物的值的平均值，如果它高于預(yù)定的dhm參考值，則確定存在癌癥。
[0100]
實施例1：篩選關(guān)于乳腺癌cfdna的癌癥特異性去甲基化標記物和使用其的確定準
確性測試
[0101]
從34個乳腺癌樣品組和53個正常樣品中分離的cfdna用甲基化敏感性限制性酶之一hpaii進行限制，并且根據(jù)上述實驗方法進行測序和分析。在翻譯的序列中，對以cgg開始的序列的前80nt的序列進行計數(shù)，并且作為標記物候選物進行比較。選擇乳腺癌中關(guān)于每種標記物的平均值為5或更多并且是正常組的平均值的10倍或更多的173種標記物作為標記物，并且獲得其為每個樣品中的這173個值的平均值的dhm評分。
[0102]
作為圖1中所示的結(jié)果，創(chuàng)建了表格，其中記錄了關(guān)于乳腺癌和正常樣品的每種標記物的歸一化評分，為了使得更易于查看評分，它表示為熱圖，其中高數(shù)目為紅且低數(shù)目為藍。圖1a顯示了173種標記物的上半部分，在所選的標記物中，可以看出除了3個樣品之外的31個樣品在乳腺癌樣品中具有高于一定水平的值，而所有樣品在正常樣品中具有接近于0的值。
[0103]
圖1b是顯示dhm評分的條形圖，所述dhm評分是圖1a中所示的每個樣品的173種標記物值的平均值。基于dhm評分1，可以看出乳腺癌和正常樣品被明確地區(qū)分。
[0104]
作為比較乳腺癌組和正常組的dhm評分的結(jié)果，當(dāng)dhm評分設(shè)為1時，34個乳腺癌樣品中的31個被判斷為乳腺癌，53個正常樣品中的所有53個都可以被判斷為平常的。作為計算準確性的結(jié)果，靈敏度為91.2％，且特異性為100％(參見圖1a和1b)。
[0105]
實施例2：篩選關(guān)于用sacii處理的乳腺癌cfdna的癌癥特異性去甲基化標記物和使用其的確定準確性測試
[0106]
從102個乳腺癌樣品和139個正常樣品中分離的cfdna用甲基化敏感性限制性酶sacii進行限制，并且根據(jù)上述實驗方法進行測序和分析。在解碼的序列中，對以gc開始的序列的前80nt的序列進行計數(shù)，并且作為標記物候選物進行比較。
[0107]
每種標記物通過iqr(四分位間距)平均值進行歸一化，并且通過z評分進行標準化，以減少在測序之間可能出現(xiàn)的差異。此后，對于每種標記物，在乳腺癌組和正常組之間進行t檢驗，以選擇其p值低于特定閾值(例如，10-5
)的標記物，并且通過所選標記物計算最終的dhm評分。可以通過將每個樣品關(guān)于所選標記物的相應(yīng)值簡單地相加來計算最終評分，可以通過創(chuàng)建機器學(xué)習(xí)的分類模型例如邏輯回歸分析，將其計算為預(yù)測概率值。
[0108]
作為圖2a中所示的結(jié)果，創(chuàng)建了表格，其中記錄了關(guān)于乳腺癌和正常樣品的每種標記物的歸一化/標準化的值，為了使得更易于查看評分，它表示為熱圖，其中高數(shù)目為紅且低數(shù)目為綠。通過經(jīng)由所選標記物創(chuàng)建機器學(xué)習(xí)預(yù)測模型，并且通過創(chuàng)建概率值從0到1的結(jié)果值，圖2b確認了在乳腺癌組和正常組之間的概率值分布中存在明確差異。
[0109]
在圖2c中，在機器學(xué)習(xí)模型測試方法中使用k折交叉驗證，對于每個循環(huán)以8:2進行訓(xùn)練組和測試組的隨機抽取，通過將該操作重復(fù)20次，經(jīng)由對于一個樣品的20個不同訓(xùn)練數(shù)據(jù)計算結(jié)果值，獲取平均值，并且繪制roc(接受者操作特性)曲線以測量表現(xiàn)。
[0110]
作為比較乳腺癌組和正常組的dhm評分的結(jié)果，發(fā)現(xiàn)auc為0.9492，并且基于100％的特異性，靈敏度為70.87％(參見圖2c)。
[0111]
實施例3：篩選關(guān)于肺癌cfdna的癌癥特異性去甲基化標記物和使用其的確定準確性測試
[0112]
當(dāng)肺癌組的11個樣品和53個正常樣品組用30nt的長度進行比較時，存在與正常組的平均值相比，在肺癌組中其值為5倍或更多的198種標記物、以及其值為10倍或更多的157
種標記物。dhm評分通過將每個樣品中的所有這198個值相加而獲得。
[0113]
作為圖3a中所示的結(jié)果，創(chuàng)建了表格，其記錄了關(guān)于肺癌和正常樣品的每種標記物的歸一化評分，為了使得更易于查看評分，它表示為熱圖，其中高數(shù)目為紅且低數(shù)目為藍。圖3a顯示了198種標記物的頂部部分。在所選的標記物中，除了3個樣品之外的8個樣品在肺癌樣品中具有高于參考值的值，而所有樣品具有3或更低的值，其低于正常樣品中的參考值4。
[0114]
圖3b是顯示dhm評分的條形圖，所述dhm評分是圖3a中所示的每個樣品的198種標記物值的平均值。基于dhm評分4，明確地區(qū)分肺癌和正常樣品。
[0115]
作為比較肺癌組和正常組的dhm評分的結(jié)果，如果dhm評分基于4，則11個肺癌樣品中的8個被判斷為肺癌，并且53個正常樣品中的所有53個都可以被判斷為平常的。作為計算準確性的結(jié)果，靈敏度為72.7％，且特異性為100％(參見圖3a和3b)。
[0116]
實施例4：篩選關(guān)于用sacii處理的肺癌cfdna的癌癥特異性去甲基化標記物和使用其的確定準確性測試
[0117]
從75個肺癌樣品和129個正常樣品中分離的cfdna用甲基化敏感性限制性酶之一sacii進行限制，根據(jù)上述實驗方法進行測序和分析。在解碼的序列中，對以gc開始的序列的前80nt的序列進行計數(shù)，并且作為標記物候選物進行比較。
[0118]
每種標記物通過iqr(四分位間距)平均值進行歸一化，并且通過z評分進行標準化，以減少在測序之間可能出現(xiàn)的差異。其后，對于每種標記物，在肺癌組和正常組之間進行t檢驗，并且選擇其p值低于一定閾值(例如，10-5
)的標記物，通過所選標記物計算最終的dhm評分。可以通過將每個樣品關(guān)于所選標記物的相應(yīng)值簡單地相加來計算最終評分，可以通過創(chuàng)建機器學(xué)習(xí)的分類模型例如邏輯回歸分析，將其計算為預(yù)測概率值。
[0119]
作為圖4a中所示的結(jié)果，創(chuàng)建了表格，其中記錄了關(guān)于肺癌和正常樣品的每種標記物的歸一化/標準化的值，為了使得更易于查看評分，它表示為熱圖，其中高數(shù)目為紅且低數(shù)目為綠。通過經(jīng)由所選標記物創(chuàng)建機器學(xué)習(xí)預(yù)測模型，并且通過創(chuàng)建概率值從0到1的結(jié)果值，圖4b確認了在乳腺癌組和正常組之間的概率值分布中存在明確差異。
[0120]
在圖4c中，在機器學(xué)習(xí)模型測試方法中使用k折交叉驗證，對于每個循環(huán)以8:2進行訓(xùn)練組和測試組的隨機抽取，通過將該操作重復(fù)20次，經(jīng)由對于一個樣品的20個不同訓(xùn)練數(shù)據(jù)計算結(jié)果值，獲取平均值，并且繪制roc(接受者操作特性)曲線以測量表現(xiàn)。圖4d顯示了根據(jù)肺癌的每個階段分類的樣品的準確性。
[0121]
作為比較肺癌組和正常組的dhm評分的結(jié)果，發(fā)現(xiàn)auc為0.8837，并且基于100％的特異性，靈敏度為41.67％(參見圖4c)。
[0122]
工業(yè)適用性
[0123]
如上所述，本發(fā)明的方法可以在cfdna中篩選癌癥特異性去甲基化標記物，并且篩選的標記物可以提供關(guān)于癌癥的診斷、方案的監(jiān)測和癌癥患者的預(yù)后所需的信息，并且因此可以有用地用于抗癌。

技術(shù)特征：

1.一種在cfdna中篩選癌癥特異性去甲基化標記物的方法，其包括：(a)用甲基化敏感性限制性酶處理從對象中分離的cfdna(無細胞dna)；(b)分析每個片段的序列；(c)獲得來自所述片段的n末端的預(yù)定長度的序列信息；(d)計數(shù)每個所述序列信息的頻率；(e)篩選癌癥特異性序列信息作為cfdna中的癌癥特異性去甲基化標記物。2.根據(jù)權(quán)利要求1的方法，其中所述甲基化敏感性限制性酶選自aatii、acli、agei、aor13h i、asci、asisi、avai、bsahi、bsiei、bsiwi、bspdi、bsrfi、bsshii、bstbi、clai、cpo i、eagi、fsei、haeii、hhai、hinp1i、hpaii、hpych4iv、hpy99i、kasi、mlui、nari、ngomiv、noti、paer7i、pluti、pvui、rsrii、sacii、sali、sgrai和tspmi。3.根據(jù)權(quán)利要求1的方法，其中分析所述序列通過下一代測序(ngs)來進行。4.根據(jù)權(quán)利要求1的方法，其中所述預(yù)定長度是選自以下的任何一個長度的堿基：25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149和150。5.根據(jù)權(quán)利要求1的方法，其中所述cfdna中的癌癥特異性去甲基化標記物的n末端序列是所述限制性酶的識別位點的粘端序列，并且其中所述核苷酸序列由與預(yù)定長度相同的長度組成。6.根據(jù)權(quán)利要求1的方法，其中所述癌癥選自宮頸癌、肺癌、胰腺癌、肝癌、結(jié)腸癌、骨癌、皮膚癌、頭或頸癌、皮膚或眼內(nèi)黑素瘤、子宮癌、卵巢癌、直腸癌、胃癌、肛門癌、結(jié)腸癌、乳腺癌、輸卵管癌、子宮內(nèi)膜癌、陰道癌、外陰癌、食道癌、小腸癌、內(nèi)分泌腺癌、甲狀腺癌、甲狀旁腺癌、腎上腺癌、軟組織肉瘤、尿道癌、陰莖癌、前列腺癌、膀胱癌、腎癌和輸尿管癌。7.一種癌癥診斷方法，其包括：(a)用甲基化敏感性限制性酶處理從對象中分離的cfdna(無細胞dna)；(b)分析每個片段的序列；(c)獲得來自所述片段的n末端的預(yù)定長度的序列信息；(d)計數(shù)每個所述序列信息的頻率；(e)計算cfdna中的癌癥特異性去甲基化標記物的頻率并確定癌癥。8.根據(jù)權(quán)利要求7的方法，其中所述對象是需要癌癥診斷的患者。9.根據(jù)權(quán)利要求7的方法，其中所述預(yù)定長度與所述cfdna中的癌癥特異性去甲基化標記物相同。10.根據(jù)權(quán)利要求7的方法，其中所述cfdna中的癌癥特異性去甲基化標記物是由5至50種標記物組成的標記物集合。11.一種分析從對象中分離的cfdna的甲基化敏感性限制性酶片段的n末端處的預(yù)定長度的序列信息以提供癌癥診斷所需信息的方法。
12.一種通過權(quán)利要求1的方法選擇的cfdna中的癌癥特異性去甲基化標記物，其中所述癌癥特異性去甲基化標記物的n末端是甲基化敏感性限制性酶的識別位點的粘端的序列，并且由25至150個堿基的序列組成。13.根據(jù)權(quán)利要求12的癌癥特異性去甲基化標記物，其中所述粘端序列選自acgtc(seq id no:39)、atcg(seq id no:40)、atcgc(seq id no:41)、ccgga(seq id no:42)、ccggc(seq id no:43)、ccggcc(seq id no:44)、ccggg(seq id no:45)、ccggt(seq id no:46)、ccggy(seq id no:47)、ccggyg(seq id no:48)、cg(seq id no:49)、cgaa(seq id no:50)、cgat(seq id no:51)、cgc(seq id no:52)、cgcc(seq id no:53)、cgcgc(seq id no:54)、cgcgcc(seq id no:55)、cgcgt(seq id no:56)、cgg(seq id no:57)、cgt(seq id no:58)、cgtt(seq id no:59)、cgwcg(seq id no:60)、cgyc(seq id no:61)、gcgcc(seq id no:62)、gcgcy(seq id no:63)、gcgg(seq id no:64)、ggccg(seq id no:65)、ggccgc(seq id no:66)、gtacg(seq id no:67)、gwccg(seq id no:68)、rycg(seq id no:69)、tcgac(seq id no:70)、tcgag(seq id no:71)和ycgrg(seq id no:72)。

技術(shù)總結(jié)

本發(fā)明涉及使用核酸甲基化的差異的標記物篩選方法、去甲基化標記物和使用標記物的診斷方法，更具體而言，涉及使用游離核酸中的甲基化差異篩選疾病特異性去甲基化標記物的新型方法，并且涉及通過計算經(jīng)由該方法篩選的去甲基化標記物和標記物的頻率，通過甲基化檢測用于確定癌癥的新癌癥診斷方法，并且涉及所選cfDA中的癌癥特異性去甲基化標記物。cfDA中的癌癥特異性去甲基化標記物。cfDA中的癌癥特異性去甲基化標記物。