一種信息提取方法、裝置、電子設(shè)備及存儲介質(zhì)與流程
1.本發(fā)明實施例涉及自然語言處理技術(shù)領(lǐng)域,尤其涉及一種信息提取方法、裝置、電子設(shè)備及存儲介質(zhì)。
背景技術(shù):
2.表格是人們?nèi)粘9ぷ魃钪惺殖S玫奈募问健榱烁玫乩帽砀瘢槍Υ蝗藗儜?yīng)用的目標(biāo)字段,需要從表格中自動提取出目標(biāo)字段的字段值。
3.在以表格樣式為基準(zhǔn)進(jìn)行表格劃分的情況下,可以將表格劃分為制式表格以及非制式表格。目前常用的信息提取方案,只能從制式表格中提取出字段值,而無法從非制式表格中提取出字段值,通用性較差。
技術(shù)實現(xiàn)要素:
4.本發(fā)明實施例提供了一種信息提取方法、裝置、電子設(shè)備及存儲介質(zhì),以實現(xiàn)從任意表格樣式下的表格中自動提取出目標(biāo)字段的字段值的效果。
5.根據(jù)本發(fā)明的一方面,提供了一種信息提取方法,可以包括:
6.獲取待應(yīng)用的目標(biāo)字段以及從表格中提取出來的文本信息;
7.從文本信息中召回與目標(biāo)字段匹配的鍵信息,并基于鍵信息從文本信息中召回至少一個候選信息;
8.針對每個候選信息,確定將候選信息作為與鍵信息匹配的值信息的可行性,以基于各候選信息的可行性,對各候選信息進(jìn)行排序;
9.基于各候選信息的排序結(jié)果,從各候選信息中確定出目標(biāo)信息,并將目標(biāo)信息作為從表格中提取出來的目標(biāo)字段的字段值。
10.根據(jù)本發(fā)明的另一方面,提供了一種信息提取裝置,可以包括:
11.文本信息獲取模塊,用于獲取待應(yīng)用的目標(biāo)字段以及從表格中提取出來的文本信息;
12.候選信息召回模塊,用于從文本信息中召回與目標(biāo)字段匹配的鍵信息,并基于鍵信息從文本信息中召回至少一個候選信息;
13.候選信息排序模塊,用于針對每個候選信息,確定將候選信息作為鍵信息匹配的值信息的可行性,以基于各候選信息的可行性,對各候選信息進(jìn)行排序;
14.字段值提取模塊,用于基于各候選信息的排序結(jié)果,從各候選信息中確定目標(biāo)信息,并將目標(biāo)信息作為從表格中提取出來的目標(biāo)字段的字段值。
15.根據(jù)本發(fā)明的另一方面,提供了一種電子設(shè)備,可以包括:
16.至少一個處理器;以及
17.與至少一個處理器通信連接的存儲器;其中,
18.存儲器存儲有可被至少一個處理器執(zhí)行的計算機(jī)程序,計算機(jī)程序被至少一個處理器執(zhí)行,以使至少一個處理器執(zhí)行時實現(xiàn)本發(fā)明任意實施例所提供的信息提取方法。
19.根據(jù)本發(fā)明的另一方面,提供了一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)指令,該計算機(jī)指令用于使處理器執(zhí)行時實現(xiàn)本發(fā)明任意實施例所提供的信息提取方法。
20.本發(fā)明實施例的技術(shù)方案,通過獲取待應(yīng)用的目標(biāo)字段以及從表格中提取出來的文本信息;針對每個目標(biāo)字段,從文本信息中召回與目標(biāo)字段匹配的鍵信息,并基于鍵信息從文本信息中召回至少一個候選信息;進(jìn)一步,針對每個候選信息,確定將候選信息作為與鍵信息匹配的值信息的可行性,從而基于各候選信息的可行性,對各候選信息進(jìn)行排序;這樣一來,可以基于各候選信息的排序結(jié)果,從各候選信息中確定目標(biāo)信息,即最有可能與鍵信息組合為鍵值對的候選信息,從而將目標(biāo)信息作為從表格中提取出來的目標(biāo)字段的字段值。上述技術(shù)方案,實現(xiàn)了從任意表格樣式下的表格(如制式表格或是非制式表格)中自動提取出目標(biāo)字段的字段值的效果,具有較大的應(yīng)用空間。
21.應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識本發(fā)明的實施例的關(guān)鍵或是重要特征,也不用于限制本發(fā)明的范圍。本發(fā)明的其它特征將通過以下的說明書而變得容易理解。
附圖說明
22.為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
23.圖1a是本發(fā)明任意實施例中提及的非制式表格的第一示意圖;
24.圖1b是本發(fā)明任意實施例中提及的非制式表格的第二示意圖;
25.圖2是根據(jù)本發(fā)明實施例提供的一種信息提取方法的流程圖;
26.圖3是根據(jù)本發(fā)明實施例提供的另一種信息提取方法的流程圖;
27.圖4是根據(jù)本發(fā)明實施例提供的另一種信息提取方法的流程圖;
28.圖5是根據(jù)本發(fā)明實施例提供的另一種信息提取方法的流程圖;
29.圖6a是根據(jù)本發(fā)明實施例提供的另一種信息提取方法中可選示例的架構(gòu)圖;
30.圖6b是根據(jù)本發(fā)明實施例提供的另一種信息提取方法中可選示例的流程圖;
31.圖7是根據(jù)本發(fā)明實施例提供的一種信息提取裝置的結(jié)構(gòu)框圖;
32.圖8是實現(xiàn)本發(fā)明實施例的信息提取方法的電子設(shè)備的結(jié)構(gòu)示意圖。
具體實施方式
33.為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分的實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都應(yīng)當(dāng)屬于本發(fā)明保護(hù)的范圍。
34.需要說明的是,本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語“第一”、“第二”等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本發(fā)明的實施例能夠以除了在這里圖示或描述的那些以外的順序?qū)嵤!澳繕?biāo)”、“原始”等的情況類似,在此不再贅述。此外,術(shù)語“包
括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
35.在介紹本發(fā)明實施例之前,先對本發(fā)明實施例的應(yīng)用場景進(jìn)行示例性說明:以通過表格形式呈現(xiàn)的食品生產(chǎn)單為例,針對食品生產(chǎn)場景中涉及的一些常規(guī)字段,例如保質(zhì)期、規(guī)格和凈重等,如果這些常規(guī)字段在不同的食品生產(chǎn)公司提供的食品生產(chǎn)單上的位置相同,那么這樣的食品生產(chǎn)單即為制式表格;否則,這樣的食品生產(chǎn)單即為非制式表格,示例性的,如圖1a和圖1b所示,這二者是由兩個食品生產(chǎn)公司分別提供的食品生產(chǎn)單,顯然,保質(zhì)期、規(guī)格和凈重等這些常規(guī)字段在兩個食品生產(chǎn)單中的位置并不相同。基于上述分析可知,制式表格的表格模式是固定的,因此可以基于表格模式從制式表格中提取出字段值;相應(yīng)的,非制式表格的表格模式并非是固定的且很難窮舉,因此無法基于表格模式從非制式表格中提取出字段值。
36.圖2是本發(fā)明實施例中所提供的一種信息提取方法的流程圖。本實施例可適用于從任意表格樣式下的表格中自動提取出目標(biāo)字段的字段值的情況,尤其適用于從非制式表格中自動提取出目標(biāo)字段的字段值的情況。該方法可以由本發(fā)明實施例提供的信息提取裝置來執(zhí)行,該裝置可由軟件和/或硬件的方式實現(xiàn),該裝置可以集成在電子設(shè)備上,該電子設(shè)備可以是各種用戶終端或是服務(wù)器。
37.參見圖2,本發(fā)明實施例的方法具體包括如下步驟:
38.s110、獲取待應(yīng)用的目標(biāo)字段以及從表格中提取出來的文本信息。
39.其中,目標(biāo)字段可以理解為需將其的字段值從表格中提取出來以進(jìn)行應(yīng)用的字段,例如上述示例中的保質(zhì)期、規(guī)格和凈重等,這里的字段值可以理解為目標(biāo)字段的具體數(shù)值,例如保質(zhì)期的字段值可以是2022/12/23。在實際應(yīng)用中,可選的,目標(biāo)字段的數(shù)量可以是一個、兩個或多個,在此未做具體限定。在此基礎(chǔ)上,在存在至少兩個目標(biāo)字段的情況下,可以針對每個目標(biāo)字段分別進(jìn)行下述處理,從而從表格中分別提取出每個目標(biāo)字段的字段值。
40.文本信息可以理解為對表格中的文本進(jìn)行提取后得到的信息,其可以表示該文本的實質(zhì)含義或是在表格中的位置等,在此未做具體限定。結(jié)合到本發(fā)明實施例可能涉及的應(yīng)用場景,這里的文本多是文本塊的概念,即基于至少兩個文本構(gòu)成的可以表達(dá)一定含義的文本塊,例如基于保、質(zhì)和期這三個文本構(gòu)成的保質(zhì)期這個文本塊。在實際應(yīng)用中,可選的,可以通過如下步驟提取到文本信息:獲取對表格進(jìn)行圖像采集后得到的表格圖像;基于光學(xué)字符識別(optical character recognition,ocr)技術(shù)從表格圖像中提取得到文本信息。當(dāng)然,也可以通過其余方式提取到文本信息,在此未做具體限定。
41.s120、從文本信息中召回與目標(biāo)字段匹配的鍵信息,并基于鍵信息從文本信息中召回至少一個候選信息。
42.其中,從文本信息中召回與目標(biāo)字段匹配的鍵信息,該鍵信息可以理解為目標(biāo)字段在表格中的具體表現(xiàn),例如保質(zhì)期匹配的鍵信息可以是保質(zhì)期、保質(zhì)日期、有效日期、有效期至、保質(zhì)期至、最佳使用日期或是此日期前最佳等,這如表格的初始設(shè)定有關(guān),在此未做具體限定。
43.基于鍵信息從文本信息中召回候選信息,該候選信息可以理解為文本信息中的可
能作為與鍵信息匹配的值信息的信息,即可能作為目標(biāo)字段在表格中的字段值的信息。候選信息的數(shù)量可以是一個、兩個或多個,在此未做具體限定。
44.s130、針對每個候選信息,確定將候選信息作為與鍵信息匹配的值信息的可行性,以基于各候選信息的可行性,對各候選信息進(jìn)行排序。
45.其中,針對每個候選信息,確定將該候選信息作為與鍵信息匹配的值信息的可行性,即該可行性可以表示出將該候選信息與鍵信息構(gòu)成鍵(key)值(value)對的可能性大小。這樣一來,在得到每個候選信息的可行性后,可以基于這些候選信息的可行性,對這些候選信息進(jìn)行排序,例如按照可行性進(jìn)行升序排序或是降序排序等,從而得到這些候選信息的排序結(jié)果。
46.在實際應(yīng)用中,可選的,可以通過多種方式確定該候選信息作為與鍵信息匹配的值信息的可行性,例如確定該候選信息在表格中的候選位置以及鍵信息在表格中的鍵位置,然后根據(jù)候選位置和鍵位置間的位置相距距離確定該候選信息的可行性;再如確定該候選信息與鍵信息在語義或是上下文上的匹配度,然后根據(jù)匹配度確定該候選信息的可行性;再如根據(jù)位置相距距離和匹配度來綜合確定該候選信息的可行性;等等,在此未做具體限定。再可選的,這里的可行性也可以通過評分進(jìn)行表示,即這里確定該候選信息的可行性的過程,也可以理解為對該候選信息與鍵信息組合成鍵值對的可行性進(jìn)行評分的過程。
47.s140、基于各候選信息的排序結(jié)果,從各候選信息中確定目標(biāo)信息,并將目標(biāo)信息作為從表格中提取出來的目標(biāo)字段的字段值。
48.其中,基于各候選信息的排序結(jié)果,從各候選信息中確定出目標(biāo)信息,該目標(biāo)信息可以理解為這些候選信息中很有可能作為鍵信息匹配的值信息的候選信息,即很有可能與鍵信息組合成鍵值對的候選信息。這樣一來,可以將目標(biāo)信息直接作為從表格中提取出來的目標(biāo)字段的字段值。在實際應(yīng)用中,可選的,目標(biāo)信息的數(shù)量可以是一個、兩個或是多個,在存在至少兩個信息的情況下,這時可以理解為將該至少兩個目標(biāo)信息均作為目標(biāo)字段的字段值進(jìn)行返回,以讓用戶從該至少兩個目標(biāo)信息中選擇出一個進(jìn)行應(yīng)用。
49.結(jié)合到本發(fā)明實施例可能涉及的應(yīng)用場景,為了降低用戶的選擇工作量,可以快速獲取到目標(biāo)字段的字段值,可以基于各候選信息的排序結(jié)果,確定各候選信息中的可行性最高的候選信息,并將該可行性最高的候選信息作為目標(biāo)信息,即將唯一的目標(biāo)信息進(jìn)行返回,從而讓用戶可以直接獲取到字段值。
50.本發(fā)明實施例的技術(shù)方案,通過獲取待應(yīng)用的目標(biāo)字段以及從表格中提取出來的文本信息;針對每個目標(biāo)字段,從文本信息中召回與目標(biāo)字段匹配的鍵信息,并基于鍵信息從文本信息中召回至少一個候選信息;進(jìn)一步,針對每個候選信息,確定將候選信息作為與鍵信息匹配的值信息的可行性,從而基于各候選信息的可行性,對各候選信息進(jìn)行排序;這樣一來,可以基于各候選信息的排序結(jié)果,從各候選信息中確定目標(biāo)信息,即最有可能與鍵信息組合為鍵值對的候選信息,從而將目標(biāo)信息作為從表格中提取出來的目標(biāo)字段的字段值。上述技術(shù)方案,實現(xiàn)了從任意表格樣式下的表格(如制式表格或是非制式表格)中自動提取出目標(biāo)字段的字段值的效果,具有較大的應(yīng)用空間。
51.圖3是本發(fā)明實施例中提供的另一種信息提取方法的流程圖。本實施例以上述各技術(shù)方案為基礎(chǔ)進(jìn)行優(yōu)化。在本實施例中,可選的,從文本信息中召回與目標(biāo)字段匹配的鍵信息,可包括:獲取預(yù)先配置的與目標(biāo)字段匹配的鍵模式,并從文本信息中召回與鍵模式匹
配的鍵信息;基于鍵信息從文本信息中召回至少一個候選信息,可包括:從文本信息中召回位于鍵信息的預(yù)設(shè)位置上的中間信息;獲取預(yù)先配置的與目標(biāo)字段匹配的值模式,并基于值模式從中間信息中召回至少一個候選信息。其中,與上述各實施例相同或相應(yīng)的術(shù)語的解釋在此不再贅述。
52.參見圖3,本實施例的方法具體可以包括如下步驟:
53.s210、獲取待應(yīng)用的目標(biāo)字段以及從表格中提取出來的文本信息。
54.s220、獲取預(yù)先配置的與目標(biāo)字段匹配的鍵模式,并從文本信息中召回與鍵模式匹配的鍵信息。
55.其中,考慮到目標(biāo)字段在不同表格中的具體表現(xiàn)可能存在差異,例如上文中舉例的保質(zhì)期這個目標(biāo)字段在某表格中的具體表現(xiàn)可能是保質(zhì)期、保質(zhì)日期、有效日期、有效期至、保質(zhì)期至、最佳使用日期或此日期前最佳等,因此為了從文本信息中快速并且準(zhǔn)確召回與目標(biāo)字段匹配的鍵信息,可以預(yù)先配置有與目標(biāo)字段匹配的鍵模式,例如保質(zhì)期、保質(zhì)日期、有效日期、有效期至、保質(zhì)期至、最佳使用日期以及此日期前最佳等均可以作為與保質(zhì)期匹配的鍵模式,從而可以基于鍵模式從文本信息中召回鍵信息。
56.s230、從文本信息中召回位于鍵信息的預(yù)設(shè)位置上的中間信息。
57.其中,考慮到可與鍵信息組合為鍵值對的值信息,通常位于鍵信息的某些位置上,該位置可以理解為這些信息在表格中的位置,因此可以從文本信息中召回位于鍵信息的預(yù)設(shè)位置上的中間信息,該中間信息可以理解為有可能與鍵信息組合為鍵值對的值信息。結(jié)合到本發(fā)明實施例可能涉及的應(yīng)用場景,這里的預(yù)設(shè)位置可以理解為右側(cè)和/或下側(cè),當(dāng)然,也可以是左側(cè)和/或上側(cè),這是與表格的初始設(shè)定有關(guān),在此未做具體限定。
58.s240、獲取預(yù)先配置的與目標(biāo)字段匹配的值模式,并且基于值模式從中間信息中召回至少一個候選信息。
59.其中,類似于鍵模式,為了從中間信息中快速并且準(zhǔn)確召回可能與鍵信息組合為鍵值對的候選信息,可以預(yù)先配置有與目標(biāo)字段匹配的值模式,例如與保質(zhì)期匹配的值模式可以是\d{2}/\d{2}/\d{4}(具體舉例是23/12/2022)、\d{4}/\d{2}/\d{2}(具體舉例是2022/12/23)、\d{2}/\d{2}/\d{2}(具體舉例是22/12/23)、\d{2}\.\d{2}\.\d{2}(具體舉例是23.12.22)、\d{2}\.\d{2}\.\d{4}(具體舉例是23.12.2022)、\d{4}\.\d{2}\.\d{2}(具體舉例是2022.12.23)、\d{4}\-\d{2}\-\d{2}(具體舉例是2022-12-23)或是\d{2}\-\d{2}\-\d{4}(具體舉例是23-12-2022)等。由于鍵信息與目標(biāo)字段匹配,并且值模式也與目標(biāo)字段匹配,因此可以基于值模式從中間信息中召回可能與值信息配對的候選信息。
60.在實際應(yīng)用中,可選的,鍵模式與值模式可以通過正則表達(dá)式的方式配置在配置文件中,當(dāng)然,也可以通過其余方式進(jìn)行配置,在此未做具體限定。
61.s250、針對每個候選信息,確定將候選信息作為與鍵信息匹配的值信息的可行性,以基于各候選信息的可行性,對各候選信息進(jìn)行排序。
62.s260、基于各候選信息的排序結(jié)果,從各候選信息中確定目標(biāo)信息,并將目標(biāo)信息作為從表格中提取出來的目標(biāo)字段的字段值。
63.本發(fā)明實施例的技術(shù)方案,通過預(yù)先配置的與目標(biāo)字段相匹配的鍵模式,可以從文本信息中召回與目標(biāo)字段匹配的值信息;進(jìn)而,考慮到與鍵信息配對的值信息通常位于鍵信息的某些位置上,因此可以先從文本信息中召回位于鍵信息的預(yù)設(shè)位置上的中間信
息,然后通過預(yù)先配置的與目標(biāo)字段匹配的值模式,從中間信息中召回至少一個候選信息,上述方案利用可以橫向擴(kuò)展的鍵模式與值模式,由此實現(xiàn)了鍵信息與候選信息的快速并且準(zhǔn)確召回的效果。
64.圖4是本發(fā)明實施例中提供的另一種信息提取方法的流程圖。本實施例以上述各技術(shù)方案為基礎(chǔ)進(jìn)行優(yōu)化。在本實施例中,可選的,確定將候選信息作為與鍵信息匹配的值信息的可行性,可包括:分別獲取包圍住候選信息的候選框以及包圍住鍵信息的鍵框;針對候選框的左框線上的第一點以及鍵框的右框線上的第二點,確定第一點與第二點間的左右相距距離;針對候選框的上框線上的第三點以及鍵框的下框線上的第四點,確定第三點與第四點間的上下相距距離;根據(jù)左右相距距離和上下相距距離,確定將候選信息作為與鍵信息匹配的值信息的可行性。其中,與上述各實施例相同或相應(yīng)的術(shù)語的解釋在此不再贅述。
65.參見圖4,本實施例的方法具體可以包括如下步驟:
66.s310、獲取待應(yīng)用的目標(biāo)字段以及從表格中提取出來的文本信息。
67.s320、從文本信息中召回與目標(biāo)字段匹配的鍵信息,并基于鍵信息從文本信息中召回至少一個候選信息。
68.s330、針對每個候選信息,分別獲取包圍住候選信息的候選框以及包圍住鍵信息的鍵框。
69.s340、針對候選框的左框線上的第一點及鍵框的右框線上的第二點,確定第一點與第二點間的左右相距距離。
70.其中,結(jié)合本發(fā)明實施例可能涉及的應(yīng)用場景,候選框基本位于鍵框的正右側(cè)、正下側(cè)或是右下側(cè),因此可以通過兩個框的左右相距距離以及上下相距距離來確定將候選信息作為與鍵信息匹配的值信息的可行性。
71.具體的,第一點可以是候選框的左框線上的點,在實際應(yīng)用中,可選的,其可以是左框線上的第一上頂點、第一中間點以及第一下頂點中的至少一個,在此未做具體限定。類似的,第二點可以是鍵框的右框線上的點,在實際應(yīng)用中,可選的,其可以是右框線上的第二上頂點、第二中間點以及第二下頂點中的至少一個,在此未做具體限定。在此基礎(chǔ)上,可以將第一點與第二點之間的相距距離作為左右相距距離,該左右相距距離可通過第一點在表格中第一位置以及第二點在表格中的第二位置間的相距距離進(jìn)行表示。
72.s350、針對候選框的上框線上的第三點及鍵框的下框線上的第四點,確定第三點與第四點間的上下相距距離。
73.其中,第三點可以是候選框的上框線上的點,在實際應(yīng)用中,可選的,其可以是上框線上的第三左頂點、第三中間點及第三右頂點中的至少一個,在此未做具體限定。類似的,第四點可以是鍵框的下框線上的點,在實際應(yīng)用中,可選的,其可以是下框線上的第四左頂點、第四中間點及第四右頂點中的至少一個,在此未做具體限定。在此基礎(chǔ)上,可以將第三點與第四點間的相距距離作為上下相距距離,該上下相距距離可通過第三點在表格中第三位置以及第四點在表格中的第四位置間的相距距離進(jìn)行表示。
74.s360、根據(jù)左右相距距離和上下相距距離,確定將候選信息作為與鍵信息匹配的值信息的可行性,以基于各候選信息的可行性,對各候選信息進(jìn)行排序。
75.其中,根據(jù)左右相距距離和上下相距距離,確定候選信息的可行性,例如根據(jù)左右
相距距離和上下相距距離確定平均相距距離,然后基于平均相距距離確定候選信息的可行性;再如基于左右相距距離和上下相距距離中的較小相距距離,表示候選信息的可行性;等等,在此未做具體限定。
76.s370、基于各候選信息的排序結(jié)果,從各候選信息中確定目標(biāo)信息,并將目標(biāo)信息作為從表格中提取出來的目標(biāo)字段的字段值。
77.本發(fā)明實施例的技術(shù)方案,通過分別獲取包圍住候選信息的候選框及包圍住鍵信息的鍵框,然后確定候選框的左框線上的第一點以及鍵框的右框線上的第二點間的左右相距距離,以及確定候選框的上框線上的第三點及鍵框的下框線上的第四點間的上下相距距離,從而可以根據(jù)左右相距距離和上下相距距離,確定將候選信息作為與鍵信息匹配的值信息的可行性,由此實現(xiàn)了候選信息的可行性的準(zhǔn)確確定的效果。
78.一種可選的技術(shù)方案,第一點包括第一上頂點、第一中間點和第一下頂點,第二點包括第二上頂點、第二中間點和第二下頂點,確定第一點與第二點間的左右相距距離,可以包括:確定第一上頂點和第二上頂點間的上頂點相距距離、第一中間點和第二中間點間的中間點相距距離、以及第一下頂點和第二下頂點間的下頂點相距距離;獲取預(yù)先設(shè)置的上頂點權(quán)重、中間點權(quán)重及下頂點權(quán)重;根據(jù)上頂點相距距離以及上頂點權(quán)重確定上頂點權(quán)重距離,根據(jù)中間點相距距離以及中間點權(quán)重確定中間點權(quán)重距離,并且根據(jù)下頂點相距距離以及下頂點權(quán)重確定下頂點權(quán)重距離;根據(jù)上頂點權(quán)重距離、中間點權(quán)重距離以及下頂點權(quán)重距離,確定第一點與第二點間的左右相距距離。
79.為了更加形象地理解如何確定每個候選信息的可行性,下面結(jié)合具體示例對其進(jìn)行示例性說明。示例性的:
80.第一上頂點記為p
v1
,第一中間點記為p
v2
,第一下頂點記為p
v3
;
81.第二上頂點記為p
k1
,第二中間點記為p
k2
,第二下頂點記為p
k3
;
82.第三左頂點記為p
v4
,第三中間點記為p
v5
,第三右頂點記為p
v6
;
83.第四左頂點記為p
k4
,第四中間點記為p
k5
,第四右頂點記為p
k6
。
84.針對p
k1
和p
v1
、p
k2
和p
v2
、p
k3
和p
v3
、p
k4
和p
v4
、p
k5
和p
v5
及p
k6
和p
v6
分別計算歐式距離,得到的6對歐式距離分別為d
11
,d
22
,d
33
,d
44
,d
55
,d
66
。在此基礎(chǔ)上,與這6對歐式距離分別對應(yīng)的權(quán)重記為w
11
,w
22
,w
33
,w
44
,w
55
,w
66
。
85.那么左右相距距離dr可以通過如下式子計算得到:
86.dr=w
11
*d
11
+w
22
*d
22
+w
33
*d
33
87.上下相距距離db可以通過如下式子計算得到:
88.db=w
44
*d
44
+w
55
*d
55
+w
66
*d
66
89.至此,最小相距距離df可以通過如下式子計算得到,并基于df表示可行性:
90.df=min(dr,db)。
91.圖5是本發(fā)明實施例中提供的另一種信息提取方法的流程圖。本實施例以上述各技術(shù)方案為基礎(chǔ)進(jìn)行優(yōu)化。在本實施例中,可選的,在基于各候選信息的可行性,對各候選信息進(jìn)行排序之后,上述信息提取方法,還可包括:基于排序后的各候選信息的可行性,從排序后的各候選信息中過濾掉與鍵信息無關(guān)的無關(guān)信息,得到保留下來的各候選信息;基于各候選信息的排序結(jié)果,從各候選信息中確定目標(biāo)信息,可以包括:在保留下來的各候選信息非空的情況下,基于保留下來的各候選信息的排序結(jié)果,從保留下來的各候選信息中
確定目標(biāo)信息。其中,與上述各實施例相同或相應(yīng)的術(shù)語的解釋在此不再贅述。
92.參見圖5,本實施例的方法具體可以包括如下步驟:
93.s410、獲取待應(yīng)用的目標(biāo)字段以及從表格中提取出來的文本信息。
94.s420、從文本信息中召回與目標(biāo)字段匹配的鍵信息,并基于鍵信息從文本信息中召回至少一個候選信息。
95.s430、針對每個候選信息,確定將候選信息作為與鍵信息匹配的值信息的可行性,以基于各候選信息的可行性,對各候選信息進(jìn)行排序。
96.s440、基于排序后的各候選信息的可行性,從排序后的各候選信息中過濾掉與鍵信息無關(guān)的無關(guān)信息,得到保留下來的各候選信息。
97.其中,考慮到可能出現(xiàn)召回的至少一個候選信息均不是目標(biāo)字段的字段值的情況,因此為了保證后續(xù)返回的字段值的準(zhǔn)確性,可以基于排序后的各候選信息的可行性,從排序后的各候選信息中過濾掉與鍵信息無關(guān)的無關(guān)信息,即從排序后的各候選信息中過濾掉明顯不是目標(biāo)字段的字段值的候選信息。至此,保留下來的各候選信息可以認(rèn)為是有一定可能與鍵信息成功配對的候選信息,由此保證了后續(xù)返回的字段值的準(zhǔn)確性。
98.示例性的,假設(shè)通過上述示例中的df表示可行性,那么可以預(yù)先設(shè)定相距距離閾值,在按照df對各候選信息進(jìn)行升序排序時,可將排序后的各候選信息中的首個大于相距距離閾值的df對應(yīng)的候選信息以及排序在該候選信息之后的各個候選信息均作為無用信息;在按照df對各候選信息進(jìn)行降序排序時,可以將排序后的各候選信息中的首個小于相距距離閾值的df對應(yīng)的候選信息之前的各個候選信息均作為無用信息;等等。
99.s450、在保留下來的各候選信息非空的情況下,基于保留下來的各候選信息的排序結(jié)果,從保留下來的各候選信息中確定目標(biāo)信息,并將目標(biāo)信息作為從表格中提取出來的目標(biāo)字段的字段值。
100.其中,經(jīng)過上述步驟可能出現(xiàn)全部候選信息均過濾掉的情況,因此本步驟可以在確定保留下來的各候選信息非空的情況下,基于保留下來的各候選信息的排序結(jié)果,從保留下來的各候選信息中確定目標(biāo)信息。
101.示例性的,在按照df對各候選信息進(jìn)行升序排序時,可以將保留下來的各候選信息中的排在首位的候選信息作為目標(biāo)信息;在按照df對各候選信息進(jìn)行降序排序時,可以將保留下來的各候選信息中的排在末尾的候選信息作為目標(biāo)信息;等等,在此未做具體限定。
102.本發(fā)明實施例的技術(shù)方案,通過排序后的各候選信息的可行性,從排序后的各候選信息中過濾掉與鍵信息無關(guān)的無關(guān)信息(即明顯不是目標(biāo)字段的字段值的候選信息),從而可以在保留下來的各候選信息非空的情況下,基于保留下來的各候選信息的排序結(jié)果,從保留下來的各候選信息中確定出目標(biāo)信息,由此保證了返回的字段值的準(zhǔn)確性。
103.為了從整體上更好地理解上述的各個技術(shù)方案,下面結(jié)合具體示例,對其進(jìn)行示例性說明。參見圖6a,上述信息提取方法可以基于信息提取系統(tǒng)實現(xiàn),該信息提取系統(tǒng)可以包括配置模塊、召回模塊、排序模塊和后過濾模塊。其中,配置模塊,用于保存鍵模式和值模式等配置信息;召回模塊,用于從ocr結(jié)果(即文本信息)中召回與目標(biāo)字段匹配的鍵信息以及可能與鍵信息匹配的至少一個候選信息;排序模塊,用于針對召回的鍵信息以及每個候選信息進(jìn)行評分計算,從而根據(jù)評分結(jié)果對各個候選信息進(jìn)行排序;后過濾模塊,用于對排
序結(jié)果進(jìn)行后處理,過濾掉其中明顯與鍵信息不匹配的候選信息。
104.在此基礎(chǔ)上,基于如圖6b所示的流程,從表格中提取出目標(biāo)字段的字段值:
105.1.分別為各個目標(biāo)字段在配置文件中配置鍵模式(pattern)和值模式;
106.2.通過ocr技術(shù)從表格圖像中識別出文本信息。接下來幾個步驟是針對各個目標(biāo)字段中當(dāng)前正在處理的目標(biāo)字段進(jìn)行的;
107.3.按照與目標(biāo)字段匹配的鍵模式,從文本信息中召回鍵信息;
108.4.在鍵信息的右側(cè)和下側(cè),結(jié)合與目標(biāo)字段匹配的值模式,從文本信息中召回至少一個候選信息:
109.5.針對每個候選信息,對該候選信息與鍵信息組合為鍵值對的可行性進(jìn)行評分,并根據(jù)評分結(jié)果對各候選信息進(jìn)行排序,得到排序結(jié)果;
110.6.對排序結(jié)果進(jìn)行過濾,例如過濾掉明顯與鍵信息不匹配的候選信息;
111.7.在按照df對各候選信息進(jìn)行升序排序的情況下,返回過濾后保留下來的各候選信息中的top1。
112.圖7為本發(fā)明實施例中提供的信息提取裝置的結(jié)構(gòu)框圖,該裝置用于執(zhí)行上述任意實施例所提供的信息提取方法。該裝置與上述各實施例的信息提取方法屬于同一個發(fā)明構(gòu)思,在信息提取裝置的實施例中未詳盡描述的細(xì)節(jié)內(nèi)容,可以參考上述信息提取方法的實施例。參見圖7,該裝置具體可以包括:文本信息獲取模塊510、候選信息召回模塊520、候選信息排序模塊530以及字段值提取模塊540。
113.其中,文本信息獲取模塊510,用于獲取待應(yīng)用的目標(biāo)字段以及從表格中提取出來的文本信息;
114.候選信息召回模塊520,用于從文本信息中召回與目標(biāo)字段匹配的鍵信息,并基于鍵信息從文本信息中召回至少一個候選信息;
115.候選信息排序模塊530,用于針對每個候選信息,確定將候選信息作為鍵信息匹配的值信息的可行性,以基于各候選信息的可行性,對各候選信息進(jìn)行排序;
116.字段值提取模塊540,用于基于各候選信息的排序結(jié)果,從各候選信息中確定目標(biāo)信息,并將目標(biāo)信息作為從表格中提取出來的目標(biāo)字段的字段值。
117.可選的,候選信息召回模塊520,可以包括:
118.鍵信息召回單元,用于獲取預(yù)先配置的與目標(biāo)字段匹配的鍵模式,并且從文本信息中召回與鍵模式匹配的鍵信息;
119.中間信息召回單元,用于從文本信息中召回位于該鍵信息的預(yù)設(shè)位置上的中間信息;
120.候選信息召回單元,用于獲取預(yù)先配置的與目標(biāo)字段匹配的值模式,并且基于值模式從中間信息中召回至少一個候選信息。
121.可選的,候選信息排序模塊530,可以包括:
122.鍵框獲取單元,用于分別獲取包圍住候選信息的候選框以及包圍住鍵信息的鍵框;
123.左右相距距離確定單元,用于針對候選框的左框線上的第一點以及鍵框的右框線上的第二點,確定第一點與第二點間的左右相距距離;
124.上下相距距離確定單元,用于針對候選框的上框線上的第三點以及鍵框的下框線
上的第四點,確定第三點與第四點間的上下相距距離;
125.可行性確定單元,用于根據(jù)左右相距距離以及上下相距距離,確定將候選信息作為與鍵信息匹配的值信息的可行性。
126.在此基礎(chǔ)上,可選的,第一點包括第一上頂點、第一中間點和第一下頂點,第二點包括第二上頂點、第二中間點和第二下頂點,左右相距距離確定單元,可以包括:
127.下頂點相距距離確定子單元,用于確定第一上頂點和第二上頂點間的上頂點相距距離、第一中間點和第二中間點間的中間點相距距離、以及第一下頂點和第二下頂點間的下頂點相距距離;
128.下頂點權(quán)重獲取子單元,用于獲取預(yù)先設(shè)置的上頂點權(quán)重、中間點權(quán)重以及下頂點權(quán)重;
129.下頂點權(quán)重距離確定子單元,用于根據(jù)上頂點相距距離及上頂點權(quán)重確定上頂點權(quán)重距離,根據(jù)中間點相距距離以及中間點權(quán)重確定中間點權(quán)重距離,并且根據(jù)下頂點相距距離以及下頂點權(quán)重確定下頂點權(quán)重距離;
130.左右相距距離確定子單元,用于根據(jù)上頂點權(quán)重距離、中間點權(quán)重距離以及下頂點權(quán)重距離,確定第一點與第二點間的左右相距距離。
131.再可選的,可行性確定單元,具體可用于:基于左右相距距離和上下相距距離中的較小相距距離,表示候選信息作為與鍵信息匹配的值信息的可行性。
132.可選的,字段值提取模塊540,可以包括:
133.目標(biāo)信息第一確定單元,用于基于各候選信息的排序結(jié)果,確定各候選信息中的可行性最高的候選信息,并將可行性最高的候選信息作為目標(biāo)信息。
134.可選的,上述信息提取裝置,還可以包括:
135.候選信息過濾模塊,用于基于排序后的各候選信息的可行性,從排序后的各候選信息中過濾掉與鍵信息無關(guān)的無關(guān)信息,得到保留下來的各候選信息;
136.字段值提取模塊540,可以包括:
137.目標(biāo)信息確定第二單元,用于保留下來的各候選信息非空的情況下,基于保留下來的各候選信息的排序結(jié)果,從保留下來的各候選信息中確定目標(biāo)信息。
138.可選的,上述信息提取裝置,還可以包括:表格圖像獲取模塊,用于獲取對表格進(jìn)行圖像采集后得到的表格圖像;文本信息提取模塊,用于基于光學(xué)字符識別技術(shù)從表格圖像中提取出文本信息。
139.本發(fā)明實施例提供的信息提取裝置,通過文本信息獲取模塊獲取待應(yīng)用的目標(biāo)字段及從表格中提取出來的文本信息;通過候選信息召回模塊,針對每個目標(biāo)字段,從文本信息中召回與目標(biāo)字段匹配的鍵信息,并基于鍵信息從文本信息中召回至少一個候選信息;進(jìn)而,通過候選信息排序模塊,針對每個候選信息,確定將候選信息作為與鍵信息匹配的值信息的可行性,從而基于各候選信息的可行性,對各候選信息進(jìn)行排序;這樣一來,通過字段值提取模塊可以基于各候選信息的排序結(jié)果,從各候選信息中確定目標(biāo)信息,即最有可能與鍵信息組合為鍵值對的候選信息,從而將目標(biāo)信息作為從表格中提取出來的目標(biāo)字段的字段值。上述裝置,實現(xiàn)了從任意表格樣式下的表格(如制式表格或是非制式表格)中自動提取出目標(biāo)字段的字段值的效果,具有較大的應(yīng)用空間。
140.本發(fā)明實施例所提供的信息提取裝置可執(zhí)行本發(fā)明任意實施例所提供的信息提
取方法,具備執(zhí)行方法相應(yīng)的功能模塊和有益效果。
141.值得注意的是,上述信息提取裝置的實施例中,所包括的各個單元和模塊只是按照功能邏輯進(jìn)行劃分的,但并不局限于上述的劃分,只要能夠?qū)崿F(xiàn)相應(yīng)的功能即可;另外,各功能單元的具體名稱也只是為了便于相互區(qū)分,并不用于限制本發(fā)明的保護(hù)范圍。
142.圖8示出了可以用來實施本發(fā)明的實施例的電子設(shè)備10的結(jié)構(gòu)示意圖。電子設(shè)備旨在表示各種形式的數(shù)字計算機(jī),諸如,膝上型計算機(jī)、臺式計算機(jī)、工作臺、個人數(shù)字助理、服務(wù)器、刀片式服務(wù)器、大型計算機(jī)、和其它適合的計算機(jī)。電子設(shè)備還可以表示各種形式的移動裝置,諸如,個人數(shù)字處理、蜂窩電話、智能電話、可穿戴設(shè)備(如頭盔、眼鏡、手表等)和其它類似的計算裝置。本文所示的部件、它們的連接和關(guān)系、以及它們的功能僅僅作為示例,并且不意在限制本文中描述的和/或者要求的本發(fā)明的實現(xiàn)。
143.如圖8所示,電子設(shè)備10包括至少一個處理器11,以及與至少一個處理器11通信連接的存儲器,如只讀存儲器(rom)12、隨機(jī)訪問存儲器(ram)13等,其中,存儲器存儲有可被至少一個處理器執(zhí)行的計算機(jī)程序,處理器11可以根據(jù)存儲在只讀存儲器(rom)12中的計算機(jī)程序或從存儲單元18加載到隨機(jī)訪問存儲器(ram)13中的計算機(jī)程序,來執(zhí)行各種適當(dāng)?shù)膭幼骱吞幚怼T趓am 13中,還可存儲電子設(shè)備10操作所需的各種程序和數(shù)據(jù)。處理器11、rom 12以及ram 13通過總線14彼此相連。輸入/輸出(i/o)接口15也連接至總線14。
144.電子設(shè)備10中的多個部件連接至i/o接口15,包括:輸入單元16,例如鍵盤、鼠標(biāo)等;輸出單元17,例如各種類型的顯示器、揚聲器等;存儲單元18,如磁盤、光盤等;以及通信單元19,例如網(wǎng)卡、調(diào)制解調(diào)器、無線通信收發(fā)機(jī)等。通信單元19允許電子設(shè)備10通過諸如因特網(wǎng)的計算機(jī)網(wǎng)絡(luò)和/或各種電信網(wǎng)絡(luò)與其他設(shè)備交換信息/數(shù)據(jù)。
145.處理器11可以是各種具有處理和計算能力的通用和/或?qū)S锰幚斫M件。處理器11的一些示例包括但不限于中央處理單元(cpu)、圖形處理單元(gpu)、各種專用的人工智能(ai)計算芯片、各種運行機(jī)器學(xué)習(xí)模型算法的處理器、數(shù)字信號處理器(dsp)、以及任何適當(dāng)?shù)奶幚砥鳌⒖刂破鳌⑽⒖刂破鞯取L幚砥?1執(zhí)行上文所描述的各個方法和處理,例如信息提取方法。
146.在一些實施例中,信息提取方法可被實現(xiàn)為計算機(jī)程序,其被有形地包含于計算機(jī)可讀存儲介質(zhì),例如存儲單元18。在一些實施例中,計算機(jī)程序的部分或者全部可以經(jīng)由rom 12和/或通信單元19而被載入和/或安裝到電子設(shè)備10上。當(dāng)計算機(jī)程序加載到ram 13并由處理器11執(zhí)行時,可以執(zhí)行上文描述的信息提取方法的一個或多個步驟。備選地,在其他實施例中,處理器11可通過其他任何適當(dāng)?shù)姆绞?例如,借助于固件)而被配置為執(zhí)行信息提取方法。
147.本文中以上描述的系統(tǒng)和技術(shù)的各種實施方式可以在數(shù)字電子電路系統(tǒng)、集成電路系統(tǒng)、場可編程門陣列(fpga)、專用集成電路(asic)、專用標(biāo)準(zhǔn)產(chǎn)品(assp)、芯片上系統(tǒng)的系統(tǒng)(soc)、負(fù)載可編程邏輯設(shè)備(cpld)、計算機(jī)硬件、固件、軟件、和/或它們的組合中實現(xiàn)。這些各種實施方式可以包括:實施在一個或者多個計算機(jī)程序中,該一個或者多個計算機(jī)程序可在包括至少一個可編程處理器的可編程系統(tǒng)上執(zhí)行和/或解釋,該可編程處理器可以是專用或者通用可編程處理器,可以從存儲系統(tǒng)、至少一個輸入裝置、以及至少一個輸出裝置接收數(shù)據(jù)和指令,并且將數(shù)據(jù)和指令傳輸至該存儲系統(tǒng)、該至少一個輸入裝置、以及該至少一個輸出裝置。
148.用于實施本發(fā)明的方法的計算機(jī)程序可以采用一個或多個編程語言的任何組合來編寫。這些計算機(jī)程序可以提供給通用計算機(jī)、專用計算機(jī)或是其他可編程數(shù)據(jù)處理裝置的處理器,使得計算機(jī)程序當(dāng)由處理器執(zhí)行時使流程圖和/或框圖中所規(guī)定的功能/操作被實施。計算機(jī)程序可以完全在機(jī)器上執(zhí)行、部分地在機(jī)器上執(zhí)行,作為獨立軟件包部分地在機(jī)器上執(zhí)行并且部分地在遠(yuǎn)程機(jī)器上執(zhí)行或完全在遠(yuǎn)程機(jī)器或服務(wù)器上執(zhí)行。
149.在本發(fā)明的上下文中,計算機(jī)可讀存儲介質(zhì)可以是有形的介質(zhì),其可以包含或存儲以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備使用或與指令執(zhí)行系統(tǒng)、裝置或設(shè)備結(jié)合地使用的計算機(jī)程序。計算機(jī)可讀存儲介質(zhì)可以包括但不限于電子的、磁性的、光學(xué)的、電磁的、紅外的、或半導(dǎo)體系統(tǒng)、裝置或設(shè)備,或者上述內(nèi)容的任何合適組合。備選地,計算機(jī)可讀存儲介質(zhì)可以是機(jī)器可讀信號介質(zhì)。機(jī)器可讀存儲介質(zhì)的更具體示例會包括基于一個或多個線的電氣連接、便攜式計算機(jī)盤、硬盤、隨機(jī)存取存儲器(ram)、只讀存儲器(rom)、可擦除可編程只讀存儲器(eprom或快閃存儲器)、光纖、便捷式緊湊盤只讀存儲器(cd-rom)、光學(xué)儲存設(shè)備、磁儲存設(shè)備、或上述內(nèi)容的任何合適組合。
150.為了提供與用戶的交互,可以在電子設(shè)備上實施此處描述的系統(tǒng)和技術(shù),該電子設(shè)備具有:用于向用戶顯示信息的顯示裝置(例如,crt(陰極射線管)或者lcd(液晶顯示器)監(jiān)視器);以及鍵盤和指向裝置(例如,鼠標(biāo)或者軌跡球),用戶可以通過該鍵盤和該指向裝置來將輸入提供給電子設(shè)備。其它種類的裝置還可以用于提供與用戶的交互;例如,提供給用戶的反饋可以是任何形式的傳感反饋(例如,視覺反饋、聽覺反饋、或者觸覺反饋);并且可以用任何形式(包括聲輸入、語音輸入或者、觸覺輸入)來接收來自用戶的輸入。
151.可以將此處描述的系統(tǒng)和技術(shù)實施在包括后臺部件的計算系統(tǒng)(例如,作為數(shù)據(jù)服務(wù)器)、或者包括中間件部件的計算系統(tǒng)(例如,應(yīng)用服務(wù)器)、或者包括前端部件的計算系統(tǒng)(例如,具有圖形用戶界面或者網(wǎng)絡(luò)瀏覽器的用戶計算機(jī),用戶可以通過該圖形用戶界面或者該網(wǎng)絡(luò)瀏覽器來與此處描述的系統(tǒng)和技術(shù)的實施方式交互)、或者包括這種后臺部件、中間件部件、或者前端部件的任何組合的計算系統(tǒng)中。可以通過任何形式或者介質(zhì)的數(shù)字?jǐn)?shù)據(jù)通信(例如,通信網(wǎng)絡(luò))來將系統(tǒng)的部件相互連接。通信網(wǎng)絡(luò)的示例包括:局域網(wǎng)(lan)、廣域網(wǎng)(wan)、區(qū)塊鏈網(wǎng)絡(luò)和互聯(lián)網(wǎng)。
152.計算系統(tǒng)可以包括客戶端和服務(wù)器。客戶端和服務(wù)器一般遠(yuǎn)離彼此并且通常通過通信網(wǎng)絡(luò)進(jìn)行交互。通過在相應(yīng)的計算機(jī)上運行并且彼此具有客戶端-服務(wù)器關(guān)系的計算機(jī)程序來產(chǎn)生客戶端和服務(wù)器的關(guān)系。服務(wù)器可以是云服務(wù)器,又稱為云計算服務(wù)器或云主機(jī),是云計算服務(wù)體系中的一項主機(jī)產(chǎn)品,以解決了傳統(tǒng)物理主機(jī)與vps服務(wù)中,存在的管理難度大,業(yè)務(wù)擴(kuò)展性弱的缺陷。
153.應(yīng)該理解,可以使用上面所示的各種形式的流程,重新排序、增加或刪除步驟。例如,本發(fā)明中記載的各步驟可以并行地執(zhí)行也可以順序地執(zhí)行也可以不同的次序執(zhí)行,只要能夠?qū)崿F(xiàn)本發(fā)明的技術(shù)方案所期望的結(jié)果,本文在此不進(jìn)行限制。
154.上述具體實施方式,并不構(gòu)成對本發(fā)明保護(hù)范圍的限制。本領(lǐng)域技術(shù)人員應(yīng)該明白的是,根據(jù)設(shè)計要求和其他因素,可以進(jìn)行各種修改、組合、子組合和替代。任何在本發(fā)明的精神和原則之內(nèi)所作的修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)范圍之內(nèi)。
