換臉變聲的交互方法、裝置、存儲介質以及電子設備與流程

更新時間:2025-12-26 10:11:20 0條評論

默認

換臉變聲的交互方法、裝置、存儲介質以及電子設備與流程

1.本發明涉及計算機領域，具體而言，涉及一種換臉變聲的交互方法、裝置、存儲介質以及電子設備。

背景技術：

2.隨著互聯網的發展，越來越多的人喜歡通過觀看直播來豐富自己的業余生活，且直播在當代越發受年輕人的喜歡。在直播過程中觀眾對主播的審美標準不一，對顏值和聲音的審美存在差異，單一的主播形象導致直播效果不理想。

技術實現要素：

3.本發明實施例提供了一種換臉變聲的交互方法、裝置、存儲介質以及電子設備，以至少解決在直播過程中，單一的主播形象導致直播效果不理想的技術問題。
4.根據本發明實施例的一個方面，提供了一種換臉變聲的交互方法，包括：在檢測到用戶選擇開始直播的情況下，確定上述用戶選擇的人臉轉換方案和聲道轉換方案；獲取上述用戶的真實人臉和真實聲道；根據上述人臉轉換方案將上述真實人臉轉換為目標人臉，根據上述聲道轉換方案將上述真實聲道轉換為目標聲道；根據上述目標人臉和上述目標聲道展示直播界面。
5.根據本發明實施例的另一方面，提供了一種換臉變聲的交互裝置，包括：確定模塊，用于在檢測到用戶選擇開始直播的情況下，確定上述用戶選擇的人臉轉換方案和聲道轉換方案；獲取模塊，用于獲取上述用戶的真實人臉和真實聲道；轉換模塊，用于根據上述人臉轉換方案將上述真實人臉轉換為目標人臉，根據上述聲道轉換方案將上述真實聲道轉換為目標聲道；展示模塊，用于根據上述目標人臉和上述目標聲道展示直播界面。
6.作為一種可選的示例，上述第一確定模塊包括：第一展示單元，用于在檢測到上述用戶選擇開始直播的情況下，展示人臉自定義模式組；第二展示單元，用于在檢測到上述用戶在上述人臉自定義模式組中選擇第一人臉自定義模式的情況下，展示預設的多個美顏配置；第一確定單元，用于確定上述用戶在上述多個美顏配置中選擇的第一目標美顏配置；第一生成單元，用于根據上述第一目標美顏配置，生成上述人臉轉換方案。
7.作為一種可選的示例，上述第一確定模塊還包括：第二確定單元，用于在檢測到上述用戶選擇第二人臉自定義模式的情況下，確定上述用戶自定義的第二目標美顏配置；第二生成單元，用于根據上述第二目標美顏配置，生成上述人臉轉換方案。
8.作為一種可選的示例，上述第一確定模塊還包括：第一獲取單元，用于在檢測到上述用戶選擇開始直播的情況下，展示人臉自定義模式組之后，在檢測到上述用戶選擇第三人臉自定義模式的情況下，獲取上述用戶輸入的目標圖片；第三確定單元，用于從上述目標圖片中確定第一人臉；第三生成單元，用于根據上述第一人臉生成上述人臉轉換方案。
9.作為一種可選的示例，上述第一確定模塊還包括：第二獲取單元，用于在檢測到上述用戶選擇開始直播的情況下，展示人臉自定義模式組之后，在檢測到上述用戶選擇第三
人臉自定義模式的情況下，獲取上述用戶輸入的目標視頻；第四確定單元，用于從上述目標視頻中確定第二人臉；第四生成單元，用于根據上述第二人臉生成上述人臉轉換方案。
10.作為一種可選的示例，上述第一確定模塊包括：第三展示單元，用于在檢測到上述用戶確定上述人臉轉換方案的情況下，展示聲道自定義模式組；第四展示單元，用于在檢測到上述用戶在上述聲道自定義模式組中選擇第一聲道自定義模式的情況下，展示預設的多個聲道配置；第四確定單元，用于確定上述用戶在上述多個聲道配置中選擇的目標聲道配置；第五生成單元，用于根據上述目標聲道配置，生成上述聲道轉換方案。
11.作為一種可選的示例，上述第一確定模塊還包括：第三獲取單元，用于在檢測到上述用戶確定上述人臉轉換方案的情況下，展示聲道自定義模式組之后，在檢測到上述用戶選擇第二聲道自定義模式的情況下，獲取上述用戶輸入的目標語音；第六生成單元，用于根據上述目標語音生成上述聲道轉換方案。
12.根據本發明實施例的又一方面，還提供了一種存儲介質，該存儲介質中存儲有計算機程序，其中，該計算機程序被處理器運行時執行上述換臉變聲的交互方法。
13.根據本發明實施例的又一方面，還提供了一種電子設備，包括存儲器和處理器，上述存儲器中存儲有計算機程序，上述處理器被設置為通過所述計算機程序執行上述的換臉變聲的交互方法。
14.在本發明實施例中，采用了在檢測到用戶選擇開始直播的情況下，確定上述用戶選擇的人臉轉換方案和聲道轉換方案；獲取上述用戶的真實人臉和真實聲道；根據上述人臉轉換方案將上述真實人臉轉換為目標人臉，根據上述聲道轉換方案將上述真實聲道轉換為目標聲道；根據上述目標人臉和上述目標聲道展示直播界面的方法，由于在上述方法中，根據用戶選擇的人臉轉換方案和聲道轉換方案，生成目標人臉和目標聲道并展示在直播界面，從而實現了自定義人臉形象和語音聲道的目的，進而解決了在直播過程中，單一的主播形象導致直播效果不理想的技術問題。
附圖說明
15.此處所說明的附圖用來提供對本發明的進一步理解，構成本技術的一部分，本發明的示意性實施例及其說明用于解釋本發明，并不構成對本發明的不當限定。在附圖中：
16.圖1是根據本發明實施例的一種可選的換臉變聲的交互方法的流程圖；
17.圖2是根據本發明實施例的一種可選的換臉變聲的交互方法的實現流程圖；
18.圖3是根據本發明實施例的一種可選的換臉變聲的交互裝置的結構示意圖；
19.圖4是根據本發明實施例的一種可選的電子設備的示意圖。
具體實施方式
20.為了使本技術領域的人員更好地理解本發明方案，下面將結合本發明實施例中的附圖，對本發明實施例中的技術方案進行清楚、完整地描述，顯然，所描述的實施例僅僅是本發明一部分的實施例，而不是全部的實施例。基于本發明中的實施例，本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例，都應當屬于本發明保護的范圍。
21.需要說明的是，本發明的說明書和權利要求書及上述附圖中的術語“第一”、“第
二”等是用于區別類似的對象，而不必用于描述特定的順序或先后次序。應該理解這樣使用的數據在適當情況下可以互換，以便這里描述的本發明的實施例能夠以除了在這里圖示或描述的那些以外的順序實施。此外，術語“包括”和“具有”以及他們的任何變形，意圖在于覆蓋不排他的包含，例如，包含了一系列步驟或單元的過程、方法、系統、產品或設備不必限于清楚地列出的那些步驟或單元，而是可包括沒有清楚地列出的或對于這些過程、方法、產品或設備固有的其它步驟或單元。
22.根據本發明實施例的第一方面，提供了一種換臉變聲的交互方法，可選地，如圖1所示，上述方法包括：
23.s102，在檢測到用戶選擇開始直播的情況下，確定用戶選擇的人臉轉換方案和聲道轉換方案；
24.s104，獲取用戶的真實人臉和真實聲道；
25.s106，根據人臉轉換方案將真實人臉轉換為目標人臉，根據聲道轉換方案將真實聲道轉換為目標聲道；
26.s108，根據目標人臉和目標聲道展示直播界面。
27.可選地，本實施例中，用戶選擇開始直播后，通過選擇界面確定人臉轉換方案和聲道轉換方案，確定完成選擇后，開始直播，直播界面展示根據人臉轉換方案和聲道轉換方案將用戶的真實人臉和真實聲道轉換的目標人臉和目標聲道。人臉轉換方案和聲道轉換方案可以根據選擇界面自定義選擇，也可以通過錄入的方式自定義。
28.可選地，本實施例中，檢測到用戶選擇開始直播后，展示人臉和聲道轉換的選擇界面，可以同時展示人臉轉換的選擇界面和聲道轉換的選擇界面，也可以先展示人臉轉換的選擇界面，待人臉轉換方案確定后展示聲道轉換的選擇界面，展示方法不限。在用戶確定人臉轉換方案和聲道轉換方案后，獲取用戶的真實人臉和真實聲道，根據人臉轉換方案將真實人臉轉換為目標人臉，根據聲道轉換方案將真實聲道轉換為目標聲道，可以預展示目標人臉和目標聲道，若用戶不滿意可重新選擇。在確定選擇完成后，開始直播，直播界面展示目標人臉和目標聲道，在直播過程中也可以修改人臉轉換方案和聲道轉換方案。
29.可選地，本實施例中，根據用戶選擇的人臉轉換方案和聲道轉換方案，生成目標人臉和目標聲道并展示在直播界面，從而實現了自定義人臉形象和語音聲道的目的，進而解決了在直播過程中，單一的主播形象導致直播效果不理想的技術問題。
30.作為一種可選的示例，在檢測到用戶選擇開始直播的情況下，確定用戶選擇的人臉轉換方案包括：
31.在檢測到用戶選擇開始直播的情況下，展示人臉自定義模式組；
32.在檢測到用戶在人臉自定義模式組中選擇第一人臉自定義模式的情況下，展示預設的多個美顏配置；
33.確定用戶在多個美顏配置中選擇的第一目標美顏配置；
34.根據第一目標美顏配置，生成人臉轉換方案。
35.可選地，本實施例中，在檢測到用戶選擇開始直播后，展示人臉自定義模式組，人臉自定義模式組包括第一人臉自定義模式、第二人臉自定義模式、第三人臉自定義模式，在檢測到用戶選擇第一人臉自定義模式的情況下，展示預設的多組美顏配置，美顏配置包括臉型組、妝容組、五官比例組以及發型組，還可以包括牙齒組、皮膚組等。每一組中有多個供
選擇的方案，例如臉型組包括鵝蛋臉、方圓臉等。確定用戶從多個方案中選擇出的第一目標臉型、第一目標妝容、第一目標五官比例、第一目標發型，得到目標美顏配置，根據目標美顏配置生成人臉轉換方案。
36.作為一種可選的示例，在檢測到用戶選擇開始直播的情況下，展示人臉自定義模式組之后，上述方法還包括：
37.在檢測到用戶選擇第二人臉自定義模式的情況下，確定用戶自定義的第二目標美顏配置；
38.根據第二目標美顏配置，生成人臉轉換方案。
39.可選地，本實施例中，在檢測到用戶選擇第二人臉自定義模式的情況下，展示自定義界面，用戶可以自定義臉型，妝容，五官比例，發型等，確定用戶自定義的第二目標美顏配置：第二目標臉型、第二目標妝容、第二目標五官比例、第二目標發型、根據第二目標美顏配置生成人臉轉換方案。
40.作為一種可選的示例，在檢測到用戶選擇開始直播的情況下，展示人臉自定義模式組之后，方法還包括：
41.在檢測到用戶選擇第三人臉自定義模式的情況下，獲取用戶輸入的目標圖片；
42.從目標圖片中確定第一人臉；
43.根據第一人臉生成人臉轉換方案。
44.可選地，本實施例中，在檢測到用戶選擇第三人臉自定義模式的情況下，展示上傳圖片或視頻界面，檢測到用戶上傳的是圖片的情況下，獲取用戶上傳的目標圖片，同時確定目標圖片中的第一人臉，根據第一人臉生成人臉轉換方案。
45.作為一種可選的示例，在檢測到用戶選擇開始直播的情況下，展示人臉自定義模式組之后，上述方法還包括：
46.在檢測到用戶選擇第三人臉自定義模式的情況下，獲取用戶輸入的目標視頻；
47.從目標視頻中確定第二人臉；
48.根據第二人臉生成人臉轉換方案。
49.可選地，本實施例中，可選地，本實施例中，在檢測到用戶選擇第三人臉自定義模式的情況下，展示上傳圖片或視頻界面，檢測到用戶上傳的是視頻的情況下，獲取用戶上傳的目標視頻，同時確定目標視頻中的第二人臉，根據第二人臉生成人臉轉換方案。
50.作為一種可選的示例，在檢測到用戶選擇開始直播的情況下，確定用戶選擇的聲道轉換方案包括：
51.在檢測到用戶確定人臉轉換方案的情況下，展示聲道自定義模式組；
52.在檢測到用戶在聲道自定義模式組中選擇第一聲道自定義模式的情況下，展示預設的多個聲道配置；
53.確定用戶在多個聲道配置中選擇的目標聲道配置；
54.根據目標聲道配置，生成聲道轉換方案。
55.可選地，本實施例中，在檢測到用戶確定人臉轉換方案后，展示聲道自定義模式組，包括第一自定義模式和第二自定義模式，在檢測到用戶選擇的是第一自定義模式的情況下，展示預設的多個聲道配置，包括發音風格組，語言組，性別組以及性格組，每一組有多個方案，例如發音風格組有蘿莉音、大叔音等，語言組有英語、韓語等，還可以是各地方言。
性別組有男、女，性格組有活潑、文靜等。確定用戶從多個方案中選擇出目標發音風格，目標語言，目標性別，目標性格，得到目標聲道配置，根據目標聲道配置生成聲道轉換方案。
56.作為一種可選的示例，在檢測到用戶確定人臉轉換方案的情況下，展示聲道自定義模式組之后，上述方法還包括：
57.在檢測到用戶選擇第二聲道自定義模式的情況下，獲取用戶輸入的目標語音；
58.根據目標語音生成聲道轉換方案。
59.可選地，本實施例中，在檢測到用戶選擇的是第二自定義模式的情況下，展示上傳目標語音界面，可以進行錄音，也可以由用戶上傳語音文件，從語音文件中提取目標語音。根據目標語音生成聲道轉換方案。
60.結合一種示例進行說明，本技術涉及一種換臉變聲的交互方法，通過ai(人工智能artificial intelligence)智能換臉技術和ai智能語音技術，在直播間添加主播換臉變聲功能，由官方統一建模各類風格人臉模型以及聲道模型，便于用戶在直播間自定義主播形象。具體實現流程如圖2所示：
61.1.用戶進入商城，點擊直播間，在直播間側方ai形象按鈕中，自定義人臉轉換方案和聲道轉換方案；
62.2.自定義人臉轉換方案：
63.a.第一人臉自定義模式，用戶從臉型組、妝容組、五官比例組以及發型組中選擇第一目標臉型、第一目標妝容、第一目標五官比例、第一目標發型，生成人臉轉換方案；
64.b.第二人臉自定義模式，用戶自定義第二目標臉型、第二目標妝容、第二目標五官比例、第二目標發型，生成人臉轉換方案；
65.c.第三人臉自定義模式，用戶拍照或錄視頻，上傳圖片或視頻，生成人臉轉換方案。
66.3.自定義聲道轉換方案：
67.a.第一聲道自定義模式，用戶從發音風格組、語言組、性別組以及性格組中選擇目標發音風格、目標語言、目標性別、目標性格，生成聲道轉換方案；
68.b.第二聲道自定義模式，用戶錄音或上傳語音文件，提取目標語音，生成聲道轉換方案。
69.4.用戶確定更換，開始直播。
70.需要說明的是，對于前述的各方法實施例，為了簡單描述，故將其都表述為一系列的動作組合，但是本領域技術人員應該知悉，本發明并不受所描述的動作順序的限制，因為依據本發明，某些步驟可以采用其他順序或者同時進行。其次，本領域技術人員也應該知悉，說明書中所描述的實施例均屬于優選實施例，所涉及的動作和模塊并不一定是本發明所必須的。
71.根據本技術實施例的另一方面，還提供了一種換臉變聲的交互裝置，如圖3所示，包括：
72.確定模塊302，用于在檢測到用戶選擇開始直播的情況下，確定用戶選擇的人臉轉換方案和聲道轉換方案；
73.獲取模塊304，用于獲取用戶的真實人臉和真實聲道；
74.轉換模塊306，用于根據人臉轉換方案將真實人臉轉換為目標人臉，根據聲道轉換
方案將真實聲道轉換為目標聲道；
75.展示模塊308，用于根據目標人臉和目標聲道展示直播界面。
76.可選地，本實施例中，用戶選擇開始直播后，通過選擇界面確定人臉轉換方案和聲道轉換方案，確定完成選擇后，開始直播，直播界面展示根據人臉轉換方案和聲道轉換方案將用戶的真實人臉和真實聲道轉換的目標人臉和目標聲道。人臉轉換方案和聲道轉換方案可以根據選擇界面自定義選擇，也可以通過錄入的方式自定義。
77.可選地，本實施例中，檢測到用戶選擇開始直播后，展示人臉和聲道轉換的選擇界面，可以同時展示人臉轉換的選擇界面和聲道轉換的選擇界面，也可以先展示人臉轉換的選擇界面，待人臉轉換方案確定后展示聲道轉換的選擇界面，展示方法不限。在用戶確定人臉轉換方案和聲道轉換方案后，獲取用戶的真實人臉和真實聲道，根據人臉轉換方案將真實人臉轉換為目標人臉，根據聲道轉換方案將真實聲道轉換為目標聲道，可以預展示目標人臉和目標聲道，若用戶不滿意可重新選擇。在確定選擇完成后，開始直播，直播界面展示目標人臉和目標聲道，在直播過程中也可以修改人臉轉換方案和聲道轉換方案。
78.可選地，本實施例中，根據用戶選擇的人臉轉換方案和聲道轉換方案，生成目標人臉和目標聲道并展示在直播界面，從而實現了自定義人臉形象和語音聲道的目的，進而解決了在直播過程中，單一的主播形象導致直播效果不理想的技術問題。
79.作為一種可選的示例，第一確定模塊包括：
80.第一展示單元，用于在檢測到用戶選擇開始直播的情況下，展示人臉自定義模式組；
81.第二展示單元，用于在檢測到用戶在人臉自定義模式組中選擇第一人臉自定義模式的情況下，展示預設的多個美顏配置；
82.第一確定單元，用于確定用戶在多個美顏配置中選擇的第一目標美顏配置；
83.第一生成單元，用于根據第一目標美顏配置，生成人臉轉換方案。
84.可選地，本實施例中，在檢測到用戶選擇開始直播后，展示人臉自定義模式組，人臉自定義模式組包括第一人臉自定義模式、第二人臉自定義模式、第三人臉自定義模式，在檢測到用戶選擇第一人臉自定義模式的情況下，展示預設的多組美顏配置，美顏配置包括臉型組、妝容組、五官比例組以及發型組，還可以包括牙齒組、皮膚組等。每一組中有多個供選擇的方案，例如臉型組包括鵝蛋臉、方圓臉等。確定用戶從多個方案中選擇出的第一目標臉型、第一目標妝容、第一目標五官比例、第一目標發型，得到目標美顏配置，根據目標美顏配置生成人臉轉換方案。
85.作為一種可選的示例，第一確定模塊還包括：
86.第二確定單元，用于在檢測到用戶選擇第二人臉自定義模式的情況下，確定用戶自定義的第二目標美顏配置；
87.第二生成單元，用于根據第二目標美顏配置，生成人臉轉換方案。
88.可選地，本實施例中，在檢測到用戶選擇第二人臉自定義模式的情況下，展示自定義界面，用戶可以自定義臉型，妝容，五官比例，發型等，確定用戶自定義的第二目標美顏配置：第二目標臉型、第二目標妝容、第二目標五官比例、第二目標發型、根據第二目標美顏配置生成人臉轉換方案。
89.作為一種可選的示例，第一確定模塊還包括：
90.第一獲取單元，用于在檢測到用戶選擇開始直播的情況下，展示人臉自定義模式組之后，在檢測到用戶選擇第三人臉自定義模式的情況下，獲取用戶輸入的目標圖片；
91.第三確定單元，用于從目標圖片中確定第一人臉；
92.第三生成單元，用于根據第一人臉生成人臉轉換方案。
93.可選地，本實施例中，在檢測到用戶選擇第三人臉自定義模式的情況下，展示上傳圖片或視頻界面，檢測到用戶上傳的是圖片的情況下，獲取用戶上傳的目標圖片，同時確定目標圖片中的第一人臉，根據第一人臉生成人臉轉換方案。
94.作為一種可選的示例，第一確定模塊還包括：
95.第二獲取單元，用于在檢測到用戶選擇第三人臉自定義模式的情況下，獲取用戶輸入的目標視頻；
96.第四確定單元，用于從目標視頻中確定第二人臉；
97.第四生成單元，用于根據第二人臉生成人臉轉換方案。
98.可選地，本實施例中，可選地，本實施例中，在檢測到用戶選擇第三人臉自定義模式的情況下，展示上傳圖片或視頻界面，檢測到用戶上傳的是視頻的情況下，獲取用戶上傳的目標視頻，同時確定目標視頻中的第二人臉，根據第二人臉生成人臉轉換方案。
99.作為一種可選的示例，第一確定模塊包括：
100.第三展示單元，用于在檢測到用戶確定人臉轉換方案的情況下，展示聲道自定義模式組；
101.第四展示單元，用于在檢測到用戶在聲道自定義模式組中選擇第一聲道自定義模式的情況下，展示預設的多個聲道配置；
102.第四確定單元，用于確定用戶在多個聲道配置中選擇的目標聲道配置；
103.第五生成單元，用于根據目標聲道配置，生成聲道轉換方案。
104.可選地，本實施例中，在檢測到用戶確定人臉轉換方案后，展示聲道自定義模式組，包括第一自定義模式和第二自定義模式，在檢測到用戶選擇的是第一自定義模式的情況下，展示預設的多個聲道配置，包括發音風格組，語言組，性別組以及性格組，每一組有多個方案，例如發音風格組有蘿莉音、大叔音等，語言組有英語、韓語等，還可以是各地方言。性別組有男、女，性格組有活潑、文靜等。確定用戶從多個方案中選擇出目標發音風格，目標語言，目標性別，目標性格，得到目標聲道配置，根據目標聲道配置生成聲道轉換方案。
105.作為一種可選的示例，第一確定模塊還包括：
106.第三獲取單元，用于在檢測到用戶確定人臉轉換方案的情況下，展示聲道自定義模式組之后，在檢測到用戶選擇第二聲道自定義模式的情況下，獲取用戶輸入的目標語音；
107.第六生成單元，用于根據目標語音生成聲道轉換方案。
108.可選地，本實施例中，在檢測到用戶選擇的是第二自定義模式的情況下，展示上傳目標語音界面，可以進行錄音，也可以由用戶上傳語音文件，從語音文件中提取目標語音。根據目標語音生成聲道轉換方案。
109.本實施例的其他示例請參見上述示例，在此不在贅述。
110.圖4是根據本技術實施例的一種可選的電子設備的結構框圖，如圖4所示，包括處理器402、通信接口404、存儲器406和通信總線408，其中，處理器402、通信接口404和存儲器406通過通信總線408完成相互間的通信，其中，
111.存儲器406，用于存儲計算機程序；
112.處理器402，用于執行存儲器406上所存放的計算機程序時，實現如下步驟：
113.在檢測到用戶選擇開始直播的情況下，確定用戶選擇的人臉轉換方案和聲道轉換方案；
114.獲取用戶的真實人臉和真實聲道；
115.根據人臉轉換方案將真實人臉轉換為目標人臉，根據聲道轉換方案將真實聲道轉換為目標聲道；
116.根據目標人臉和目標聲道展示直播界面。
117.可選地，在本實施例中，上述的通信總線可以是pci(peripheral component interconnect，外設部件互連標準)總線、或eisa(extended industry standard architecture，擴展工業標準結構)總線等。該通信總線可以分為地址總線、數據總線、控制總線等。為便于表示，圖4中僅用一條粗線表示，但并不表示僅有一根總線或一種類型的總線。通信接口用于上述電子設備與其他設備之間的通信。
118.存儲器可以包括ram，也可以包括非易失性存儲器(non-volatile memory)，例如，至少一個磁盤存儲器。可選地，存儲器還可以是至少一個位于遠離前述處理器的存儲裝置。
119.作為一種示例，上述存儲器406中可以但不限于包括上述換臉變聲的交互裝置中的確定模塊302、獲取模塊304、轉換模塊306以及展示模塊308。此外，還可以包括但不限于上述請求的處理裝置中的其他模塊單元，本示例中不再贅述。
120.上述處理器可以是通用處理器，可以包含但不限于：cpu(central processing unit，中央處理器)、np(network processor，網絡處理器)等；還可以是dsp(digital signal processing，數字信號處理器)、asic(application specific integrated circuit，專用集成電路)、fpga(field－programmable gate array，現場可編程門陣列)或者其他可編程邏輯器件、分立門或者晶體管邏輯器件、分立硬件組件。
121.可選地，本實施例中的具體示例可以參考上述實施例中所描述的示例，本實施例在此不再贅述。
122.本領域普通技術人員可以理解，圖4所示的結構僅為示意，實施上述換臉變聲的交互方法的設備可以是終端設備，該終端設備可以是智能手機(如android手機、ios手機等)、平板電腦、掌上電腦以及移動互聯網設備(mobile internet devices，mid)、pad等終端設備。圖4其并不對上述電子設備的結構造成限定。例如，電子設備還可包括比圖4中所示更多或者更少的組件(如網絡接口、顯示裝置等)，或者具有與圖4所示的不同的配置。
123.本領域普通技術人員可以理解上述實施例的各種方法中的全部或部分步驟是可以通過程序來指令終端設備相關的硬件來完成，該程序可以存儲于一計算機可讀存儲介質中，存儲介質可以包括：閃存盤、rom、ram、磁盤或光盤等。
124.根據本發明的實施例的又一方面，還提供了一種計算機可讀的存儲介質，該計算機可讀的存儲介質中存儲有計算機程序，其中，該計算機程序被處理器運行時執行上述換臉變聲的交互方法中的步驟。
125.可選地，在本實施例中，本領域普通技術人員可以理解上述實施例的各種方法中的全部或部分步驟是可以通過程序來指令終端設備相關的硬件來完成，該程序可以存儲于一計算機可讀存儲介質中，存儲介質可以包括：閃存盤、只讀存儲器(read-only memory，
rom)、隨機存取器(random access memory，ram)、磁盤或光盤等。
126.上述本發明實施例序號僅僅為了描述，不代表實施例的優劣。
127.上述實施例中的集成的單元如果以軟件功能單元的形式實現并作為獨立的產品銷售或使用時，可以存儲在上述計算機可讀取的存儲介質中。基于這樣的理解，本發明的技術方案本質上或者說對現有技術做出貢獻的部分或者該技術方案的全部或部分可以以軟件產品的形式體現出來，該計算機軟件產品存儲在存儲介質中，包括若干指令用以使得一臺或多臺計算機設備(可為個人計算機、服務器或者網絡設備等)執行本發明各個實施例所述方法的全部或部分步驟。
128.在本發明的上述實施例中，對各個實施例的描述都各有側重，某個實施例中沒有詳述的部分，可以參見其他實施例的相關描述。
129.在本技術所提供的幾個實施例中，應該理解到，所揭露的客戶端，可通過其它的方式實現。其中，以上所描述的裝置實施例僅僅是示意性的，例如所述單元的劃分，僅僅為一種邏輯功能劃分，實際實現時可以有另外的劃分方式，例如多個單元或組件可以結合或者可以集成到另一個系統，或一些特征可以忽略，或不執行。另一點，所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口，單元或模塊的間接耦合或通信連接，可以是電性或其它的形式。
130.所述作為分離部件說明的單元可以是或者也可以不是物理上分開的，作為單元顯示的部件可以是或者也可以不是物理單元，即可以位于一個地方，或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其中的部分或者全部單元來實現本實施例方案的目的。
131.另外，在本發明各個實施例中的各功能單元可以集成在一個處理單元中，也可以是各個單元單獨物理存在，也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現，也可以采用軟件功能單元的形式實現。
132.以上所述僅是本發明的優選實施方式，應當指出，對于本技術領域的普通技術人員來說，在不脫離本發明原理的前提下，還可以做出若干改進和潤飾，這些改進和潤飾也應視為本發明的保護范圍。

技術特征：

1.一種換臉變聲的交互方法，其特征在于，包括：在檢測到用戶選擇開始直播的情況下，確定所述用戶選擇的人臉轉換方案和聲道轉換方案；獲取所述用戶的真實人臉和真實聲道；根據所述人臉轉換方案將所述真實人臉轉換為目標人臉，根據所述聲道轉換方案將所述真實聲道轉換為目標聲道；根據所述目標人臉和所述目標聲道展示直播界面。2.根據權利要求1所述的方法，其特征在于，所述在檢測到用戶選擇開始直播的情況下，確定所述用戶選擇的人臉轉換方案包括：在檢測到所述用戶選擇開始直播的情況下，展示人臉自定義模式組；在檢測到所述用戶在所述人臉自定義模式組中選擇第一人臉自定義模式的情況下，展示預設的多個美顏配置；確定所述用戶在所述多個美顏配置中選擇的第一目標美顏配置；根據所述第一目標美顏配置，生成所述人臉轉換方案。3.根據權利要求2所述的方法，其特征在于，在檢測到所述用戶選擇開始直播的情況下，展示人臉自定義模式組之后，所述方法還包括：在檢測到所述用戶選擇第二人臉自定義模式的情況下，確定所述用戶自定義的第二目標美顏配置；根據所述第二目標美顏配置，生成所述人臉轉換方案。4.根據權利要求2所述的方法，其特征在于，在檢測到所述用戶選擇開始直播的情況下，展示人臉自定義模式組之后，所述方法還包括：在檢測到所述用戶選擇第三人臉自定義模式的情況下，獲取所述用戶輸入的目標圖片；從所述目標圖片中確定第一人臉；根據所述第一人臉生成所述人臉轉換方案。5.根據權利要求2所述的方法，其特征在于，在檢測到所述用戶選擇開始直播的情況下，展示人臉自定義模式組之后，所述方法還包括：在檢測到所述用戶選擇第三人臉自定義模式的情況下，獲取所述用戶輸入的目標視頻；從所述目標視頻中確定第二人臉；根據所述第二人臉生成所述人臉轉換方案。6.根據權利要求1所述的方法，其特征在于，所述在檢測到用戶選擇開始直播的情況下，確定所述用戶選擇的聲道轉換方案包括：在檢測到所述用戶確定所述人臉轉換方案的情況下，展示聲道自定義模式組；在檢測到所述用戶在所述聲道自定義模式組中選擇第一聲道自定義模式的情況下，展示預設的多個聲道配置；確定所述用戶在所述多個聲道配置中選擇的目標聲道配置；根據所述目標聲道配置，生成所述聲道轉換方案。7.根據權利要求6所述的方法，其特征在于，在檢測到所述用戶確定所述人臉轉換方案
的情況下，展示聲道自定義模式組之后，所述方法還包括：在檢測到所述用戶選擇第二聲道自定義模式的情況下，獲取所述用戶輸入的目標語音；根據所述目標語音生成所述聲道轉換方案。8.一種換臉變聲的交互裝置，其特征在于，包括：確定模塊，用于在檢測到用戶選擇開始直播的情況下，確定所述用戶選擇的人臉轉換方案和聲道轉換方案；獲取模塊，用于獲取所述用戶的真實人臉和真實聲道；轉換模塊，用于根據所述人臉轉換方案將所述真實人臉轉換為目標人臉，根據所述聲道轉換方案將所述真實聲道轉換為目標聲道；展示模塊，用于根據所述目標人臉和所述目標聲道展示直播界面。9.一種計算機可讀的存儲介質，所述計算機可讀的存儲介質存儲有計算機程序，其特征在于，所述計算機程序被處理器運行時執行所述權利要求1至7任一項中所述的方法。10.一種電子設備，包括存儲器和處理器，其特征在于，所述存儲器中存儲有計算機程序，所述處理器被設置為通過所述計算機程序執行所述權利要求1至7任一項中所述的方法。

技術總結

本發明公開了一種換臉變聲的交互方法、裝置、存儲介質以及電子設備。該方法包括：在檢測到用戶選擇開始直播的情況下，確定用戶選擇的人臉轉換方案和聲道轉換方案；獲取用戶的真實人臉和真實聲道；根據人臉轉換方案將真實人臉轉換為目標人臉，根據聲道轉換方案將真實聲道轉換為目標聲道；根據目標人臉和目標聲道展示直播界面。本發明解決了在直播過程中，單一的主播形象導致直播效果不理想的技術問題。主播形象導致直播效果不理想的技術問題。主播形象導致直播效果不理想的技術問題。