本發(fā)明涉及互聯(lián)網(wǎng)直播平臺(tái)監(jiān)管技術(shù)領(lǐng)域,尤其涉及一種直播平臺(tái)綜合狀態(tài)感知和內(nèi)容實(shí)時(shí)監(jiān)管方法及系統(tǒng)。
背景技術(shù):
網(wǎng)絡(luò)視頻直播是當(dāng)前最熱門(mén)的移動(dòng)互聯(lián)網(wǎng)應(yīng)用,直播平臺(tái)由于直播間的大量增加導(dǎo)致實(shí)時(shí)數(shù)據(jù)量巨大,目前各個(gè)直播平臺(tái)針對(duì)直播內(nèi)容的監(jiān)管,大多采取人工審核的方法,由于通過(guò)人工觀(guān)看多個(gè)屏幕(甚至100個(gè)以上),所以效率低下。另外,由于直播內(nèi)容種類(lèi)繁多,并且違規(guī)直播與正常直播界限模糊,傳統(tǒng)視頻圖像機(jī)器識(shí)別技術(shù)對(duì)直播間進(jìn)行內(nèi)容審核是否違規(guī),存在大量漏報(bào)誤報(bào)情況,并且對(duì)新出現(xiàn)的尚未進(jìn)入違規(guī)樣本庫(kù)的違規(guī)種類(lèi)不能識(shí)別。同時(shí),由于直播的實(shí)時(shí)性監(jiān)管要求較高,視頻圖像識(shí)別由于需要圖像采集并查詢(xún)違規(guī)圖像識(shí)別庫(kù)進(jìn)行識(shí)別,因而通常延遲高,導(dǎo)致監(jiān)管延遲。
2016年是直播元年,出現(xiàn)了大量直播平臺(tái)(例如陌陌、斗魚(yú)、映客等),形成了“百播”大戰(zhàn)。
直播成為了一種新的移動(dòng)互聯(lián)網(wǎng)生態(tài),從原來(lái)單純的游戲直播,涉足到購(gòu)物、旅游、廣告、自媒體、教育、社交等各個(gè)用途。
直播平臺(tái)內(nèi)容監(jiān)管,目前各大平臺(tái)主要采取以下幾種:
1.人工審核方式。由于直播內(nèi)容數(shù)據(jù)量巨大,人工審核需要同時(shí)觀(guān)看幾十上百個(gè)房間效率太低,人眼疲勞,分神等,不可能做到快速反應(yīng)兼顧所有直播間;
2.通過(guò)機(jī)器識(shí)別圖像內(nèi)容。直播內(nèi)容種類(lèi)繁多,機(jī)器識(shí)別對(duì)特征明顯違規(guī)直播間檢測(cè)效果較好,但是,直播檢測(cè)的實(shí)時(shí)性要求較高,簡(jiǎn)單機(jī)器特征匹配延遲較高,且目前違規(guī)直播間,更多的是打擦邊球,這類(lèi)違規(guī)直播無(wú)明顯特征,機(jī)器不能辨別正常直播與違規(guī)直播圖像,往往會(huì)造成大量漏報(bào)情況。及時(shí)可以識(shí)別,也需要上傳到一個(gè)識(shí)別庫(kù)進(jìn)行識(shí)別,從而導(dǎo)致延遲,且上傳圖片導(dǎo)致大量的帶寬消耗和計(jì)算消耗,使得直播平臺(tái)不堪重負(fù)。
3.大多對(duì)圖像的監(jiān)控多,對(duì)文字的監(jiān)控少。目前對(duì)于彈幕的監(jiān)控較少,沒(méi)有過(guò)濾機(jī)制,只有人工管理的“踢人”和“禁言”機(jī)制。
此外,一旦出現(xiàn)內(nèi)容問(wèn)題,輕則導(dǎo)致直播平臺(tái)的關(guān)閉,重則可能導(dǎo)致嚴(yán)重的社會(huì)影響。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明要解決的技術(shù)問(wèn)題在于針對(duì)現(xiàn)有技術(shù)中直播平臺(tái)數(shù)據(jù)量巨大,采用人工監(jiān)管的方式效率低下的缺陷,提供一種直播平臺(tái)綜合狀態(tài)感知和內(nèi)容實(shí)時(shí)監(jiān)管方法及系統(tǒng)。
本發(fā)明解決其技術(shù)問(wèn)題所采用的技術(shù)方案是:
本發(fā)明提供一種直播平臺(tái)綜合狀態(tài)感知和內(nèi)容實(shí)時(shí)監(jiān)管方法,包括以下步驟:
根據(jù)直播間的歷史流量數(shù)據(jù)為每個(gè)直播間設(shè)置流量動(dòng)態(tài)閾值,實(shí)時(shí)獲取直播間的當(dāng)前流量數(shù)據(jù),結(jié)合當(dāng)前流量數(shù)據(jù)的變化率和流量動(dòng)態(tài)閾值得到直播間的流量可疑值;
根據(jù)直播間的歷史彈幕數(shù)據(jù)提取違規(guī)彈幕庫(kù),根據(jù)各違規(guī)彈幕的出現(xiàn)頻率設(shè)置對(duì)應(yīng)的權(quán)重;實(shí)時(shí)獲取直播間的當(dāng)前彈幕數(shù)據(jù),將其與違規(guī)彈幕庫(kù)進(jìn)行模糊匹配,根據(jù)匹配到的違規(guī)彈幕與對(duì)應(yīng)權(quán)重得到直播間的彈幕可疑值;
對(duì)直播視頻進(jìn)行場(chǎng)景分割,并對(duì)分割后的直播視頻進(jìn)行場(chǎng)景突變檢測(cè),根據(jù)場(chǎng)景突變的程度得到直播間的場(chǎng)景突變可疑值;
綜合分析流量可疑值、彈幕可疑值和場(chǎng)景突變可疑值得到可疑直播間,管理員查看可疑直播間判斷該直播間是否違規(guī);并根據(jù)違規(guī)判斷的結(jié)果對(duì)流量動(dòng)態(tài)閾值和違規(guī)彈幕庫(kù)進(jìn)行更新。
進(jìn)一步地,本發(fā)明的方法中計(jì)算得到直播間的流量可疑值的方法為:
步驟一、建立直播間不同時(shí)間段的正常流量數(shù)據(jù)的預(yù)測(cè)模型:
p(t)=a[d(t)-p(t-1)]+p(t-1)
其中,p(t)是時(shí)刻t的正常流程數(shù)據(jù)的預(yù)測(cè)值,p(t-1)為時(shí)刻t-1的理論預(yù)測(cè)值,d(t)是時(shí)刻t的實(shí)際流量數(shù)據(jù)的觀(guān)測(cè)值,a是加權(quán)常數(shù);
步驟二、實(shí)時(shí)獲取時(shí)刻t的實(shí)際流量數(shù)據(jù)的觀(guān)測(cè)值d(t),根據(jù)預(yù)測(cè)模型計(jì)算時(shí)刻t的正常流量數(shù)據(jù)的預(yù)測(cè)值p(t),并計(jì)算直播時(shí)觀(guān)測(cè)值變化率的標(biāo)準(zhǔn)差:
其中,δ表示標(biāo)準(zhǔn)差,即流量動(dòng)態(tài)閾值,n為某一直播間正常直播的總天數(shù),隨著天數(shù)的增加,n是一個(gè)逐漸增大的值,所以閾值δ是動(dòng)態(tài)改變的,d(t)i該直播間正常直播的第i天t時(shí)刻的觀(guān)測(cè)值,u為n天正常直播t時(shí)刻的平均值。
步驟三、若直播間某時(shí)刻|p(t)-d(t)|>δ,判斷該直播間發(fā)生流量異常,并返回該直播間的流量可疑值c1=|p(t)-d(t)|-δ。
進(jìn)一步地,本發(fā)明的方法中對(duì)流量動(dòng)態(tài)閾值進(jìn)行更新的方法為:
管理員查看可疑直播間判斷該直播間是否違規(guī),若違規(guī),則不更新流量動(dòng)態(tài)閾值;若不違規(guī),則自動(dòng)修改加權(quán)常數(shù)a,使?jié)M足:
a’[d(t)-p(t-1)]+p(t-1)=p[t]-d[t]=δ
其中,a’為修改后的加權(quán)常數(shù)。
進(jìn)一步地,本發(fā)明的方法中計(jì)算得到直播間的彈幕可疑值的方法為:
步驟一、獲取直播間的歷史彈幕數(shù)據(jù),從歷史彈幕數(shù)據(jù)中提取違規(guī)彈幕數(shù)據(jù)組成違規(guī)彈幕庫(kù),根據(jù)不同違規(guī)彈幕的出現(xiàn)頻率,設(shè)置不同的權(quán)重;
步驟二、實(shí)時(shí)獲取各個(gè)直播間的彈幕數(shù)據(jù),將彈幕數(shù)據(jù)轉(zhuǎn)換成拼音后進(jìn)行模糊匹配;
步驟三、將匹配到的違規(guī)彈幕乘以對(duì)應(yīng)的權(quán)重并累加,得到該直播間的可疑彈幕能量:
其中,e為可疑彈幕能量,ni為第i個(gè)違規(guī)彈幕出現(xiàn)的次數(shù),wi為第i個(gè)違規(guī)彈幕對(duì)應(yīng)的權(quán)重,k為違規(guī)彈幕的數(shù)量;
若e>x,x為出現(xiàn)彈幕異常的最小敏感彈幕能量值,則判斷該直播間出現(xiàn)彈幕異常,返回彈幕可疑值c2=e-x。
進(jìn)一步地,本發(fā)明的方法中更新違規(guī)彈幕庫(kù)的方法為:
管理員查看可疑直播間判斷該直播間是否違規(guī),若違規(guī),將直播間出現(xiàn)的違規(guī)彈幕添加到違規(guī)彈幕庫(kù)中,并更新彈幕對(duì)應(yīng)的權(quán)重。
進(jìn)一步地,本發(fā)明的方法中計(jì)算得到直播間的場(chǎng)景突變可疑值的方法為:
步驟一、獲取各個(gè)直播間的url,解析各個(gè)直播間的直播視頻的地址;
步驟二、對(duì)直播視頻等間隔的進(jìn)行場(chǎng)景分割,提取分割后的直播視頻中的圖像;
步驟三、比較相鄰幀圖像的相似度,檢測(cè)是否發(fā)生場(chǎng)景突變,若發(fā)生場(chǎng)景突變,返回場(chǎng)景突變可疑值。
進(jìn)一步地,本發(fā)明的方法中進(jìn)行綜合分析得到可疑直播間的方法為:
設(shè)流量可疑值為c1,彈幕可疑值為c2,場(chǎng)景突變可疑值為c3,設(shè)置對(duì)應(yīng)的權(quán)重分別為w1、w2和w3,直播間的總可疑值c=c1*w1+c2*w2+c3*w3,總可疑值的閾值為cm,cm的計(jì)算公式為:
其中,ci為歷史數(shù)據(jù)中違規(guī)直播的總可疑值,n為出現(xiàn)違規(guī)直播的次數(shù);
若總可疑值c大于閾值cm,則判斷該直播間為可疑直播間。
進(jìn)一步地,本發(fā)明的方法還包括對(duì)流量可疑值、彈幕可疑值和場(chǎng)景突變可疑值的權(quán)重進(jìn)行更新的方法:
管理員查看可疑直播間判斷該直播間是否違規(guī),若不違規(guī),則表示發(fā)生誤報(bào),對(duì)流量可疑值、彈幕可疑值和場(chǎng)景突變可疑值的權(quán)重進(jìn)行修正;若違規(guī),將新的違規(guī)直播間的可疑值加入閾值cm的計(jì)算中:
本發(fā)明提供一種直播平臺(tái)綜合狀態(tài)感知和內(nèi)容實(shí)時(shí)監(jiān)管系統(tǒng),包括以下單元:
流量監(jiān)控單元,用于根據(jù)直播間的歷史流量數(shù)據(jù)為每個(gè)直播間設(shè)置流量動(dòng)態(tài)閾值,實(shí)時(shí)獲取直播間的當(dāng)前流量數(shù)據(jù),結(jié)合當(dāng)前流量數(shù)據(jù)的變化率和流量動(dòng)態(tài)閾值得到直播間的流量可疑值;
彈幕監(jiān)控單元,用于根據(jù)直播間的歷史彈幕數(shù)據(jù)提取違規(guī)彈幕庫(kù),根據(jù)各違規(guī)彈幕的出現(xiàn)頻率設(shè)置對(duì)應(yīng)的權(quán)重;實(shí)時(shí)獲取直播間的當(dāng)前彈幕數(shù)據(jù),將其與違規(guī)彈幕庫(kù)進(jìn)行模糊匹配,根據(jù)匹配到的違規(guī)彈幕與對(duì)應(yīng)權(quán)重得到直播間的彈幕可疑值;
場(chǎng)景突變監(jiān)控單元,用于對(duì)直播視頻進(jìn)行場(chǎng)景分割,并對(duì)分割后的直播視頻進(jìn)行場(chǎng)景突變檢測(cè),根據(jù)場(chǎng)景突變的程度得到直播間的場(chǎng)景突變可疑值;
綜合分析單元,用于綜合分析流量可疑值、彈幕可疑值和場(chǎng)景突變可疑值得到可疑直播間,管理員查看可疑直播間判斷該直播間是否違規(guī);并根據(jù)違規(guī)判斷的結(jié)果對(duì)流量動(dòng)態(tài)閾值和違規(guī)彈幕庫(kù)進(jìn)行更新。
本發(fā)明產(chǎn)生的有益效果是:直播平臺(tái)綜合狀態(tài)感知和內(nèi)容實(shí)時(shí)監(jiān)管方法及系統(tǒng),綜合狀態(tài)感知多重指標(biāo)檢測(cè),根據(jù)反饋情況自動(dòng)學(xué)習(xí)更新,準(zhǔn)確度逐步提高,能適應(yīng)不同直播平臺(tái)的復(fù)雜環(huán)境,并且對(duì)新出現(xiàn)的違規(guī)類(lèi)型的能有效監(jiān)控,精確檢測(cè)出直播平臺(tái)海量數(shù)據(jù)中的違規(guī)內(nèi)容。
附圖說(shuō)明
下面將結(jié)合附圖及實(shí)施例對(duì)本發(fā)明作進(jìn)一步說(shuō)明,附圖中:
圖1是本發(fā)明實(shí)施例的系統(tǒng)總體結(jié)構(gòu)示意圖;
圖2是本發(fā)明實(shí)施例的異常流量監(jiān)控功能模塊的詳細(xì)流程圖;
圖3是本發(fā)明實(shí)施例的基于模糊匹配的敏感文字感知功能模塊的詳細(xì)流程圖;
圖4是本發(fā)明實(shí)施例的基于幀差的直播間狀態(tài)感知與分析功能模塊詳細(xì)流程圖。
具體實(shí)施方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
如圖1所示,本發(fā)明實(shí)施例的直播平臺(tái)綜合狀態(tài)感知和內(nèi)容實(shí)時(shí)監(jiān)管方法,包括以下步驟:
根據(jù)直播間的歷史流量數(shù)據(jù)為每個(gè)直播間設(shè)置流量動(dòng)態(tài)閾值,實(shí)時(shí)獲取直播間的當(dāng)前流量數(shù)據(jù),結(jié)合當(dāng)前流量數(shù)據(jù)的變化率和流量動(dòng)態(tài)閾值得到直播間的流量可疑值;
其中計(jì)算得到直播間的流量可疑值的方法為:
步驟一、建立直播間不同時(shí)間段的正常流量數(shù)據(jù)的預(yù)測(cè)模型:
p(t)=a[d(t)-p(t-1)]+p(t-1)
其中,p(t)是時(shí)刻t的正常流程數(shù)據(jù)的預(yù)測(cè)值,p(t-1)由歷史流量數(shù)據(jù)獲得,p(t-1)為t-1時(shí)刻的理論預(yù)測(cè)值,這里的歷史數(shù)據(jù)是,同一天前一時(shí)刻(t-1)的數(shù)據(jù),這個(gè)步驟只涉及到一天內(nèi)的數(shù)據(jù),而后面的計(jì)算δ是涉及到不同天同一時(shí)刻。d(t)是時(shí)刻t的實(shí)際流量數(shù)據(jù)的觀(guān)測(cè)值,a是加權(quán)常數(shù),加權(quán)常數(shù)是控制前一時(shí)刻預(yù)測(cè)值p(t-1)對(duì)當(dāng)前預(yù)測(cè)值p(t)的影響;
步驟二、實(shí)時(shí)獲取時(shí)刻t的實(shí)際流量數(shù)據(jù)的觀(guān)測(cè)值d(t),根據(jù)預(yù)測(cè)模型計(jì)算時(shí)刻t的正常流量數(shù)據(jù)的預(yù)測(cè)值p(t),并計(jì)算直播時(shí)觀(guān)測(cè)值變化率的標(biāo)準(zhǔn)差:
其中,δ表示標(biāo)準(zhǔn)差,即流量動(dòng)態(tài)閾值,n為某一直播間正常直播的總天數(shù),隨著天數(shù)的增加,n是一個(gè)逐漸增大的值,所以閾值δ是動(dòng)態(tài)改變的,d(t)i該直播間正常直播的第i天t時(shí)刻的觀(guān)測(cè)值,u為n天正常直播t時(shí)刻的平均值。
步驟三、若直播間某時(shí)刻|p(t)-d(t)|>δ,判斷該直播間發(fā)生流量異常,并返回該直播間的流量可疑值c1=|p(t)-d(t)|-δ。
其中對(duì)流量動(dòng)態(tài)閾值進(jìn)行更新的方法為:
管理員查看可疑直播間判斷該直播間是否違規(guī),若違規(guī),則不更新流量動(dòng)態(tài)閾值;若不違規(guī),則自動(dòng)修改加權(quán)常數(shù)a,使?jié)M足:
a’[d(t)-p(t-1)]+p(t-1)=p[t]-d[t]=δ
其中,a’為修改后的加權(quán)常數(shù)。
根據(jù)直播間的歷史彈幕數(shù)據(jù)提取違規(guī)彈幕庫(kù),根據(jù)各違規(guī)彈幕的出現(xiàn)頻率設(shè)置對(duì)應(yīng)的權(quán)重;實(shí)時(shí)獲取直播間的當(dāng)前彈幕數(shù)據(jù),將其與違規(guī)彈幕庫(kù)進(jìn)行模糊匹配,根據(jù)匹配到的違規(guī)彈幕與對(duì)應(yīng)權(quán)重得到直播間的彈幕可疑值;
其中計(jì)算得到直播間的彈幕可疑值的方法為:
步驟一、獲取直播間的歷史彈幕數(shù)據(jù),從歷史彈幕數(shù)據(jù)中提取違規(guī)彈幕數(shù)據(jù)組成違規(guī)彈幕庫(kù),根據(jù)不同違規(guī)彈幕的出現(xiàn)頻率,設(shè)置不同的權(quán)重;
步驟二、實(shí)時(shí)獲取各個(gè)直播間的彈幕數(shù)據(jù),將彈幕數(shù)據(jù)轉(zhuǎn)換成拼音后進(jìn)行模糊匹配;
步驟三、將匹配到的違規(guī)彈幕乘以對(duì)應(yīng)的權(quán)重并累加,得到該直播間的可疑彈幕能量:
其中,e為可疑彈幕能量,ni為第i個(gè)違規(guī)彈幕出現(xiàn)的次數(shù),wi為第i個(gè)違規(guī)彈幕對(duì)應(yīng)的權(quán)重,k為違規(guī)彈幕的數(shù)量;
若e>x,x為出現(xiàn)彈幕異常的最小敏感彈幕能量值,則判斷該直播間出現(xiàn)彈幕異常,返回彈幕可疑值c2=e-x。
其中更新違規(guī)彈幕庫(kù)的方法為:
管理員查看可疑直播間判斷該直播間是否違規(guī),若違規(guī),將直播間出現(xiàn)的違規(guī)彈幕添加到違規(guī)彈幕庫(kù)中,并更新彈幕對(duì)應(yīng)的權(quán)重。
對(duì)直播視頻進(jìn)行場(chǎng)景分割,并對(duì)分割后的直播視頻進(jìn)行場(chǎng)景突變檢測(cè),根據(jù)場(chǎng)景突變的程度得到直播間的場(chǎng)景突變可疑值;
其中計(jì)算得到直播間的場(chǎng)景突變可疑值的方法為:
步驟一、獲取各個(gè)直播間的url,解析各個(gè)直播間的直播視頻的地址;
步驟二、對(duì)直播視頻等間隔的進(jìn)行場(chǎng)景分割,提取分割后的直播視頻中的圖像;
步驟三、比較相鄰幀圖像的相似度,檢測(cè)是否發(fā)生場(chǎng)景突變,若發(fā)生場(chǎng)景突變,返回場(chǎng)景突變可疑值。
綜合分析流量可疑值、彈幕可疑值和場(chǎng)景突變可疑值得到可疑直播間,管理員查看可疑直播間判斷該直播間是否違規(guī);并根據(jù)違規(guī)判斷的結(jié)果對(duì)流量動(dòng)態(tài)閾值和違規(guī)彈幕庫(kù)進(jìn)行更新。
其中進(jìn)行綜合分析得到可疑直播間的方法為:
設(shè)流量可疑值為c1,彈幕可疑值為c2,場(chǎng)景突變可疑值為c3,設(shè)置對(duì)應(yīng)的權(quán)重分別為w1、w2和w3,直播間的總可疑值c=c1*w1+c2*w2+c3*w3,總可疑值的閾值為cm,cm的計(jì)算公式為:
其中,ci為歷史數(shù)據(jù)中違規(guī)直播的總可疑值,n為出現(xiàn)違規(guī)直播的次數(shù);
若總可疑值c大于閾值cm,則判斷該直播間為可疑直播間。
該方法還包括對(duì)流量可疑值、彈幕可疑值和場(chǎng)景突變可疑值的權(quán)重進(jìn)行更新的方法:
管理員查看可疑直播間判斷該直播間是否違規(guī),若不違規(guī),則表示發(fā)生誤報(bào),對(duì)流量可疑值、彈幕可疑值和場(chǎng)景突變可疑值的權(quán)重進(jìn)行修正;若違規(guī),將新的違規(guī)直播間的可疑值加入閾值cm的計(jì)算中:
本發(fā)明實(shí)施例的直播平臺(tái)綜合狀態(tài)感知和內(nèi)容實(shí)時(shí)監(jiān)管系統(tǒng),用于實(shí)現(xiàn)本發(fā)明實(shí)施例的直播平臺(tái)綜合狀態(tài)感知和內(nèi)容實(shí)時(shí)監(jiān)管方法,包括以下單元:
流量監(jiān)控單元,用于根據(jù)直播間的歷史流量數(shù)據(jù)為每個(gè)直播間設(shè)置流量動(dòng)態(tài)閾值,實(shí)時(shí)獲取直播間的當(dāng)前流量數(shù)據(jù),結(jié)合當(dāng)前流量數(shù)據(jù)的變化率和流量動(dòng)態(tài)閾值得到直播間的流量可疑值;
彈幕監(jiān)控單元,用于根據(jù)直播間的歷史彈幕數(shù)據(jù)提取違規(guī)彈幕庫(kù),根據(jù)各違規(guī)彈幕的出現(xiàn)頻率設(shè)置對(duì)應(yīng)的權(quán)重;實(shí)時(shí)獲取直播間的當(dāng)前彈幕數(shù)據(jù),將其與違規(guī)彈幕庫(kù)進(jìn)行模糊匹配,根據(jù)匹配到的違規(guī)彈幕與對(duì)應(yīng)權(quán)重得到直播間的彈幕可疑值;
場(chǎng)景突變監(jiān)控單元,用于對(duì)直播視頻進(jìn)行場(chǎng)景分割,并對(duì)分割后的直播視頻進(jìn)行場(chǎng)景突變檢測(cè),根據(jù)場(chǎng)景突變的程度得到直播間的場(chǎng)景突變可疑值;
綜合分析單元,用于綜合分析流量可疑值、彈幕可疑值和場(chǎng)景突變可疑值得到可疑直播間,管理員查看可疑直播間判斷該直播間是否違規(guī);并根據(jù)違規(guī)判斷的結(jié)果對(duì)流量動(dòng)態(tài)閾值和違規(guī)彈幕庫(kù)進(jìn)行更新。
在本發(fā)明的另一個(gè)具體實(shí)施例中:
針對(duì)目前網(wǎng)絡(luò)直播平臺(tái)監(jiān)管困難的問(wèn)題,本系統(tǒng)采用多重智能監(jiān)測(cè)技術(shù),智能識(shí)別違規(guī)直播房間。
1)自適應(yīng)閾值異常流量檢測(cè)方法
當(dāng)一個(gè)直播間正常直播時(shí),該直播間流量變化(房間在線(xiàn)人數(shù)、彈幕數(shù)、當(dāng)前網(wǎng)絡(luò)流量數(shù)、ip接入請(qǐng)求數(shù)、轉(zhuǎn)發(fā)數(shù)等)范圍總是固定在一個(gè)確定的范圍內(nèi),當(dāng)發(fā)生違規(guī)直播時(shí),直播間當(dāng)前觀(guān)看人數(shù)往往會(huì)發(fā)生突變,彈幕數(shù)量也增多,從而導(dǎo)致直播間流量發(fā)生異常??梢酝ㄟ^(guò)檢測(cè)異常流量的房間,間接定位違規(guī)直播房間。其中一個(gè)關(guān)鍵問(wèn)題就是閾值的設(shè)置,傳統(tǒng)方案為所有直播間設(shè)置一個(gè)固定閾值,不同時(shí)間段平臺(tái)整體流量變化率不同,不同直播間本身屬性不同。設(shè)置同一固定閾值會(huì)產(chǎn)生大量誤報(bào)漏報(bào)情況。
本發(fā)明提出了一種動(dòng)態(tài)閾值方案,為每個(gè)直播間不同時(shí)間段自動(dòng)設(shè)置專(zhuān)屬動(dòng)態(tài)閾值,大大提高了檢測(cè)的準(zhǔn)確性。
該方法包括:
1.由于直播平臺(tái)整體是動(dòng)態(tài)變化的,本系統(tǒng)建立了一種根據(jù)最近觀(guān)測(cè)值,逐漸刷新該直播間,每天正常直播的模型,該刷新機(jī)制結(jié)合當(dāng)天該時(shí)段的變化率,和之前正常直播的變化率,并且并且歷史數(shù)據(jù)起主要作用:
p(t)=a[d(t)-p(t-1)]+p(t-1)
2.本系統(tǒng)自動(dòng)獲取直播平臺(tái)所有直播房間的房間號(hào)(roomid)和當(dāng)前時(shí)間(t),根據(jù)該變化率的觀(guān)測(cè)值d(t),計(jì)算出該直播間該時(shí)間段對(duì)應(yīng)值預(yù)測(cè)p(t),然后計(jì)算該直播間該時(shí)間段,之前正常直播時(shí)變化率觀(guān)測(cè)值的標(biāo)準(zhǔn)差:
3.當(dāng)|p(t)-d(t)|>δ,本系統(tǒng)會(huì)認(rèn)為該直播間可能發(fā)生異常,系統(tǒng)返回一個(gè)可疑值c1給綜合分析系統(tǒng)。
c1=|p(t)-d(t)|
模塊4)綜合分析之后,該直播間的房間號(hào)會(huì)被提交給管理員,管理員審查若該直播間為違規(guī)直播間,則系統(tǒng)繼續(xù)正常運(yùn)行;若管理員反應(yīng)該直播間為正常直播間,則自動(dòng)修改參數(shù)a,使:
a’[d(t)-p(t-1)]+p(t-1)=p[t]-d[t]=δ
2)敏感彈幕模糊感知方法
網(wǎng)絡(luò)直播平臺(tái)相比傳統(tǒng)電視多媒體相比,最大的區(qū)別就是用戶(hù)可以發(fā)送彈幕,發(fā)生違規(guī)直播時(shí)彈幕數(shù)量、彈幕內(nèi)容與正常直播間都會(huì)有較大不同。抓取并檢測(cè)異常彈幕內(nèi)容,屬于文字操作,計(jì)算快,延遲低,同時(shí)采用模糊匹配擴(kuò)大監(jiān)管范圍,定位異常直播間。
我們提出了一種彈幕感知方法,該方法包括:
1.本系統(tǒng)首先統(tǒng)計(jì)了違規(guī)直播出現(xiàn)時(shí)直播房間的彈幕,統(tǒng)計(jì)了一個(gè)出現(xiàn)違規(guī)直播的可能關(guān)鍵詞列表,根據(jù)不同彈幕出現(xiàn)的頻率不同,設(shè)置不同的權(quán)重(wi)。
2.系統(tǒng)模擬多個(gè)客戶(hù)端連接直播平臺(tái)彈幕服務(wù)器,同時(shí)獲取所有直播房間彈幕流。
3.對(duì)敏感彈幕信息進(jìn)行模糊匹配,包含關(guān)鍵詞的彈幕信息,或是包含與關(guān)鍵詞相似的彈幕,都會(huì)被本系統(tǒng)檢測(cè)到。匹配過(guò)程首先把彈幕信息轉(zhuǎn)換成拼音,然后進(jìn)行匹配。有效防止了最常見(jiàn)的同音字繞過(guò)和插入無(wú)關(guān)字符來(lái)避開(kāi)系統(tǒng)檢測(cè)。
4.用匹配到的彈幕數(shù)量乘以該可疑彈幕的權(quán)重(n*wi),累加得到該直播間整體的可疑彈幕能量(e):
當(dāng)e>x時(shí)(x為出現(xiàn)違規(guī)直播時(shí)的最小敏感彈幕能量和),定位該直播間的房間號(hào),返回可疑值c2(c2=e-x)給分析系統(tǒng),并對(duì)發(fā)送彈幕的用戶(hù)的相關(guān)信息進(jìn)行本地保存。
5.模塊4)綜合分析之后,發(fā)現(xiàn)違規(guī)直播房間后,本系統(tǒng)自動(dòng)對(duì)彈幕庫(kù)擴(kuò)展,并按出現(xiàn)頻率分配不同權(quán)重。
3)幀差分析直播間狀態(tài)感知方法
當(dāng)一個(gè)直播間發(fā)生違規(guī)直播時(shí),該直播間與正常直播相比必定發(fā)生了明顯的場(chǎng)景切換,本系統(tǒng)該模塊通過(guò)對(duì)直播視頻流進(jìn)行場(chǎng)景分割,減少了需要檢測(cè)的視頻和圖像數(shù)量,以及減少了需要檢測(cè)的圖像比特?cái)?shù),快速定位那些場(chǎng)景突變的直播間,根據(jù)變化的程度返回不同的可疑值c3,給分析系統(tǒng)。
具體包括:
1.本系統(tǒng)首先自動(dòng)從直播平臺(tái)首頁(yè)獲取各個(gè)房間url,然后解析出各個(gè)房間的真實(shí)視頻流地址。
2.從視頻流中等間隔的獲取直播間截圖,對(duì)于捕獲的截圖本地保存(當(dāng)違規(guī)直播產(chǎn)生不良影響時(shí),該截圖可以作為追究責(zé)任的證據(jù))。
3.本系統(tǒng)通過(guò)比較相鄰幀截圖相似度,來(lái)判斷場(chǎng)景的變化,當(dāng)相鄰幀的幀差大于閾值k時(shí),本系統(tǒng)認(rèn)為直播間發(fā)生了場(chǎng)景的變化。
4)綜合分析模塊
跟據(jù)以上三個(gè)模塊的返回值c1.c2.c3得到該直播間總的可疑值cm(c=c1*w1+c2*w2+c3*w3),總的可疑值超過(guò)預(yù)設(shè)值cm時(shí),提交該直播間房間號(hào)給管理員,其中:
其中,ci為歷史數(shù)據(jù)中違規(guī)直播的總可疑值,n為出現(xiàn)違規(guī)直播的次數(shù);
管理員查看直播間歷史截圖信息,和當(dāng)前直播內(nèi)容,判斷該直播間是否違規(guī)。管理員確認(rèn)后,反饋信息給本系統(tǒng),若該直播間沒(méi)有進(jìn)行違規(guī)直播,即本系統(tǒng)發(fā)生誤報(bào),本系統(tǒng)自動(dòng)對(duì)各個(gè)模塊可疑值權(quán)重進(jìn)行調(diào)整,使c1*w1+c2*w2+c3*w3=cm。
管理員確認(rèn)違規(guī)之后,cm計(jì)算過(guò)程加入最新違規(guī)直播間總的可疑能量。
根據(jù)反饋信息自動(dòng)學(xué)習(xí)更新,使本系統(tǒng)在不同直播平臺(tái)的不同環(huán)境都能有著很好的準(zhǔn)確度。
發(fā)明整體設(shè)計(jì)的過(guò)程中,鑒于直播內(nèi)容種類(lèi)繁多,預(yù)設(shè)對(duì)比圖不可能涵蓋所有類(lèi)型的違規(guī)直播,機(jī)器識(shí)別誤報(bào)漏報(bào)率太大,重點(diǎn)放在監(jiān)控違規(guī)直播出現(xiàn)的間接因素,三重檢測(cè),自動(dòng)學(xué)習(xí),在不斷的反饋與學(xué)習(xí)的過(guò)程中,使監(jiān)控過(guò)程中的漏報(bào)率大大降低,迅速精準(zhǔn)定位違規(guī)直播間,提交給平臺(tái)管理人員,讓違規(guī)直播間在產(chǎn)生不良影響之前,對(duì)該直播間進(jìn)行封禁。
應(yīng)當(dāng)理解的是,對(duì)本領(lǐng)域普通技術(shù)人員來(lái)說(shuō),可以根據(jù)上述說(shuō)明加以改進(jìn)或變換,而所有這些改進(jìn)和變換都應(yīng)屬于本發(fā)明所附權(quán)利要求的保護(hù)范圍。