1.一種實(shí)現(xiàn)收視信息處理的方法,其特征在于,包括:
以戶為單位統(tǒng)計(jì)預(yù)設(shè)數(shù)值戶家庭的收視樣本信息;
根據(jù)統(tǒng)計(jì)的所述收視樣本信息統(tǒng)計(jì)每一個(gè)收視成員的收視情況;
根據(jù)統(tǒng)計(jì)獲得的收視情況擬合獲得具有相同人口屬性的收視成員的收視習(xí)慣概率信息;
采集需要進(jìn)行收視分析的每一戶家庭的收視源信息;
根據(jù)統(tǒng)計(jì)的收視成員的收視情況及收視習(xí)慣概率信息對(duì)采集每一戶家庭的收視源信息進(jìn)行分析,獲得每一戶家庭的收視源信息對(duì)應(yīng)的收視成員構(gòu)成和每一個(gè)收視成員的收視情況;
其中,所述收視樣本信息包括:第一預(yù)設(shè)時(shí)長(zhǎng)內(nèi)每一戶家庭中的每一個(gè)收視成員的人口屬性,及按照預(yù)設(shè)時(shí)段統(tǒng)計(jì)的每一個(gè)收視成員的收視信息。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述預(yù)設(shè)時(shí)段包括:工作日中以第一預(yù)設(shè)時(shí)長(zhǎng)劃分的第一時(shí)段和節(jié)假日時(shí)以第二預(yù)設(shè)時(shí)長(zhǎng)劃分的第二時(shí)段,所述收視信息包括:
每一個(gè)第一時(shí)段中每一個(gè)收視成員的收視節(jié)目類別;
每一個(gè)第二時(shí)段中每一個(gè)收視成員的收視節(jié)目類別。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述統(tǒng)計(jì)收視樣本信息中的每一個(gè)收視成員的收視情況包括:
按照預(yù)設(shè)時(shí)段統(tǒng)計(jì)所述收視樣本信息中的每一個(gè)收視成員收看每一種收視節(jié)目類別的收視頻次,并根據(jù)統(tǒng)計(jì)的收視頻次計(jì)算每一個(gè)收視人員在每一個(gè)預(yù)設(shè)時(shí)段收視每一收視節(jié)目類別的概率;
其中,在第i個(gè)所述預(yù)設(shè)時(shí)段里觀看收視節(jié)目類別為第j類節(jié)目的頻次記為count(時(shí)段=i,類型=j(luò));
收視成員在時(shí)段下i觀看每一種收視節(jié)目類別的節(jié)目的概率為:
其中,T是收視節(jié)目類別的個(gè)數(shù)。
4.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述擬合獲得具有相同人口屬性的收視成員的收視習(xí)慣概率信息包括:
根據(jù)統(tǒng)計(jì)獲得的所述收視情況匯聚具有相同人口屬性的收視成員,在相同的預(yù)設(shè)時(shí)段收看所有收視節(jié)目類別的概率后,使用最大似然估計(jì)法擬合出對(duì)應(yīng)的超分布參數(shù);
其中,所述超分布參數(shù)包括狄利克雷Dirichlet分布,超參數(shù)分布的計(jì)算公式為:
其中,為計(jì)算獲得的所有收視成員收視各個(gè)收視節(jié)目類別的節(jié)目的平均概率;N為收視樣本信息中滿足一種人口屬性的收視成員總數(shù),pk(類型=j(luò),時(shí)段=i)為第k個(gè)收視成員在第i個(gè)預(yù)設(shè)時(shí)段收看收視節(jié)目類別為j的概率,T是收視節(jié)目類別的個(gè)數(shù);
根據(jù)擬合出的超分布參數(shù)獲得具有相同人口屬性的收視成員的收視習(xí)慣概率信息;其中,收視習(xí)慣概率信息的計(jì)算公式包括:
其中,為Beta函數(shù),pl表示收視成員在第i個(gè)預(yù)設(shè)時(shí)段觀看收視節(jié)目類別l的概率,l=1、2、3……T。
5.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述收視源信息包括以下任意組合:收視設(shè)備身份標(biāo)識(shí)號(hào)ID、收視行為時(shí)間、收看的節(jié)目、收視節(jié)目類別。
6.根據(jù)權(quán)利要求1或2所述的方法,所述根據(jù)統(tǒng)計(jì)的收視成員的收視情況及收視習(xí)慣概率信息對(duì)采集每一戶家庭的收視源信息進(jìn)行分析包括:
對(duì)第二預(yù)設(shè)時(shí)長(zhǎng)內(nèi)采集的每一戶家庭的所述收視源信息,按照預(yù)設(shè)時(shí)段和收視節(jié)目類別統(tǒng)計(jì)每一戶家庭的待分析特征向量;其中,待分析特征向量V={v1×1,v1×2,…,vM×N},M表示預(yù)設(shè)時(shí)段的個(gè)數(shù),N是收視節(jié)目類別的個(gè)數(shù),該收視設(shè)備在第i個(gè)預(yù)設(shè)時(shí)段觀看第j個(gè)收視節(jié)目類別的頻次為向量V的第k維vk,k=(i-1)×N+j;
從收視樣本信息截取第二預(yù)設(shè)時(shí)長(zhǎng)的收視信息,獲得所述收視樣本信息中每一戶家庭的樣本特征向量;其中,基于收視樣本信息計(jì)算的樣本特征向量可以記為V1、V2、……Vi……、VL;其中,L是收視樣本集合里的家庭總戶數(shù);
對(duì)統(tǒng)計(jì)的每一戶家庭的待分析特征向量,分別與所述收視樣本信息中每一戶家庭的樣本特征向量進(jìn)行相似度計(jì)算,將相似度最高的樣本特征向量對(duì)應(yīng)的家庭的收視成員數(shù)作為該待分析特征向量對(duì)應(yīng)的家庭的收視成員數(shù);其中,進(jìn)行相似度計(jì)算的計(jì)算公式為:
根據(jù)確定的所述收視成員數(shù)、及根據(jù)所述收視樣本信息統(tǒng)計(jì)的每一個(gè)收視成員的所述收視情況及所述收視習(xí)慣概率信息,對(duì)采集每一戶家庭的收視源信息進(jìn)行分析,獲得每一戶家庭的收視源信息對(duì)應(yīng)的收視成員構(gòu)成和每一個(gè)收視成員的收視情況。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,獲得每一戶家庭的收視源信息對(duì)應(yīng)的收視成員構(gòu)成和每一個(gè)收視成員的收視情況后,所述方法還包括:
對(duì)各收視源信息對(duì)應(yīng)的家庭中收視在相同預(yù)設(shè)時(shí)段同時(shí)收視相同電視節(jié)目的用戶進(jìn)行統(tǒng)計(jì)。
8.一種實(shí)現(xiàn)收視信息處理的裝置,其特征在于,包括:統(tǒng)計(jì)樣本單元、統(tǒng)計(jì)收視情況單元、擬合單元、采集單元、分析單元;其中,
統(tǒng)計(jì)樣本單元用于,以戶為單位統(tǒng)計(jì)預(yù)設(shè)數(shù)值戶家庭的收視樣本信息;
統(tǒng)計(jì)收視情況單元用于,根據(jù)統(tǒng)計(jì)的所述收視樣本信息統(tǒng)計(jì)每一個(gè)收視成員的收視情況;
擬合單元用于,根據(jù)統(tǒng)計(jì)獲得的收視情況擬合獲得具有相同人口屬性的收視成員的收視習(xí)慣概率信息;
采集單元用于,采集需要進(jìn)行收視分析的每一戶家庭的收視源信息;
分析單元用于,根據(jù)統(tǒng)計(jì)的收視成員的收視情況及收視習(xí)慣概率信息對(duì)采集每一戶家庭的收視源信息進(jìn)行分析,獲得每一戶家庭的收視源信息對(duì)應(yīng)的收視成員構(gòu)成和每一個(gè)收視成員的收視情況;
其中,所述收視樣本信息包括:第一預(yù)設(shè)時(shí)長(zhǎng)內(nèi)每一戶家庭中的每一個(gè)收視成員的人口屬性,及按照預(yù)設(shè)時(shí)段統(tǒng)計(jì)的每一個(gè)收視成員的收視信息。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述預(yù)設(shè)時(shí)段包括:工作日中以第一預(yù)設(shè)時(shí)長(zhǎng)劃分的第一時(shí)段和節(jié)假日時(shí)以第二預(yù)設(shè)時(shí)長(zhǎng)劃分的第二時(shí)段,所述收視信息包括:
每一個(gè)第一時(shí)段中每一個(gè)收視成員的收視節(jié)目類別;
每一個(gè)第二時(shí)段中每一個(gè)收視成員的收視節(jié)目類別。
10.根據(jù)權(quán)利要求8或9所述的裝置,其特征在于,所述統(tǒng)計(jì)收視情況單元具體用于:
按照所述預(yù)設(shè)時(shí)段統(tǒng)計(jì)所述收視樣本信息中的每一個(gè)收視成員收看每一種收視節(jié)目類別的收視頻次,并根據(jù)統(tǒng)計(jì)的收視頻次計(jì)算每一個(gè)收視人員在每一個(gè)預(yù)設(shè)時(shí)段收視每一收視節(jié)目類別的概率;
其中,在第i個(gè)所述預(yù)設(shè)時(shí)段里觀看收視節(jié)目類別為第j類節(jié)目的頻次記為count(時(shí)段=i,類型=j(luò));
收視成員在時(shí)段下i觀看每一種收視節(jié)目類別的節(jié)目的概率為:
其中,T是收視節(jié)目類別的個(gè)數(shù)。
11.根據(jù)權(quán)利要求8或9所述的裝置,其特征在于,所述擬合單元擬合獲得具有相同人口屬性的收視成員的收視習(xí)慣概率信息包括:
根據(jù)統(tǒng)計(jì)獲得的所述收視情況匯聚具有相同人口屬性的收視成員,在相同的預(yù)設(shè)時(shí)段收看所有收視節(jié)目類別的概率后,使用最大似然估計(jì)法擬合出對(duì)應(yīng)的超分布參數(shù);
其中,所述超分布參數(shù)包括狄利克雷Dirichlet分布,超參數(shù)分布的計(jì)算公式為:
其中,為計(jì)算獲得的所有收視成員收視各個(gè)收視節(jié)目類別的節(jié)目的平均概率;N為收視樣本信息中滿足一種人口屬性的收視成員總數(shù),pk(類型=j(luò),時(shí)段=i)為第k個(gè)收視成員在第i個(gè)預(yù)設(shè)時(shí)段收看收視節(jié)目類別為j的概率,T是收視節(jié)目類別的個(gè)數(shù);
根據(jù)擬合出的超分布參數(shù)獲得具有相同人口屬性的收視成員的收視習(xí)慣概率信息;其中,收視習(xí)慣概率信息的計(jì)算公式包括:
其中,為Beta函數(shù),pl表示收視成員在第i個(gè)預(yù)設(shè)時(shí)段觀看收視節(jié)目類別l的概率,l=1、2、3……T。
12.根據(jù)權(quán)利要求8或9所述的裝置,其特征在于,所述收視源信息包括以下任意組合:收視設(shè)備身份標(biāo)識(shí)號(hào)ID、收視行為時(shí)間、收看的節(jié)目、收視節(jié)目類別。
13.根據(jù)權(quán)利要求8或9所述的方法,所述分析單元具體用于,
對(duì)第二預(yù)設(shè)時(shí)長(zhǎng)內(nèi)采集的每一戶家庭的所述收視源信息,按照預(yù)設(shè)時(shí)段和收視節(jié)目類別統(tǒng)計(jì)每一戶家庭的待分析特征向量;其中,待分析特征向量V={v1×1,v1×2,…,vM×N},M表示預(yù)設(shè)時(shí)段的個(gè)數(shù),N是收視節(jié)目類別的個(gè)數(shù),該收視設(shè)備在第i個(gè)預(yù)設(shè)時(shí)段觀看第j個(gè)收視節(jié)目類別的頻次為向量V的第k維vk,k=(i-1)×N+j;
從收視樣本信息截取第二預(yù)設(shè)時(shí)長(zhǎng)的收視信息,獲得所述收視樣本信息中每一戶家庭的樣本特征向量;其中,基于收視樣本信息計(jì)算的樣本特征向量可以記為V1、V2、……Vi……、VL;其中,L是收視樣本集合里的家庭總戶數(shù);對(duì)統(tǒng)計(jì)的每一戶家庭的待分析特征向量,分別與所述收視樣本信息中每一戶家庭的樣本特征向量進(jìn)行相似度計(jì)算,將相似度最高的樣本特征向量對(duì)應(yīng)的家庭的收視成員數(shù)作為該待分析特征向量對(duì)應(yīng)的家庭的收視成員數(shù);其中,進(jìn)行相似度計(jì)算的計(jì)算公式為:
根據(jù)確定的所述收視成員數(shù)、及根據(jù)所述收視樣本信息統(tǒng)計(jì)的每一個(gè)收視成員的所述收視情況及所述收視習(xí)慣概率信息,對(duì)采集每一戶家庭的收視源信息進(jìn)行分析,獲得每一戶家庭的收視源信息對(duì)應(yīng)的收視成員構(gòu)成和每一個(gè)收視成員的收視情況。
14.根據(jù)權(quán)利要求8或9所述的裝置,其特征在于,所述分析單元還用于,獲得每一戶家庭的收視源信息對(duì)應(yīng)的收視成員構(gòu)成和每一個(gè)收視成員的收視情況后,對(duì)各收視源信息對(duì)應(yīng)的家庭中收視在相同預(yù)設(shè)時(shí)段同時(shí)收視相同電視節(jié)目的用戶進(jìn)行統(tǒng)計(jì)。