本發(fā)明涉及非結(jié)構(gòu)化文檔的數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種能將標準格式的軟件工程系統(tǒng)分析與概要設(shè)計文檔和結(jié)構(gòu)化模型進行雙向轉(zhuǎn)換的數(shù)據(jù)處理的方法及裝置。
背景技術(shù):
在軟件工程的生命周期中,分析與概要設(shè)計的文檔對后面的開發(fā)、測試、實施、維護工作起到了關(guān)鍵性的影響,設(shè)計文檔的質(zhì)量直接影響工程的進度與軟件交付的質(zhì)量。為保證設(shè)計質(zhì)量,目前,IT業(yè)界的通常做法是:制定標準的設(shè)計文檔模板,以統(tǒng)一企業(yè)內(nèi)的所有IT項目的設(shè)計過程、設(shè)計標準、規(guī)范及約束等。但是,文檔本身并不具備很好的約束性,它無法固化設(shè)計標準與約束,以文檔作為交付物的設(shè)計成果質(zhì)量,一定程度商取決于設(shè)計者對設(shè)計模板的遵從性。而且,對于設(shè)計審查人員來說,除了通讀文檔,并沒有其他更好的方式幫助其審查設(shè)計內(nèi)容,而對于一個企業(yè)級設(shè)計管理者來說,要實現(xiàn)對企業(yè)內(nèi)部所有信息系統(tǒng)設(shè)計內(nèi)容的總體分析與管理,只能依靠手工收集、匯總與整理的方法,這種方法簡單、低效、需耗費大量人力物力,而形成的結(jié)果具有有限的時效性,且質(zhì)量無法保證。
為了解決上述問題,我們對傳統(tǒng)的軟件工程系統(tǒng)分析與概要設(shè)計交付文檔,進行總結(jié)與提煉,形成一套可承載系統(tǒng)分析與概要設(shè)計內(nèi)容,同時固化設(shè)計標準與約束,內(nèi)置本階段設(shè)計要素間內(nèi)在關(guān)系的系統(tǒng)分析與概要設(shè)計模型,以結(jié)構(gòu)化的模型作為交付成果。由于在采用模型化分析與設(shè)計的過程中,可能存在已設(shè)計好的文檔,存在設(shè)計文檔與結(jié)構(gòu)化模型并存的情況,而手工 將已設(shè)計好的大量文檔,轉(zhuǎn)換成結(jié)構(gòu)化模型需要耗費大量的時間,效率非常低,轉(zhuǎn)換質(zhì)量也無法保證。因此,我們發(fā)明了一種將系統(tǒng)分析與概要設(shè)計文檔轉(zhuǎn)換為結(jié)構(gòu)化模型的數(shù)據(jù)處理方法及裝置。
技術(shù)實現(xiàn)要素:
本發(fā)明實施例提供了一種數(shù)據(jù)處理的方法及裝置,可以將標準格式的分析與概要設(shè)計交付文檔轉(zhuǎn)換成結(jié)構(gòu)化的分析與概要設(shè)計模型,提高設(shè)計文檔內(nèi)容到結(jié)構(gòu)化模型的轉(zhuǎn)換效率和質(zhì)量;也可將已設(shè)計好的分析與概要設(shè)計模型,導出成標準的分析與概要設(shè)計交付文檔,即省去了設(shè)計文檔編寫的工作量,又能有效保證設(shè)計文檔與設(shè)計模型的一致性。同時,所述裝置還可根據(jù)用戶的管理需求,定制合規(guī)性審查報告,自動生成設(shè)計內(nèi)容審查結(jié)果,幫助提升設(shè)計內(nèi)容的審查效率和質(zhì)量。
在第一方面,本發(fā)明實施例提供了一種數(shù)據(jù)處理的方法,所述方法包括:讀取導入配置信息,抽取文檔數(shù)據(jù)形成中間文件,所述導入配置信息包括第一格式信息和所述文檔數(shù)據(jù)與模型數(shù)據(jù)的映射關(guān)系;檢測所述待轉(zhuǎn)換文檔的第二格式信息與所述第一格式信息是否一致;當檢測到所述第二格式信息與所述第一格式信息一致時,按照所述模型數(shù)據(jù)中的模型定義,對所述中間文件進行格式處理和拆分處理,并將處理后的中間文件轉(zhuǎn)換成與所述模型定義對應的CSV文件;將所述CSV文件導入結(jié)構(gòu)化模型數(shù)據(jù)庫。
在第一方面的第一種可能的實現(xiàn)方式中,所述方法還包括:預先設(shè)置導出配置表信息,所述導出配置表信息包括:待生成報表適用的取數(shù)邏輯,報表的表頭,報表各要素對應的模型定義及屬性,報表的輸入項以及輸出項,或者是待生成設(shè)計文檔的模板;讀取并解析導出配置表信息,確定在所述模型數(shù)據(jù)中的取數(shù)范圍和取數(shù)邏輯;根據(jù)所述取數(shù)范圍和取數(shù)邏輯,讀取相應的模型定義、圖和符號,生成報表或標準的設(shè)計文檔。
結(jié)合第一方面的第一種可能的實現(xiàn)方式,在第二種可能的實現(xiàn)方式中, 所述檢測所述待轉(zhuǎn)換文檔數(shù)據(jù)的第二格式信息與所述第一格式信息是否一致,具體包括:根據(jù)所述導入配置信息中的關(guān)鍵詞對所述待轉(zhuǎn)換文檔進行定位,通過是否定位成功判斷所述第二格式信息與所述導入配置信息中的所述第一格式信息是否一致。
結(jié)合第一方面的第一種可能的實現(xiàn)方式,在第三種可能的實現(xiàn)方式中,所述檢測所述待轉(zhuǎn)換文檔數(shù)據(jù)的第二格式信息與所述第一格式信息是否一致,具體還包括:檢測所述待轉(zhuǎn)換文檔數(shù)據(jù)是否包括不可為空的數(shù)據(jù)或者所述不可為空的數(shù)據(jù)是否填寫,輸入數(shù)據(jù)是否在規(guī)定的范圍內(nèi),不可重復的內(nèi)容是否存在重復。
結(jié)合第一方面的第一種可能的實現(xiàn)方式,在第四種可能的實現(xiàn)方式中,所述檢測所述待轉(zhuǎn)換文檔數(shù)據(jù)的第二格式信息與所述第一格式信息是否一致,具體還包括:當檢測到所述第二格式信息與所述第一格式信息不一致時,將所述第二格式信息的錯誤信息及其在待轉(zhuǎn)換文檔中的具體位置寫入錯誤日志,將所述錯誤日志發(fā)送給用戶。
在第二方面,本發(fā)明實施例提供了一種裝置,所述裝置包括:抽取單元,用于讀取導入配置信息,抽取待轉(zhuǎn)換文檔數(shù)據(jù),形成中間文件,所述導入配置信息包括第一格式信息和所述待轉(zhuǎn)換文檔數(shù)據(jù)與模型數(shù)據(jù)的映射關(guān)系;檢測單元,用于檢測所述待轉(zhuǎn)換文檔的第二格式信息與所述第一格式信息是否一致;轉(zhuǎn)換單元,用于當檢測到所述第二格式信息與所述第一格式信息一致時,按照所述模型數(shù)據(jù)中的模型定義,將所述中間文件進行格式處理和拆分處理,并轉(zhuǎn)換成與所述模型定義對應的CSV文件;導入單元,用于將所述CSV文件導入結(jié)構(gòu)化模型數(shù)據(jù)庫。
在第一方面的第一種可能的實現(xiàn)方式中,所述裝置還包括:配置單元,用于預先設(shè)置導出配置表信息,所述導出配置表信息包括:待生成報表適用的取數(shù)邏輯,報表的表頭,報表各要素對應的模型定義及屬性,報表的輸入項以及輸出項,或者是待生成設(shè)計文檔的模板;解析單元,用于讀取并解析 所述導出配置表信息,確定在所述模型數(shù)據(jù)中的取數(shù)范圍和取數(shù)邏輯;生成單元,根據(jù)所述取數(shù)范圍和取數(shù)邏輯,讀取相應的模型定義、圖和符號,生成報表或標準的設(shè)計文檔。
結(jié)合第二方面的第一種可能的實現(xiàn)方式,在第二種可能的實現(xiàn)方式中,所述檢測單元具體用于:根據(jù)所述導入配置信息中的關(guān)鍵詞對所述待轉(zhuǎn)換文檔數(shù)據(jù)進行定位,通過是否定位成功判斷所述第二格式信息與所述配置信息中的所述第一格式信息是否一致。
結(jié)合第二方面的第一種可能的實現(xiàn)方式,在第三種可能的實現(xiàn)方式中,所述檢測單元具體還用于:檢測所述待轉(zhuǎn)換文檔數(shù)據(jù)是否包括不可為空的數(shù)據(jù)或者所述不可為空的數(shù)據(jù)是否填寫,輸入數(shù)據(jù)是否在規(guī)定的范圍內(nèi),不可重復的內(nèi)容是否存在重復等。
結(jié)合第二方面的第一種可能的實現(xiàn)方式,在第四種可能的實現(xiàn)方式中,所述檢測單元具體還用于:當檢測到所述第二格式信息與所述第一格式信息不一致時,將所述第二格式信息的錯誤信息及其在待轉(zhuǎn)換文檔中的具體位置寫入錯誤日志,將所述錯誤日志發(fā)送給用戶。
本發(fā)明實施例提供的數(shù)據(jù)處理方法及裝置,通過抽象從所述結(jié)構(gòu)化模型中抽取數(shù)據(jù)的常見取數(shù)邏輯,提供給用戶報表配置功能,在不需要修改代碼的情況下,通過調(diào)整配置表生成新的報表,簡化了報表的定制過程,提高了定制報表的效率。本裝置實現(xiàn)了標準文檔到模型化數(shù)據(jù)的批量導入,避免了文檔轉(zhuǎn)換中工作量大,轉(zhuǎn)換效率低,質(zhì)量難以保證的缺點,節(jié)省了人力和物力。
附圖說明
圖1為本發(fā)明實施例提供的數(shù)據(jù)處理的方法流程圖;
圖2為本發(fā)明實施例提供的結(jié)構(gòu)化模型數(shù)據(jù)生成報表文件的處理流程圖;
圖3為本申請另一種實施例提供的裝置。
具體實施方式
為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例。
基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面結(jié)合附圖對本發(fā)明具體實施例作進一步的詳細描述,實施例并不構(gòu)成對本發(fā)明實施例的限定。
本申請實施例提供的數(shù)據(jù)處理的方法,適用于處理標準的非結(jié)構(gòu)化設(shè)計文檔,但并不以此作為限制。
為了更好地理解本申請的優(yōu)點,下面通過附圖和詳細的描述來介紹本申請的實施例。
圖1為本申請一種實施例提供的數(shù)據(jù)處理的方法流程圖100。該實施例的執(zhí)行主體可以是服務器,所述數(shù)據(jù)處理的方法具體包括以下步驟:
步驟101,讀取導入配置信息,抽取待轉(zhuǎn)換文檔數(shù)據(jù),按照所述模型數(shù)據(jù)中的模型定義,形成中間文件。
所述導入配置信息包括第一格式信息和所述待轉(zhuǎn)換文檔數(shù)據(jù)與模型數(shù)據(jù)的映射關(guān)系。
這里的待轉(zhuǎn)換文檔數(shù)據(jù)可以是word文檔數(shù)據(jù),文檔數(shù)據(jù)可以包括:標題、章節(jié)號、章節(jié)下相應的表格等。導入配置信息可以以表格的形式存儲,可以包括以關(guān)鍵字的形式記錄模板文檔數(shù)據(jù)的標準格式信息即第一格式信息,例如:標題、章節(jié)號、章節(jié)下相應的表格、表格中的關(guān)鍵字、表格中的行數(shù)與列數(shù)、章節(jié)內(nèi)包含關(guān)鍵字,章節(jié)下嵌入表格文件、表格文件中關(guān)鍵字、表格文件中的行數(shù)與列數(shù)。
導入配置信息還包括了模板文檔數(shù)據(jù)與模型數(shù)據(jù)的映射關(guān)系,其中,模 型數(shù)據(jù)還包括模型定義與文檔數(shù)據(jù)中數(shù)據(jù)的定義的包含關(guān)系以及關(guān)聯(lián)關(guān)系。例如:word文檔標準格式1.1章節(jié)下有一個表格,表格包含三列“聯(lián)機服務ID”、“聯(lián)機服務名稱”、“對應交易服務名稱”,其中“聯(lián)機服務ID”、“聯(lián)機服務名稱”對應模型數(shù)據(jù)中的模型定義“聯(lián)機服務”,而“交易服務名稱”對應模型數(shù)據(jù)中的模型定義“交易服務”。
步驟102,檢測所述待轉(zhuǎn)換文檔的第二格式信息與所述第一格式信息是否一致。
例如:導入配置信息表格中設(shè)置word文檔標準格式為:1.1章節(jié)下有一個表格,表格包含三列“聯(lián)機服務ID”、“聯(lián)機服務名稱”、“對應交易服務名稱”。如果定位在文檔數(shù)據(jù)的第二格式信息:1.1章節(jié)下沒有找到表格或者表格包含的列數(shù)與配置信息要求的標準格式不一致,則文檔數(shù)據(jù)的第二格式信息與所述第一格式信息不一致。反之,如果定位在文檔數(shù)據(jù)的第二格式信息:1.1章節(jié)下存在有表格或者表格包含的列數(shù)與配置信息要求的標準格式一致,則文檔數(shù)據(jù)的第二格式信息與所述第一格式信息一致。
可選地,根據(jù)導入配置信息中的關(guān)鍵詞對待轉(zhuǎn)換文檔進行定位,通過是否定位成功判斷第二格式信息與導入配置信息中的第一格式信息是否一致。
根據(jù)導入配置信息中的關(guān)鍵詞對待轉(zhuǎn)換文檔進行定位,若定位成功,說明待轉(zhuǎn)換文檔的格式與導入配置信息中的格式一致,如果定位失敗說明待轉(zhuǎn)換文檔的格式與配置信息中的標準格式不一致。
具體地,根據(jù)配置信息中的關(guān)鍵詞對待轉(zhuǎn)換文檔進行定位,如果定位成功,則讀取定位的文檔數(shù)據(jù),并判斷讀取的文檔數(shù)據(jù)格式信息是否與導入配置信息中的第一格式信息一致。
在讀取文檔數(shù)據(jù)時,包括讀取WORD文檔的章節(jié)標題信息、標題下正文內(nèi)容、章節(jié)下表格信息、讀取WORD文檔中嵌入EXCEL文件等信息。
可選地,檢測所述待轉(zhuǎn)換文檔數(shù)據(jù)的第二格式信息與所述第一格式信息是否一致具體還包括:檢測所述待轉(zhuǎn)換文檔是否包括不可為空的數(shù)據(jù)或者所 述不可為空的數(shù)據(jù)是否填寫,輸入數(shù)據(jù)是否在規(guī)定的范圍內(nèi),不可重復的內(nèi)容是否存在重復。
具體地,由于結(jié)構(gòu)化的模型對數(shù)據(jù)有嚴格的要求,不符合要求的數(shù)據(jù)源將無法進行轉(zhuǎn)換。內(nèi)容檢測包括不可為空的數(shù)據(jù)是否已經(jīng)填寫、輸入數(shù)據(jù)是否在規(guī)定的取值范圍內(nèi)、不可重復的內(nèi)容是否存在重復等。例如:結(jié)構(gòu)化的模型中對于用戶這個定義,其中“聯(lián)機服務ID”不可為空、不可重復。檢測文檔數(shù)據(jù)的“聯(lián)機服務ID”是否為空或者是否已被填寫,或者是否重復。
步驟103,當檢測到所述第二格式信息與所述第一格式信息不一致時,將所述第二格式信息的錯誤信息及其在待轉(zhuǎn)換文檔中的具體位置寫入錯誤日志。
例如:如果文檔數(shù)據(jù)在1.1章節(jié)下面的表格中沒有填寫“聯(lián)機服務ID”或者填寫的內(nèi)容存在重復,數(shù)據(jù)將無法轉(zhuǎn)換到結(jié)構(gòu)化的模型中,此時會將這些錯誤信息以及錯誤位置信息寫入錯誤日志,用戶可根據(jù)提示的錯誤信息修改文檔數(shù)據(jù)直到通過檢測。
可選地,當檢測到所述第二格式信息與所述第一格式信息不一致時,將所述第二格式信息的錯誤信息及其在待轉(zhuǎn)換文檔中的具體位置寫入錯誤日志,將所述錯誤日志發(fā)送給用戶。
步驟104,當檢測到所述第二格式信息與所述第一格式信息一致時,對所述中間文件進行格式處理和拆分處理,并轉(zhuǎn)換成與所述模型定義對應的CSV文件。
將中間文件進行格式處理包括對文檔數(shù)據(jù)進行冗余數(shù)據(jù)刪除、排序、合并等將數(shù)據(jù)格式化處理,將格式化處理后的數(shù)據(jù)按模型定義為單位拆分,再轉(zhuǎn)換成與所述模型定義對應的CSV(Comma-Separated Values,簡稱CSV,中文:逗號分隔值)文件。
利用設(shè)置文檔格式標準,可以將相同格式文檔批量進行轉(zhuǎn)換,從而避免手工對每一個文檔進行轉(zhuǎn)換的工作量,提高了轉(zhuǎn)換的效率。
步驟105,將所述CSV文件導入結(jié)構(gòu)化模型數(shù)據(jù)庫。
從以標準格式文檔作為交付件到以結(jié)構(gòu)化模型作為交付件的轉(zhuǎn)變過程中,建模工具提供了接口從結(jié)構(gòu)化的模型中抽取數(shù)據(jù),開發(fā)導出工具可以實現(xiàn)批量生成標準格式的文檔和用戶所需的管理報告。
可選地,圖2是本申請實施例提供的結(jié)構(gòu)化模型數(shù)據(jù)生成報表文件或設(shè)計文檔的處理流程圖200。參見圖2,本申請實施例還包括:
步驟201,抽象并定義從所述結(jié)構(gòu)化模型中抽取數(shù)據(jù)的常見取數(shù)邏輯類型。
步驟202,設(shè)置導出配置表信息,所述導出配置表信息包括:待生成報表適用的取數(shù)邏輯,報表的表頭,報表各要素對應的模型定義及屬性,報表的輸入項以及輸出項,或者是待生成設(shè)計文檔的模板。
步驟203,讀取并解析導出配置表信息,確定在所述模型數(shù)據(jù)中的取數(shù)范圍和取數(shù)邏輯。
步驟204,根據(jù)所述取數(shù)范圍和取數(shù)邏輯,讀取相應的模型定義、圖和符號,生成報表或標準的設(shè)計文檔。
具體地,對于生成報表,配置表信息采用表格文檔的格式保存,根據(jù)建模工具提供的接口的取數(shù)方式不同,將報表初步分類,分別記入不同取數(shù)方式對應的工作簿。例如:報表需要從模型定義“系統(tǒng)用例”中取得包含的模型定義“交易服務”,屬于從當前定義取該定義引用的定義,這屬于其中一種取數(shù)方式。配置表中將所有建模工具提供的取數(shù)方式都設(shè)置了相應的工作簿。打開建模工具連接結(jié)構(gòu)化模型對應的數(shù)據(jù)庫,若連接失敗,如果用戶請求生成報表時,建模工具打開失敗或數(shù)據(jù)庫連接失敗,將提示錯誤信息,終止當前操作。若連接成功,需要生成報表時,用戶發(fā)出請求,選擇生成報表的范圍。讀取并解析導出配置表信息,根據(jù)讀取到的導出配置表信息,確定在模型中取數(shù)范圍與取數(shù)邏輯。利用建模工具中提供讀取接口中所包括的類型,例如,取得當前模型定義,取得當前模型定義下所有屬性等,收集接口 所提供的類型進行分類編碼。根據(jù)導出配置表信息記錄報表所需信息,判斷取數(shù)屬邏輯屬于哪個分支,確定取數(shù)的范圍和邏輯。根據(jù)解析出來的取數(shù)范圍與取數(shù)邏輯,用建模工具提供接口讀取模型數(shù)據(jù),并將讀取的模型數(shù)據(jù)封裝;根據(jù)取數(shù)范圍和取數(shù)邏輯,讀取模型數(shù)據(jù)的模型定義、圖和符號,并寫入指定的報表文件。
通過設(shè)置導出配置表,以及對配置表信息的讀取與解析,得到報表在結(jié)構(gòu)化模型中的取數(shù)邏輯和范圍,利用建模工具提供的接口讀取報表所需數(shù)據(jù),避免了每新增一個報表都需要進行程序開發(fā),大大減少了開發(fā)的工作量。
圖3為本申請另一種實施例提供的數(shù)據(jù)處理的方法流程圖300。該實施例的執(zhí)行主體可以是服務器,所述數(shù)據(jù)處理的方法具體包括以下步驟:
步驟301,讀取導入配置信息,抽取待轉(zhuǎn)換文檔的數(shù)據(jù),形成中間文件,所述導入配置信息包括第一格式信息和所述待轉(zhuǎn)換文檔的數(shù)據(jù)與模型數(shù)據(jù)的映射關(guān)系。
步驟302,檢測所述待轉(zhuǎn)換文檔的第二格式信息與所述第一格式信息是否一致。
步驟303,檢測所述待轉(zhuǎn)換文檔是否包括不可為空的數(shù)據(jù)或者所述不可為空的數(shù)據(jù)是否填寫,輸入數(shù)據(jù)是否在規(guī)定的范圍內(nèi),不可重復的內(nèi)容是否存在重復。
步驟304,當檢測到所述第二格式信息與所述第一格式信息不一致時,將所述第二格式信息的錯誤信息及其在待轉(zhuǎn)換文檔中的具體位置寫入錯誤日志,用以幫助用戶修正文檔。
步驟305,當檢測到所述第二格式信息與所述第一格式信息一致時,對所述中間文件進行格式處理和拆分處理,并轉(zhuǎn)換成與所述模型定義對應的CSV文件。
步驟306,將所述CSV文件導入結(jié)構(gòu)化模型數(shù)據(jù)庫。
步驟307,抽象并定義從所述結(jié)構(gòu)化模型中抽取數(shù)據(jù)的常見取數(shù)邏輯類 型。
步驟308,設(shè)置導出配置表信息,所述導出配置表信息包括:待生成報表適用的取數(shù)邏輯,報表的表頭,報表各要素對應的模型定義及屬性,報表的輸入項以及輸出項,或者是待生成設(shè)計文檔的模板。
所述導出配置表信息包括:待生成報表適用的取數(shù)邏輯,報表的表頭,報表各要素對應的模型定義及屬性,報表的輸入項以及輸出項,或者是待生成設(shè)計文檔的模板;
步驟309,讀取并解析導出配置表信息,確定在所述模型數(shù)據(jù)中的取數(shù)范圍和取數(shù)邏輯。
步驟310,根據(jù)所述取數(shù)范圍和取數(shù)邏輯,讀取相應的模型定義、圖和符號,生成報表或標準的設(shè)計文檔。
進一步參考圖3,作為對上述各圖所示方法的實現(xiàn),與上述提供的數(shù)據(jù)處理方法相對應,本申請實施例還提供了一種裝置。
所述裝置包括:抽取單元401,用于抽取待轉(zhuǎn)換文檔的數(shù)據(jù)4011和導入配置信息,形成中間文件,所述導入配置信息包括第一格式信息和所述待轉(zhuǎn)換文檔的數(shù)據(jù)與模型數(shù)據(jù)的映射關(guān)系;檢測單元402,用于檢測所述待轉(zhuǎn)換文檔的第二格式信息與所述第一格式信息是否一致;若不一致,則將所述第二格式信息的錯誤信息及其在待轉(zhuǎn)換文檔中的具體位置寫入錯誤日志,若一致則執(zhí)行轉(zhuǎn)換單元403;轉(zhuǎn)換單元403,用于將所述中間文件進行格式處理和拆分處理,并轉(zhuǎn)換成與所述模型定義對應的CSV文件;導入單元404,用于將所述CSV文件導入結(jié)構(gòu)化模型數(shù)據(jù)庫。
可選地,該裝置是轉(zhuǎn)換裝置,所述轉(zhuǎn)換裝置包含兩個部分:第一部分包括用于將設(shè)計文檔4011轉(zhuǎn)換為模型所需的抽取單元、檢測單元、轉(zhuǎn)換單元和導入單元;第二部分包括用于將模型生成設(shè)計文檔或管理報表的配置單元、解析單元和生成單元。
可選地,所述裝置還包括:
定義單元405,用于抽象并定義從所述結(jié)構(gòu)化模型中抽取數(shù)據(jù)的常見取數(shù)邏輯類型;配置單元406,用于設(shè)置導出配置表信息,所述導出配置表信息包括:待生成報表適用的取數(shù)邏輯,報表的表頭,報表各要素對應的模型定義及屬性,報表的輸入項以及輸出項,或者是待生成設(shè)計文檔的模板;解析單元407,讀取并解析導出配置表信息,確定在所述模型數(shù)據(jù)中的取數(shù)范圍和取數(shù)邏輯;生成單元408,根據(jù)所述取數(shù)范圍和取數(shù)邏輯,讀取相應的模型定義、圖和符號,生成報表或標準的設(shè)計文檔。
可選地,所述檢測單元402具體用于:
根據(jù)所述導入配置信息中的關(guān)鍵詞對所述文檔數(shù)據(jù)進行定位,通過是否定位成功判斷所述第二格式信息與所述配置信息中的所述第一格式信息是否一致。
可選地,所述檢測單元402具體還用于:
檢測所述待轉(zhuǎn)換文檔是否包括不可為空的數(shù)據(jù)或者所述不可為空的數(shù)據(jù)是否填寫,輸入數(shù)據(jù)是否在規(guī)定的范圍內(nèi),不可重復的內(nèi)容是否存在重復。
可選地,所述檢測單元402具體還用于:
當檢測到所述第二格式信息與所述第一格式信息不一致時,將所述第二格式信息的錯誤信息及其在待轉(zhuǎn)換文檔中的具體位置寫入錯誤日志,將所述錯誤日志發(fā)送給用戶。
本發(fā)明實施例提供的數(shù)據(jù)處理方法及裝置,通過抽象從所述結(jié)構(gòu)化模型中抽取數(shù)據(jù)的常見取數(shù)邏輯,提供給用戶自行配置信息,不需要增加和修改代碼的情況下,通過調(diào)整配置表生成新的報表,簡化了報表的定制過程,提高了定制報表的效率。從標準格式文檔到結(jié)構(gòu)化模型數(shù)據(jù)的轉(zhuǎn)換,實現(xiàn)了標準文檔到模型化數(shù)據(jù)的批量導入。避免了文檔轉(zhuǎn)換中工作量大,轉(zhuǎn)換效率低,質(zhì)量難以保證的缺點,節(jié)省了人力和物力。其中,結(jié)構(gòu)化模型數(shù)據(jù)生成報表的過程,用戶可以通過設(shè)置配置表的方式實現(xiàn)新報表的定制,而不需要修改代碼,提高了新管理報表定制的效率。
專業(yè)人員應該還可以進一步意識到,結(jié)合本文中所公開的實施例描述的各示例的單元及算法步驟,能夠以電子硬件、計算機軟件或者二者的結(jié)合來實現(xiàn),為了清楚地說明硬件和軟件的可互換性,在上述說明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應用和設(shè)計約束條件。專業(yè)技術(shù)人員可以對每個特定的應用來使用不同方法來實現(xiàn)所描述的功能,但是這種實現(xiàn)不應認為超出本發(fā)明實施例的范圍。
結(jié)合本文中所公開的實施例描述的方法或算法的步驟可以用硬件、處理器執(zhí)行的軟件模塊,或者二者的結(jié)合來實施。軟件模塊可以置于隨機存儲器(RAM)、內(nèi)存、只讀存儲器(ROM)、電可編程ROM、電可擦除可編程ROM、寄存器、硬盤、可移動磁盤、CD-ROM、或技術(shù)領(lǐng)域內(nèi)所公知的任意其它形式的存儲介質(zhì)中。
以上所述的具體實施方式,對本發(fā)明實施例的、技術(shù)方案和有益效果進行了進一步詳細說明,所應理解的是,以上所述僅為本發(fā)明實施例的具體實施方式而已,并不用于限定本發(fā)明實施例的保護范圍,凡在本發(fā)明實施例的精神和原則之內(nèi),所做的任何修改、等同替換、改進等,均應包含在本發(fā)明實施例的保護范圍之內(nèi)。