發(fā)布時間:2023-03-21 17:09:54
序言:寫作是分享個人見解和探索未知領域的橋梁,我們?yōu)槟x了8篇的數(shù)據(jù)信息論文樣本,期待這些樣本能夠為您提供豐富的參考和啟發(fā),請盡情閱讀。

城市軌道交通信號系統(tǒng)的DCS網(wǎng)絡包含有線部分和無線部分。有線網(wǎng)絡部分是指軌旁設備之間的數(shù)據(jù)通信,為信號系統(tǒng)提供專用有線信息傳輸,為控制中心、車站、場段之間提供有線傳輸通道,建立局域網(wǎng)連接。無線部分主要是列車上的移動無線設備和地面軌旁無線單元之間建立的車地雙向通信。如上所述,在信號系統(tǒng)的DCS網(wǎng)絡中,可以根據(jù)不同的組網(wǎng)方式,構建不同的網(wǎng)絡結構,形成連接信號系統(tǒng)相關設備的通信網(wǎng)。而在這樣的網(wǎng)絡中,傳遞的信息就包含大量的管理信息、行車數(shù)據(jù)信息、ATS信息、維護信息、數(shù)據(jù)記錄信息等。DCS系統(tǒng)網(wǎng)絡連接設備一般連接方式需要說明的是DCS網(wǎng)絡結構是多樣的,隨著實際地鐵線路情況、所連接的設備情況、以及技術發(fā)展和應用情況有不同變化。從圖1中可以看出,信號系統(tǒng)DCS網(wǎng)絡具有連接設備類型多、數(shù)量大,信息傳輸種類繁多的特點。如果在DCS網(wǎng)絡中信息沒有合理的傳輸定義,使網(wǎng)絡中任何一個數(shù)據(jù)幀的傳輸都要遍及整個網(wǎng)絡,導致所有與網(wǎng)絡連接的設備都接收到,這樣就會嚴重的消耗掉網(wǎng)絡整體帶寬。因此,在DCS網(wǎng)絡傳輸信息量較大時(如早、晚運行高峰時等),如不對網(wǎng)絡進行合理設置,就可能產(chǎn)生網(wǎng)絡風暴。網(wǎng)絡風暴發(fā)生時,與網(wǎng)絡連接的部分設備也可能會由于無法應對網(wǎng)絡流量的大幅波動導致故障,進而引發(fā)故障面擴大的情況發(fā)生,對運營產(chǎn)生嚴重影響,這就需要對網(wǎng)絡中的信息傳輸進行合理優(yōu)化。
2VLAN技術特點及在DCS網(wǎng)絡中的應用
VLAN技術是將局域網(wǎng)設備從邏輯上劃分成一個個網(wǎng)段,從而實現(xiàn)虛擬工作組數(shù)據(jù)交換。由于VLAN設置是在交換機上按邏輯來劃分,而不是傳統(tǒng)上的只能從物理上劃分,因此VLAN技術的出現(xiàn),可以滿足根據(jù)實際應用情況,將同一物理局域網(wǎng)內不同用戶邏輯地劃分成不同的廣播域需求。在設計VLAN并實現(xiàn)應用時,首先要確定如何劃分VLAN。較為常見的VLAN劃分方式包括:按照端口劃分,按照MAC地址劃分、基于網(wǎng)絡層劃分、以及基于IP廣播和基于規(guī)則等方式。其中應用最為廣泛、也是最有效的,是按照端口劃分的方式,這種劃分方式是根據(jù)以太網(wǎng)交換機的交換端口來劃分的,將交換機上的物理端口分為若干個組,每個組構成一個虛擬網(wǎng)。由于基于端口劃分VLAN的優(yōu)點是定義VLAN成員非常簡單,只要在接入交換機上進行相關設置即可,操作相對簡單,適合任何大小的網(wǎng)絡。同時,這種配置方式適用于網(wǎng)絡環(huán)境比較固定的情況,與DCS網(wǎng)絡構建后即在運營中不會輕易改變的實際情況較為符合,因此在地鐵信號系統(tǒng)DCS網(wǎng)絡交換機的配置中,一般都可以使用按照端口劃分VLAN的配置方式。以赫斯曼交換機為例,按照端口劃分VLAN,為不同端口賦予不同ID后的界面顯示情況綜上所述,為了有效避免信號系統(tǒng)DCS網(wǎng)絡風暴的發(fā)生,可以將交換機端口劃分到不同VLAN中。其原理為:在不同端口發(fā)出的所有數(shù)據(jù)幀上增加一個代表所屬VLAN編號的ID,各個交換機端口只有在接收到所屬VLANID的信息時,才會對該信息進行拆分處理,而在收到標有其他VLANID信息時,只會將該信息按照目的地址進行轉發(fā)。這樣就實現(xiàn)了通過在DCS網(wǎng)絡交換機上應用VLAN技術,有效控制網(wǎng)絡流量、降低網(wǎng)絡風暴發(fā)生概率的目標。并且通過在交換機上進行VLAN的劃分,可以起到減少項目建設的設備投資成本、簡化DCS網(wǎng)絡管理、提高網(wǎng)絡安全性的作用。這里需要提出的是,有必要找到適合于信號DCS網(wǎng)絡的劃分原則,結合實際應用情況,將不同級別的信息進行合理區(qū)分。
3適用于DCS的VLAN劃分原則
由于地鐵信號系統(tǒng)DCS網(wǎng)絡具有連接設備數(shù)量、類型較多,信息傳輸種類繁多的特點,在按照端口劃分的VLAN配置方法對信號DCS網(wǎng)絡交換機等進行配置時,需要尋找到合適的原則,將信號系統(tǒng)DCS網(wǎng)絡中不同設備、不同信息類型進行全網(wǎng)的統(tǒng)一配置,既能有效避免網(wǎng)絡風暴,又有利于維護人員進行維修檢查。這就需要根據(jù)網(wǎng)絡端口是否有用、該端口在網(wǎng)絡中的作用、所傳輸?shù)男畔热莺吞攸c等特征,將網(wǎng)絡端口有序劃分。例如,在網(wǎng)絡的列車自動控制(ATC)信息、列車自動監(jiān)控(ATS)信息、維護管理信息等帶有不同功能及目地的信息,劃分到不同的VLAN中。在信息有效傳輸?shù)耐瑫r,也可以提高網(wǎng)絡的安全性能。建議按照以下原則進行層層劃分。
1)由于信號系統(tǒng)涉及列車行車安全,因此可先將交換機上多余端口統(tǒng)一劃入“無用端口”的VLAN中,這樣即使有其他設備接入到該端口上,也不會對有用端口間的網(wǎng)絡通信造成影響。
2)進一步將有用端口進行分類,如該端口在信號DCS網(wǎng)絡中只做收發(fā),不對信息進行拆分和處理,即可將其劃入“管理類”的VLAN中。
3)在DCS網(wǎng)絡中,與“管理類”信息對應的是“業(yè)務類”信息,在此類信息中,建議先將涉及到列車控制安全的ATC信息獨立劃分出來,同時由于此類信息較為重要,需設計兩路,可以劃分至兩個不同的VLAN中。
4)另外,“業(yè)務類”信息還包含其他非ATC信息,也就是非安全信息。對這類信息的劃分,首先將其中的ATS信息獨立劃分出來,同樣建議為兩路。
5)同時,非安全類的信息也包含維護管理類信息,如維護支持、電源監(jiān)控類等信息也需要劃分到單獨一個VLAN中,此類信息可以不進行冗余設置。
6)其他非安全類信息也可以通過實際情況進行VLAN設置,可以獨立VLAN,也可統(tǒng)一劃入一個VLAN,根據(jù)實際情況進行設置即可。建議的VLAN劃分原則,以及該原則對應在信號系統(tǒng)中的傳輸內容示意。
4總結
關鍵詞:信息技術教育。
信息技術教育的主要目的是讓學生在了解計算機文化、初步掌握一些計算機基本知識和技能的同時,進一步激發(fā)學生的學習興趣、增強信息意識和創(chuàng)新意識、有效培養(yǎng)學生對信息的收集、處理、應用和傳輸?shù)哪芰Γ囵B(yǎng)學生的自學能力和創(chuàng)造能力,在開發(fā)智力、實現(xiàn)學生信息素質和創(chuàng)造素質的教育。教學中要時刻注意信息技術教學不僅僅是傳授計算機的基礎知識,更不能像社會上片面追?quot;學而致用"的職業(yè)培訓,而應把計算機作為一種現(xiàn)代化工具,來提高學生的綜合素質,培養(yǎng)他們用信息技術手段來解決問題的各種能力。
那么,怎樣才能做好信息技術課的教學呢?信息技術教學可分為三層臺階:一、理論課教學,二、上機課教學,三、課外實踐。所謂理論課教學主要內容是課程的引入、基本知識與基本技能;上機課教學主要內容是讓學生在鞏固性練習中,掌握知識,形成技能;課外實踐主要內容是教會學生如何將信息技術應用到實際中去。理論課教學是前提,上機課教學是手段,課外實踐教學是根本。下面結合自己的教學實際,談談如何踏好這三層"臺階"。
一、理論課教學
1、上好第一節(jié)信息技術課。
俗話說:良好的開端是成功的一半。教師為學生上的第一節(jié)信息技術課要結合典型事例(最好輔以相應的多媒體演示)使學生對計算機的發(fā)展、應用有一個比較系統(tǒng)、全面的了解,并從中感悟到學習信息技術的重要性,激發(fā)出學習的欲望,明確學習任務。在此基礎上,要讓學生明白:為了最大限度地利用有限課時,一方面教師對學習內容和學習目標要做精心的設計和安排;另一方面,還需要他們怎樣的密切配合等等,讓學生有一個必要的心理準備,為今后的學習,尤其是上機課能充分利用好45分鐘開個好頭。
2、課堂教學應以能力的培養(yǎng)為主。
對于新的課程內容,只要學生能自學弄明白的問題,教師就不要用講授的方式進行教學。教師可以設計出層次分明的思考題,引導學生認真閱讀教材,用"自己學得"的知識解決"實際問題",并提供讓學生"各抒已見"的機會。最后教師再通過課堂小結使教學內容系統(tǒng)化、完整化。而對于新技術、新名詞的教學,則要鼓勵學生大膽的設想與追蹤。從而培養(yǎng)學生的自習能力、綜合能力、創(chuàng)新能力。
3、利用多媒體教學手段,提高教學效率。
多媒體教學構建了新型的教學模式,能給學生創(chuàng)設一個良好的認知環(huán)境,可以加深學生的識記成效,培養(yǎng)和發(fā)展學生的思維能力、觀察能力、想象能力和創(chuàng)造能力。因此,信息技術學科教師要能熟練運用多媒體教學手段,使自己的課堂教學內容豐富而不繁雜,教學過程緊張但不忙亂,自身的教學效率與計算機的高效性和諧一致,使學生親身感受信息技術給人類帶來的全新變化。
4、理論課教學課時應遠小于上機課。
信息技術是一門基礎工具課程,是用來處理其它事務的手段,因此培養(yǎng)信息技術基本技能是該課程的主要任務。所以傳統(tǒng)的課堂授課形式在信息技術教學中只適合完成像基礎知識、語言算法、小結討論等內容的教學。上機課才是學生通過動手來領會、鞏固和運用知識的最有效的手段,是培養(yǎng)技能的基本途徑。
二、上機課教學
充分、有效的利用好學?,F(xiàn)有的計算機設備是信息技術教學的關鍵,因此教育部已擬定,上機課時應占信息技術課教學的70%以上。
1、有關操作的教學內容應當安排在機房進行。
信息技術課是一門實踐性很強的課,因此有關操作性比較強的教學內容(如:Windows98的操作、Word的操作)應安排在機房進行。對配有多媒體教學網(wǎng)或大屏幕投影機的現(xiàn)代化機房,能使教師有更多的機會營造有利于學生"主動發(fā)展"的空間。對暫不具備以上條件的機房,也應常備一臺投影儀,教師要精心設計制作投影片以期最大限度地滿足高效率教學的需要。
2、采用任務驅動的教學方法,培養(yǎng)學生自學能力。
在上機課之前,要向學生提出本節(jié)課學習的要求、明確學習任務,解決好為什么學的問題。學生通過自己閱讀教材,提出問題,并引導學生進行驗證操作,使學生在自己不斷的解決問題當中體驗成功的快樂,可增強學生的自信,并逐漸養(yǎng)成求知探索的習慣。此后結合教學大綱要求,提出每一個學習階段的學習任務??赡軐W習任務明確化、通俗化、具體化。同時注意將任務簡化,同時將學生任務簡化為基礎與技巧兩部分,便于讓學生抓住重點,保持良好的學習情緒。比如:將Word使用分為基礎部分(常用菜單、常用與格式工具欄使用等)與技巧部分(專用工具欄、復雜選項、復雜格式等),基礎部分內容嚴整量少,便于教學,務必嚴格把關,確保每位學生都學會,技巧部分注意方法教學,不必一一細講,要引導學生學會摸索學習。也要注意將任務分層,對不同程度的學生提出相應難易的任務,因材施教。
3、讓學生在鞏固性練習中,進行知識的整合創(chuàng)造。
創(chuàng)造素質教育的一大特點就是跨學科。傳統(tǒng)的學科教育往往強調了線性思維,而忽視了發(fā)散思維,這樣是很難培養(yǎng)出具有創(chuàng)造素質的人才的。計算機的工具性,為以學生為主體的跨學科教育提供了極大的便利條件,教師應讓學生在鞏固性練習中,多進行知識的整合創(chuàng)造。如用"畫筆"進行美術創(chuàng)作,用Word設計賀卡、辦報,用Music作曲、用Excel分析班級成績,用Internet進行信息交流等。這種學以致用的教學方法既有利于完成信息技術課程的教學任務,又有利于開發(fā)學生智力、促進學生主動發(fā)展,使信息素質和創(chuàng)造素質的教育落到實處。
4、上好程序設計課,培養(yǎng)學生創(chuàng)造力。
學生用所學語句自己組合成程序,用來解決某些問題:畫圖、奏曲、解趣味數(shù)學題、進行成績分析等等。這個過程對學生而言就是創(chuàng)造,它對學生的思維能力、解決問題的能力、規(guī)劃能力和創(chuàng)造能力的培養(yǎng)是其它課程不能替代的,是性能價格比非常好的培養(yǎng)學生創(chuàng)造力的有效手段和途徑。
三、課外實踐課
"用計算機處理信息是二十一世紀的公民應具有的基本技能之一"已成為人類的共識。因此,在中小學信息技術學習中會涌現(xiàn)出許多學生計算機愛好者,這些學生不滿足課堂所學的知識,對計算機的許多專業(yè)知識和應用技術(尤其是電子游戲)表現(xiàn)出濃厚的興趣。學校、教師、家庭應通過有組織、有計劃的課外實踐活動對這些學生的愛好給予保護、培養(yǎng)和正確引導,以保證學生在全面發(fā)展的基礎上學有所長,學有所用。
課外實踐作為課堂教學的拓展和延伸,可分程序設計和應用技術兩大類進行輔導。
1、程序設計小組
中小學各個階段的程序設計課外實踐應與青少年信息學奧林匹克競賽相結合。由于此類競賽對學生綜合素質要求很高,只有心理素質好、文化課成績優(yōu)異、熟練掌握一種計算機高級語言的學生才有可能在較高級的比賽中取得好成績。因此在課余可組織程序設計興趣小組。如Pascal語言的程序設計,通過學習使學生掌握分析問題、解決問題的方法。為國家計算機高級人才的早期培養(yǎng)盡基礎教育的責任。
2、應用技術小組
在應用技術的課外實踐中可把計算機當作信息處理的工具,讓學生在整合各科所學文化知識的基礎上進行豐富多彩的創(chuàng)作和信息交流活動。如用Frontpage自制網(wǎng)頁;用Word設計公益廣告、賀卡;用"畫筆"或Photoshop創(chuàng)作美術作品、電子相冊;用Authorware制作課件;普曲或合成音樂;通過Internet進行信息傳遞、資料查詢等等,這些活動打破了學科界限,使學生在輕松愉快地學到、鞏固了相關學科的知識和技能的同時,有效提高了應用已有知識進行創(chuàng)造和規(guī)劃的能力,深受學生喜愛。由于指導這些活動對教師的綜合素質要求較高,所以這樣做也有利于促進教師不斷提高業(yè)務水平和綜合素質。
總之,信息技術教育應以培養(yǎng)學生的信息素養(yǎng)和實踐能力為主要教學目標,信息素養(yǎng)是信息技術教育的主要教學中心,信息技術教育必須圍繞這個中心開展相應的教學活動,使學生的信息素養(yǎng)成為與讀、寫、算一樣重要的的終身有用的基礎能力,同時,信息技術教育必須兼顧學生的全面發(fā)展和多種能力的培養(yǎng),注重學生的精神、道德、文化和社會等多個方面的發(fā)展,培養(yǎng)學生的批判性思維、創(chuàng)造性思維和問題解決能力,因此,信息技術教育是以培養(yǎng)學生的信息素養(yǎng)為核心,面向學生全面發(fā)展的課程。
〖參考文獻〗
《中國電腦教育報》。
關鍵詞:單片機電話主叫信息識別FSK數(shù)據(jù)通信
電話主叫識別信息發(fā)送及接收(俗稱來電顯示),簡稱CID(CallingIdentifyDelivery),是電信局向被叫電話用戶提供的一種服務項目,是指在被叫用戶終端設備上顯示主叫電話號碼、主叫用戶姓名、呼叫日期和時間等主叫識別信息并進行存儲,以供用戶查閱的服務項目。被叫用戶根據(jù)顯示的主叫識別信息而決定是否接聽電話,可以避開一些不愿接聽或不友好的電話。利用這個功能可以進行FSK信息解碼的電話網(wǎng)數(shù)據(jù)通信,應用于實際生活中。
1電話主叫識別原理和傳送協(xié)議
實現(xiàn)電話主叫信息識別業(yè)務的基本方法是,發(fā)端程序交換機將主叫電話號碼等信息通過局間指令系統(tǒng)傳磅給終端交換機,終端交換機再將主叫識別信息以移頻鍵控FSK(Frequency-ShiftKeying)或雙音多頻DTMF(DualToneMulti-Frequency)方式,在第一次振鈴或第二次振鈴間隔期前傳送給被叫用戶終端設備。我國的通信行業(yè)標準明確規(guī)定,統(tǒng)一采用FSK方式提供主叫電話來顯示服務。在一次呼叫中,若被叫用戶申請了CID業(yè)務,則電信局的終端交換機就會向該被叫用戶傳送主叫識別信息數(shù)據(jù)。傳送流程與時序如圖1所示。
其中A、B、C、D、E為數(shù)據(jù)傳送時的狀態(tài)持續(xù)時間,各段時間值如表1所列。在數(shù)據(jù)傳送前或傳送過程中,如果用戶摘機,則傳送停止,但呼叫處理正常進行。
表1CID信號傳送各段時間值
符號時間值說明
tA1s第一次鈴流信號
tB0.5s<tB<1.5s第一次振鈴結束與數(shù)據(jù)傳送開始之間的時間間隔
tC≤2.9s傳送數(shù)據(jù)的時間,包括信道占用信號和標志信號
tD≥200ms數(shù)據(jù)傳送結束與第二次振鈴開始的時間間隔
tE1s第二次鈴流信號
tB+C+D≤3.6s各時段可根據(jù)具體情況確定
2主叫識別信息數(shù)據(jù)格式
FSK主叫識別信息數(shù)據(jù)的傳輸格式有兩種:單數(shù)據(jù)消息格式SDMF(SingleDataMessageFormat)和復合數(shù)據(jù)消息格式MDMF(MultipleDataMessageFormat)。前者的結構簡單,可容納的信息內容較少,如主叫號碼、日期和時間;后者的結構比較復雜,可容納的信息長度較長,除單數(shù)據(jù)格式內容以外還可以主叫用戶的姓名等。本文主要介紹FSK主叫信息數(shù)據(jù)格式的接收。
單數(shù)據(jù)消息格式由消息頭和消息體組合,消息頭由消息類型和消息長度組成,它們均為8位字。消息類型的值來識別消息的特征;消息長度指明后面所跟消息字的長度。消息體包括交換機需傳給終端用戶的消息。消息體可容納1~255個8位的消息字。每個字用8位帶校驗位的7位ASCII編碼字符集表示。
一個完事的消息幀由信道占用信號、標志信號、數(shù)據(jù)信息和校驗字組成。信道占用信號和標志信號用來提示電話終端準備接收數(shù)據(jù);校驗字用來作差錯檢查,如圖2所示。
①信道占用信號。這是發(fā)送主叫信息時要首先發(fā)出的頭標志,由一組300個連續(xù)的“0”和“1”交替地組成。其第一個位為“0”,最后一個位為“1”。在通話狀態(tài)下,此信號不發(fā)送。
②標志信號。在掛機狀態(tài)下,程控交換機向用戶發(fā)送主叫信息時要先發(fā)送的第二個標志信號,由180個標志位(邏輯“1”)組成。在通話狀態(tài)下,此信號不發(fā)送。
③標志位。程控交換機根據(jù)線路使用情況隨機插入的標志位,由0~10個邏輯“1”組成。
④數(shù)據(jù)字。主叫信息,每個數(shù)據(jù)字之前先行一次“0”作起始位,在最后加一位“1”作結束位,每個數(shù)字的最低位先發(fā)送。這樣,實際每個字為10位,即1PXXXXXXX0,其中P為奇偶校驗位。
電話主叫信息數(shù)據(jù)傳送時,信道占用信號首先發(fā)送,后接標志信號,最后連續(xù)發(fā)送數(shù)據(jù)字。根據(jù)數(shù)據(jù)傳送情況,間隔地插入一些標志位。一般標志位會加在如下字的傳送之間:
a.消息類型字與消息長度之間;
b.消息長度字與第一個參考數(shù)字或消息字之間;
c.參數(shù)類型字與相應的參數(shù)長度字之間;
d.參考長度字與第一個參考字之間;
e.最后一個參數(shù)字與下一個參數(shù)類型字之間;
f.最后一個參考字或消息字與校驗字之間。
單數(shù)據(jù)消息格式數(shù)據(jù)傳送按消息類型(04H)、消息長度、消息字、月、日、時、分、主叫號碼(或“O”或“P”)的順序排列組成消息進行傳送。所有的消息字和參數(shù)字都有奇數(shù)偶校驗位,采用奇偶校驗的方式傳送。
3電話FSK信息通信電路設計
本文以FSK信息解調器SM8220P芯片與單片機及外電路接口為例,介紹FSK信息的通信接收方法。SM8220P解調器是日本NPC公司生產(chǎn)的雙列直插、低功耗CMOS集成電路FSK解調芯片,其解調器的引腳功能如表2所列。
表2SM8220P引腳功能
符號引腳功能
TIP-RING1,2電話信號輸入端。信號輸入必須隔直流
AGND3模擬地,要通過一個電容接地
RDIN4振鈴檢測輸入。要把振鈴信號經(jīng)衰減后連接到此引腳
RDRC5振鈴檢測RC延時電路,低電平有效
RDET6振鈴檢測輸出,內部接施密特觸發(fā)電路。當為低電平時,表明檢測到振鈴信號輸入;不用時應接地
PWDN7掉電控制,平時應保持為低電平。若為高電平,進入掉電工作模式,COSCOUT、CDET和DOUT自動被設置成高電平,AGND、FOUT被設置成高阻抗狀態(tài)
GND8器件地
OSCIN/CLKIN9振蕩放大器輸入,外部振蕩放入器信號經(jīng)此引腳輸入
OSCOUT10振蕩放大器輸出,使用外部振蕩信號時必須開路
CDET11載波檢測輸出端,低電平有效。為低電平時,表明此時有FSK載波信號輸入
NC12空腳
DOUT13數(shù)據(jù)輸出,平時為高電平。當CDET=0時,表明此時電話經(jīng)上有一個有效的FSK信號輸入,經(jīng)解調后由該腳輸出
DMIN14解調器輸入端
FOUT15FSK帶通濾波器輸出端,通過一個電容耦合連接到DMIN
VDD16電源正極(3~5.5V)
SM8220P遵循Bell202和ITU-TV.23協(xié)議標準,以連續(xù)二進制脈沖頻移鍵控信號的方式傳輸,傳輸速率為1200bps。支持FSK號碼顯示和姓名顯示等多種功能;芯片內部包含電源掉電檢測電路、振鈴檢測電路和載波檢測電路;信號輸入檢測靈敏度高,電源工作電壓較寬(3~5.5V),是進行電話FSK信息解碼通信的較好的集成芯片。
為實現(xiàn)電話FSK信息的接收,采用P87LPC764單片機控制SM8220P電路,以完成電話FSK信息解碼通信的工作。電話FK信息通信具體電路如圖3所示。
從圖3中可知,對于從電話線上傳輸來的FSK信號,信號傳送在第一次振鈴和第二次振鈴之間。振鈴信號經(jīng)過整流、分壓,加到TIL113光電耦合器件的發(fā)射管上,使發(fā)射管有電流通過而發(fā)光,照射到光敏三極管的基極,臻使光敏三極管飽和導通。在R6上得到大于1V的脈沖信號,輸入到單片機外部中斷0,喚醒單片機準備接收。0.5s后FSK信號經(jīng)過C3、C4、R1、C2的隔直和衰減,輸入到FSK接收器SM8220P的差分輸入端TIP和RING腳,將FSK信號讀取解調后從DOUT腳輸出ASCII碼的串行序列,由P87LPC764單片機接收處理,提取出相應的電話FSK信息,發(fā)到多功能LED顯示模塊MAX7219驅動數(shù)碼顯示和24C64保存。
4FSK信息接收通信軟件設計
單片機對SM8220P輸出的ASCII碼串行序列的識別過程,由接收和數(shù)據(jù)整合兩部分組成。由于FSK信號波特率為1200bps,每發(fā)1位的時間是833us,因此,可以設定定時器每833us接收1位,每10位提取出1個數(shù)字。如此反復循環(huán),直到接收完全FSK信息。當有電話來時,在第一聲振鈴后,單片機開始準備檢測接收信號,SM8220P開始接收300個由0、1組成的頻率為1200Hz的信道占用信號和180個“1”標志信號,緊接著接收主叫號碼和時間。每收到1個數(shù)字,SM8220P都把它變換成10位(1PXXXXXXXX0)的串行序列,由13腳輸出傳送給P87LPC764單片機,P87LPC764經(jīng)過精確的定時編程將其檢測整合出相應的FSK號碼、時間等數(shù)據(jù),完成FSK信息解碼、接收通信、接收到的電話號碼可以保存在24C64串行E2PROM中,也可以輸出到LCD上顯示。SM8220P的11腳用來提示電話線上是否有新的FSK信息的輸入。若有新的FSK信息輸入,此引腳將產(chǎn)生低電平。單片機接收FSK主叫信息可以采用定時中斷方式,也可以采用延時查詢的辦法進行。電話FSK信息接收通信程序流程如圖4所示。
網(wǎng)絡信息資源是指計算機或信息終端等以通信為手段通過網(wǎng)絡再現(xiàn)出來的集聲音、文字、圖像于一體的各類信息資源的總和,其實質是電子出版的高級形式,大數(shù)據(jù)的到來構成了網(wǎng)絡信息資源的多個來源,特征如表2所示。由于我國網(wǎng)絡信息資源建設相對較晚,雖著手進行資源調優(yōu),但在挖掘有效的網(wǎng)絡信息方面,還存在著諸多問題,如:數(shù)據(jù)結構的處理不健全、缺乏深層挖掘研究、度量模型的不健全或缺失等。
2相關概念
本節(jié)以“文獻”為例,介紹大數(shù)據(jù)時代下網(wǎng)絡信息資源所呈現(xiàn)的社團模式及其概念。定義1.文獻網(wǎng)絡信息資源(LNIR)LNIR=<ArtID,ArtN,AutN[],Abst,Keys[],Clc,Doc>,其中,ArtID是文獻編號,具有唯一值;ArtN是文獻名字;AutN[]是文獻作者及其相關信息,可具有多個值;Abst為文獻摘要;Keys[]為文獻關鍵詞,可具有多個值;Clc為文獻的中圖分類號;Doc為文獻的標識碼。定義2.作者社團(LNIRAS)設LNIRi與LNIRj組成一個作者社團當且僅當(LNIRi.ArtID≠LNIRj.ArtID)∩(LNIRi.AutN[]∩LNIRj.AutN[]≠NULL)。定義3.關鍵詞社團(LNIRK)設LNIRi與LNIRj組成一個關鍵詞社團當且僅當(LNIRi.ArtID≠LNIRj.ArtID)∩(LNIRi.Keys[]∩LNIRj.Keys≠NULL)。定義4.主題社團(LNIRAN)設LNIRi與LNIRj組成一個主題社團當且僅當(LNIRi.ArtID≠LNIRj.ArtID)∩(Compare(LNIRi.ArtN.getString(),LNIRj.ArtN.getString())≠NULL)。定義5.分類號社團(LNIRCL)設LNIRi與LNIRj組成一個分類號社團當且僅當(LNIRi.ArtID≠LNIRj.ArtID)∩(LNIRi.Clc.trimNums()=LNIRj.Clc.trimNums())。
3網(wǎng)絡信息資源社團及模型
由于大數(shù)據(jù)時代網(wǎng)絡信息資源的急劇暴增,使得網(wǎng)絡信息資源的價值密度備受關注。將網(wǎng)絡信息資源分類整理,不僅信息量過于龐大,而且由于學科之間的交織或科研需要,各個分類之間也是緊密聯(lián)系的。現(xiàn)本文就文獻網(wǎng)絡信息資源所形成的模型做簡要介紹。假設有5篇文獻,根據(jù)定義1,設這5篇文獻如圖1所示;可分別形成作者社團(見定義2)、關鍵詞社團(見定義3)、主題社團(見定義4)、分類號社團(見定義5)。本節(jié)列舉作者社團與關鍵詞社團,其中,設作者社團的度為1,即可以形成以1個或以上的作者為中心的社團;設關鍵詞的社團為2,即可以形成2個或以上的關鍵詞為中心的社團。圖2列舉了圖1中A1、A2、k1、k2、k3形成的社團如圖2所示。由圖1可得,作者社團有:LNIRAS(A1,A2)={LNIR1,LNIR4};LNIRAS(A1)={LNIR1,LNIR2,LNIR4};LNIRAS(A2)={LNIR1,LNIR3,LNIR4,LNIR5};關鍵詞社團有:LNIRK(k1,k2,k3)={LNIR1};LNIRK(k1,k2)={LNIR1};LNIRK(k2,k3)={LNIR1,LNIR5};LNIRK(k1,k3)={LNIR1,LNIR3}。由此可以清晰得看出各個網(wǎng)絡資源及其之間的關系,為海量數(shù)據(jù)的挖掘提供了便利。
4結語
近年來,隨著互聯(lián)網(wǎng)技術的發(fā)展,大數(shù)據(jù)越來越受到關注,其應用逐步滲透至多個行業(yè),開啟了全新的數(shù)據(jù)時代。數(shù)據(jù)是征信業(yè)務開展的基礎資料,征信活動主要是圍繞數(shù)據(jù)進行采集、整理、保存、加工,并最終向信息使用者提供。大數(shù)據(jù)不僅為征信業(yè)發(fā)展提供了極為豐富的數(shù)據(jù)信息資源,也改變了征信產(chǎn)品設計和生產(chǎn)理念,成為了未來征信業(yè)發(fā)展最重要的基石。我國征信業(yè)發(fā)展尚處于起步階段,在大數(shù)據(jù)時代存在征信法律制度和業(yè)務規(guī)則不夠完善、征信機構數(shù)據(jù)處理能力有待提高等問題。未來征信業(yè)面臨的機遇和挑戰(zhàn)并存,研究大數(shù)據(jù)時代征信業(yè)的發(fā)展具有重要意義。
大數(shù)據(jù)時代征信業(yè)面臨的機遇和挑戰(zhàn)
目前,對大數(shù)據(jù)無公認的定義,一般認為大數(shù)據(jù)是指所涉及的資料量規(guī)模巨大到無法通過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為服務于經(jīng)營決策的資訊。大數(shù)據(jù)的出現(xiàn),使征信業(yè)發(fā)展面臨的外部環(huán)境發(fā)生了巨大的變化。
(一)大數(shù)據(jù)時代征信業(yè)面臨的機遇。
1.優(yōu)化征信市場的格局。
隨著征信機構市場化運營機制的確立,將會有更多信息資源優(yōu)勢的企業(yè)借助互聯(lián)網(wǎng)、大數(shù)據(jù)等信息技術的創(chuàng)新進步,從征信業(yè)薄弱環(huán)節(jié)切入,通過服務創(chuàng)新或產(chǎn)品創(chuàng)新打破原有的征信市場格局。一是電商企業(yè)將組建征信機構。以阿里巴巴為例,其利用淘寶、天貓、支付寶平臺上的行為數(shù)據(jù)和信用情況,建立成了涵蓋數(shù)十萬企業(yè)的數(shù)據(jù)庫,具備了開展網(wǎng)絡征信服務的基礎和實力。二是金融機構建立征信機構。例如平安集團擬整合網(wǎng)貸信息、銀行信貸信息、車輛違章信息等,建立金融數(shù)據(jù)挖掘中介機構。三是新型征信機構應運而生。一些大數(shù)據(jù)公司依靠技術手段,以電子商務、社交網(wǎng)絡為平臺,采集信息,提供信用信息服務,可能成為新型的征信機構。
2.推動征信業(yè)的轉型升級。
大數(shù)據(jù)給征信業(yè)帶來轉型升級的歷史機遇,未來的征信業(yè)將以智能數(shù)據(jù)分析系統(tǒng)為平臺,利用大數(shù)據(jù)挖掘技術,支持征信業(yè)發(fā)展創(chuàng)新。大數(shù)據(jù)支持征信業(yè)升級和轉型主要體現(xiàn)在二個方面。一方面大數(shù)據(jù)促成征信業(yè)建立全新的風險控制體制,向有效監(jiān)管轉型。大數(shù)據(jù)技術對客戶信用信息進行深度挖掘,實時監(jiān)控,防范潛在的信用風險。另一方面大數(shù)據(jù)支持征信機構向精細化管理轉變。大數(shù)據(jù)的核心優(yōu)勢在于信息挖掘,精細化管理的首要條件是充分信息化,包括業(yè)務信息化和管理信息化。
3.促進征信業(yè)差異化競爭。
征信機構通過采用不同的數(shù)據(jù)來源,不同的數(shù)據(jù)處理方式,針對不同的客戶,開發(fā)出不同的產(chǎn)品,滿足不同層次客戶的市場需求,實現(xiàn)差異化競爭。例如,金融機構對征信服務的需求將從單個借款主體的信用報告,擴展到運用信用信息拓展網(wǎng)絡影響和金融服務渠道。P2P網(wǎng)絡借貸、電商金融等業(yè)態(tài)需要借助信用信息共享防范風險,降低交易成本。
4.拓展征信數(shù)據(jù)來源。
大數(shù)據(jù)使征信數(shù)據(jù)來源呈現(xiàn)多元化、多層化和非結構化的特點,更加全面和真實地反映信息主體的信用情況。征信機構從在政府部門、金融機構等實體機構中采集信息,轉向從互聯(lián)網(wǎng)等虛擬世界中獲取信息。在數(shù)據(jù)采集的廣度和深度上,征信數(shù)據(jù)量將激增,采集包括證券數(shù)據(jù)、保險數(shù)據(jù)、商業(yè)信用數(shù)據(jù)、消費交易數(shù)據(jù)和公共事業(yè)繳費數(shù)據(jù)等,全面地覆蓋與信息主體相關的各項因素。
(二)大數(shù)據(jù)時代征信業(yè)面臨的挑戰(zhàn)。
1.現(xiàn)有征信業(yè)務規(guī)則與大數(shù)據(jù)時代不匹配。我國有關征信業(yè)的法律法規(guī)的規(guī)制對象主要是傳統(tǒng)金融領域,《征信業(yè)管理條例》及其配套制度初步構建了我國征信業(yè)的法律法規(guī)框架,但是《征信業(yè)管理條例》是否滿足大數(shù)據(jù)時代征信業(yè)務的規(guī)則要求,尚未得到市場驗證。目前,缺少對大數(shù)據(jù)時代征信活動的規(guī)范,如有關大數(shù)據(jù)采集、整理、保存、加工和處理的制度要求。因此,還需要進一步細化和完善征信業(yè)務規(guī)則,以更好促進大數(shù)據(jù)時代征信市場的發(fā)展。
2.征信業(yè)監(jiān)管技術和水平需改進。大數(shù)據(jù)時代給征信業(yè)發(fā)展帶來深刻影響,同時也對征信業(yè)監(jiān)管提出了更高的要求。要適應大數(shù)據(jù)時代的征信監(jiān)管需求,征信監(jiān)管水平要能跟上大數(shù)據(jù)征信的發(fā)展水平,監(jiān)管政策要符合大數(shù)據(jù)的基本規(guī)律,監(jiān)管人員要具有適應大數(shù)據(jù)的知識和能力。在行業(yè)自律監(jiān)管方面,我國行業(yè)監(jiān)管尚未發(fā)育成熟,行業(yè)標準尚未統(tǒng)一,行業(yè)規(guī)范以及行業(yè)職業(yè)道德等內容尚未完善。
3.信息安全和隱私保護形勢嚴峻。隨著數(shù)據(jù)的進一步集中和數(shù)據(jù)量的急劇增長,對海量數(shù)據(jù)進行安全防護變得更加困難,數(shù)據(jù)的分布式處理也加大了數(shù)據(jù)泄露的風險,隱私保護和數(shù)據(jù)安全成為制約大數(shù)據(jù)發(fā)展的瓶頸。大數(shù)據(jù)時代下的征信業(yè)同時具有了大數(shù)據(jù)和征信兩個特性,對隱私保護和數(shù)據(jù)安全的要求更高。
4.數(shù)據(jù)處理能力亟待提高。如何有效處理大數(shù)據(jù),是大數(shù)據(jù)發(fā)揮作用的重要環(huán)節(jié)。益百利等大型征信機構在數(shù)據(jù)處理方面已經(jīng)采取多層次數(shù)據(jù)挖掘等先進技術,利用私有云平臺,對系統(tǒng)中海量數(shù)據(jù)進行處理和研發(fā),減少主觀判斷,提高風險預測的準確性。但是目前我國征信機構發(fā)展起步較晚,缺少對數(shù)據(jù)處理的核心技術,導致數(shù)據(jù)分析結果不能夠準確的識別個體或組織的行為。
5.硬件基礎設施需要全面升級。過去征信機構存儲征信數(shù)據(jù)主要是在本地建立數(shù)據(jù)庫,大數(shù)據(jù)時代隨著數(shù)據(jù)量呈幾何級數(shù)的增加,征信機構硬件技術的發(fā)展已經(jīng)跟不上數(shù)據(jù)容量的增長速度,數(shù)據(jù)存儲面臨較大壓力。
大數(shù)據(jù)時代征信業(yè)發(fā)展的措施與建議
隨著大數(shù)據(jù)時代的到來,未來征信業(yè)發(fā)展要從制度設計、技術進步、信息共享、監(jiān)督管理、隱私保護等方面不斷創(chuàng)新,促進征信業(yè)在大數(shù)據(jù)背景下的跨越式發(fā)展。
(一)建立符合大數(shù)據(jù)的征信法律制度和業(yè)務規(guī)則體系。現(xiàn)有的征信法律體系都是基于傳統(tǒng)數(shù)據(jù)模式下制定的,難以滿足大數(shù)據(jù)等新技術條件下征信業(yè)發(fā)展的制度需求。在征信業(yè)務開展過程中,大數(shù)據(jù)的收集使用可能涉及國家信息安全、企業(yè)商業(yè)秘密、公民隱私等,為了給大數(shù)據(jù)條件下征信業(yè)發(fā)展提供制度保障,需要從征信立法層面完善信息安全和數(shù)據(jù)管理的法律制度,明確大數(shù)據(jù)背景下數(shù)據(jù)采集、整理、加工、分析、使用的規(guī)則,確保大數(shù)據(jù)時代征信業(yè)發(fā)展有法可依。
(二)加強征信產(chǎn)品創(chuàng)新。隨著可獲得的數(shù)據(jù)量呈幾何倍數(shù)的增加,征信機構通過深度挖掘和使用這些數(shù)據(jù),就可以極大地拓展征信產(chǎn)品的種類,不僅能夠提供信用報告查詢等基礎服務和產(chǎn)品,還可以提供其他綜合性產(chǎn)品,滿足社會各界的需求。從征信產(chǎn)品的滿足層次高低的不同,可以分為宏觀、中觀和微觀的征信產(chǎn)品。宏觀層面,征信機構通過大數(shù)據(jù)分析可以對系統(tǒng)性、全局性的風險信息進行預測。中觀層面,征信機構的海量數(shù)據(jù)包含大量時效性和政策含義都很強的信息,可以靈活多樣地進行多維度組合分析。把這些信息整理和挖掘出來,建立對應的指數(shù)體系,有助于行業(yè)監(jiān)管。微觀層面,在信用主體(包括企業(yè)和個人)同意的前提下,征信機構可以提供每一個信用主體的信用報告、信用評分、身份驗證、欺詐檢測、風險預警、關聯(lián)分析等多種數(shù)據(jù)服務。
(三)提高大數(shù)據(jù)技術處理能力。大數(shù)據(jù)價值的完整體現(xiàn)需要多種技術的協(xié)同。數(shù)據(jù)抽取與集成、數(shù)據(jù)分析以及數(shù)據(jù)解釋,是大數(shù)據(jù)時代征信數(shù)據(jù)處理的三個重要環(huán)節(jié),在數(shù)據(jù)處理過程中搜索引擎、云計算、數(shù)據(jù)挖掘等新技術使用必不可少。因此,征信機構要加大數(shù)據(jù)處理分析專業(yè)人才隊伍的培養(yǎng),同時要引進大數(shù)據(jù)處理的專業(yè)方法和工具,建立前瞻性的征信業(yè)務分析模型,更好的把握、預測市場和信息主體的行為。
(四)健全大數(shù)據(jù)信息共享機制。完善的大數(shù)據(jù)標準體系是推進數(shù)據(jù)共建共享的前提。目前,我國來自各行業(yè)、各渠道的數(shù)據(jù)標準存在差異,成為阻礙數(shù)據(jù)開放和共享的關鍵瓶頸。建議盡快統(tǒng)一標準和格式,以便進行規(guī)范化的數(shù)據(jù)融合,提升大數(shù)據(jù)的整合能力,打破資源部門間的信息孤島,從而完善信息共享機制。
作為數(shù)據(jù)庫管理系統(tǒng)的最內層結構,物理數(shù)據(jù)庫的主要作用就是存儲數(shù)據(jù),而且物理數(shù)據(jù)庫中存儲的各種數(shù)據(jù)都屬于最原始的數(shù)據(jù),一般都是由字符、字符串等共同構成的,因此其大部分都屬于用戶加工的對象。作為最中間的數(shù)據(jù)庫管理系統(tǒng)結構,概念數(shù)據(jù)庫技術對數(shù)據(jù)之間的邏輯關系進行了一定程度的解釋,因此其屬于整個數(shù)據(jù)管理系統(tǒng)的邏輯表現(xiàn)。從某種程度上來講,用戶使用數(shù)據(jù)的全部內在聯(lián)系就是所謂的邏輯數(shù)據(jù)層,用戶會對全部數(shù)據(jù)庫中的數(shù)據(jù)進行使用。
2在信息管理中計算機數(shù)據(jù)庫的應用現(xiàn)狀分析
計算機技術發(fā)展越來越快,相應的,也出現(xiàn)了包括網(wǎng)絡安全問題在內的很多問題。對于計算機管理系統(tǒng)的發(fā)展而言,安全系統(tǒng)也具有十分重要的作用。數(shù)據(jù)庫技術要想實現(xiàn)更好地發(fā)展,必須先解決可能會出現(xiàn)的數(shù)據(jù)安全問題。業(yè)內人士開展了大量關于計算機數(shù)據(jù)庫的探究,而且在信息管理中數(shù)據(jù)庫技術的應用性能也得到了極大提升。在信息管理中處理數(shù)據(jù)具有十分重要的作用,很多企業(yè)的數(shù)據(jù)資料都具有機密、敏感的特點,他們非常關注數(shù)據(jù)資料的安全性,因此其具有較高的信息管理技術要求。對信息的管理是數(shù)據(jù)庫管理技術的主要功能,而建立有效的數(shù)據(jù)模型是對信息進行管理的主要特點。以建立的數(shù)據(jù)模型為根據(jù),可將數(shù)據(jù)庫體系劃分為層次型數(shù)據(jù)庫、關系型數(shù)據(jù)庫以及網(wǎng)狀型數(shù)據(jù)庫。計算機技術與數(shù)據(jù)庫技術之間的結合具有非常好的發(fā)展前景,其已經(jīng)在包括農(nóng)業(yè)、工業(yè)以及其他產(chǎn)業(yè)中得到十分廣泛的應用,兩種技術結合使很多行業(yè)信息管理的條理性、有效性和安全性得以極大提升。在信息管理中充分運用計算機數(shù)據(jù)庫技術,除了能使信息管理變得更加方便外,還可以有效保證信息的安全管理。與此同時,信息系統(tǒng)還具有備份和恢復信息的作用,這可以在數(shù)據(jù)遭到破壞的時候,實現(xiàn)對有用數(shù)據(jù)的無成本恢復,從而解決誤刪資料的問題。如今,數(shù)據(jù)庫的安全系數(shù)越來越高,企業(yè)機構不僅能更好地保護數(shù)據(jù)庫,還能有效避免信息系統(tǒng)被黑客侵入,防止機密信息流失。
3計算機數(shù)據(jù)庫技術在信息管理中應用的前景分析
3.1安全性越來越高
數(shù)據(jù)不會出現(xiàn)被非法盜取、篡改和使用等各種安全問題就是數(shù)據(jù)庫的安全性,數(shù)據(jù)庫的安全性是衡量系統(tǒng)質量好壞的一個非常重要的標準。作為數(shù)據(jù)庫的特色應用之一,數(shù)據(jù)的共享很容易導致數(shù)據(jù)出現(xiàn)安全問題,因此,一些機密文件不能實現(xiàn)共享。然而很多信息用戶并不具備較高的信息安全意識,也沒有充分重視網(wǎng)絡安全,嚴重影響數(shù)據(jù)的安全管理工作。未來計算機數(shù)據(jù)庫技術在信息管理中應用的一個重要的趨勢就是具有越來越高的計算機數(shù)據(jù)庫技術安全性。
當前“大數(shù)據(jù)技術”充滿了新的機遇和挑戰(zhàn),其在企業(yè)IT基礎架構、數(shù)據(jù)管理、分析和服務這些關鍵規(guī)劃領域的應用,將會對社會經(jīng)濟發(fā)展帶來長遠深刻的影響。大數(shù)據(jù)指的是從各種各樣的數(shù)據(jù)中快速獲得有價值信息的能力,具有數(shù)據(jù)量大、種類繁多、價值稀疏、處理速度快的特征,這些特征對目前社會各個行業(yè)的信息架構、系統(tǒng)的沖擊非常大。大數(shù)據(jù)技術對整個社會經(jīng)濟發(fā)展來說既是機遇也是挑戰(zhàn)。
(一)必要性
根據(jù)IDC在2011年6月的《數(shù)字宇宙》(DigitalUniverse)研究報告,2011年全球新建和復制的信息量超過1.9ZB(1.8萬億GB),五年時間增加了近九倍。隨著數(shù)據(jù)量的指數(shù)級增長、數(shù)據(jù)源種類(包括結構化數(shù)據(jù)源和非結構化數(shù)據(jù)源,如社交媒體、富媒體文件以及地理空間信息)的飛速增加,以及數(shù)據(jù)產(chǎn)生速度的加快(如實時傳感器數(shù)據(jù)),傳統(tǒng)的數(shù)據(jù)庫和架構無法處理、管理和分析如此龐大的數(shù)據(jù)集。政府、金融、電信、互聯(lián)網(wǎng)等大數(shù)據(jù)應用的行業(yè)先鋒目前均面臨大數(shù)據(jù)的問題。不僅如此,隨著物聯(lián)網(wǎng)、云計算、移動互聯(lián)網(wǎng)、車聯(lián)網(wǎng)、智能手機、平板電腦的飛速發(fā)展,大數(shù)據(jù)技術擁有了更為廣泛的數(shù)據(jù)資源。因此,IT產(chǎn)業(yè)界及行業(yè)用戶都亟需針對大數(shù)據(jù)設計和優(yōu)化大數(shù)據(jù)存儲、管理和查詢平臺,來替代傳統(tǒng)關系型數(shù)據(jù)庫平臺。在技術發(fā)展的前沿階段進行實驗平臺建設對我學院師生具有重要意義。該實驗平臺能夠為學生提供一個了解最前沿技術的機會,不僅能夠提高學生學習興趣、自學能力,還為學生就業(yè)、更好地規(guī)劃未來的職業(yè)發(fā)展提供了機會。大數(shù)據(jù)技術的機遇與挑戰(zhàn)帶來了很大的人才缺口,目前大數(shù)據(jù)技術平臺開發(fā)、方案實施人才緊缺;由于云存儲、大數(shù)據(jù)技術帶來的信息安全問題,也亟需大量信息安全領域的人才;由于大數(shù)據(jù)技術在物聯(lián)網(wǎng)、電子商務、移動互聯(lián)方面的應用,對了解大數(shù)據(jù)技術的電子商務專業(yè)人才也更青睞。通過本實驗平臺的培養(yǎng),感興趣的優(yōu)秀學生還可以嘗試考取與大數(shù)據(jù)技術密切相關的Hadoop專業(yè)認證———ClouderaCertifiedDeveloper/AdministratorforApacheHadoop,為學校、學院在該領域帶來正面影響,增加更多合作和就業(yè)的機會。該實驗平臺能夠為信息系統(tǒng)專業(yè)試點班培養(yǎng)計劃的很多核心課程(包括管理統(tǒng)計學中的業(yè)務報表與分析、商務智能方法與應用、商務智能實踐、數(shù)據(jù)挖掘和BA綜合實訓等)形成較好的前后銜接關系,能夠豐富實踐教學環(huán)節(jié),深化教學大綱的內容,從建設更合理的課程建設體系來說具有很大的必要性。近幾年學生就業(yè)壓力越來越大,迫切需要對教學內容和實踐環(huán)節(jié)不斷突破創(chuàng)新,才能具備持續(xù)發(fā)展能力。因此在原有課程體系和實踐教學環(huán)境的基礎上增設本實驗平臺非常必要。
(二)可行性
教學計劃中的相關程序設計課程為學生學習云存儲技術、熟悉大數(shù)據(jù)開發(fā)平臺、了解最新大數(shù)據(jù)技術的發(fā)展、進行大數(shù)據(jù)平臺基礎上的開發(fā)、實現(xiàn)對大數(shù)據(jù)的分析、可視化演示打好了基礎。英特爾ApacheHadoop平臺是目前大多數(shù)大數(shù)據(jù)處理的技術基礎,目前該技術已經(jīng)發(fā)展成熟,并隨之產(chǎn)生很多基于該平臺的大數(shù)據(jù)處理工具,可供實驗室建設實驗平臺使用。
二、建立大數(shù)據(jù)實驗平臺的基本構想
(一)實驗平臺人員
實驗平臺人員負責實驗平臺的建設、維護,實驗設計與指導人員由在大數(shù)據(jù)相關領域、課程建設以及實踐教學方面都有著豐富的經(jīng)驗的教師與實驗室工作人員構成,同時與大數(shù)據(jù)企業(yè)進行合作,獲得其核心技術人員的支持、培訓和大力配合,可以共同組成一個經(jīng)驗豐富、精煉實干的建設團隊。
(二)軟件調研
大數(shù)據(jù)的特點為4個“V”:第一,“Volume”,指的數(shù)據(jù)量大,包括大的數(shù)據(jù)塊,或數(shù)據(jù)總量巨大,從TB躍升到PB;第二,“Variety”,指的是數(shù)據(jù)種類繁多,包含大量非結構化數(shù)據(jù),例如網(wǎng)絡日志、音頻、視頻、地理信息等;第三,“Value”,價值稀疏性,大量數(shù)據(jù)中有價值數(shù)據(jù)很少;第四,“Velocity”,指的是處理速度快,這與傳統(tǒng)數(shù)據(jù)挖掘有很大區(qū)別。選擇有數(shù)據(jù)分析基礎、在業(yè)內發(fā)展領先的企業(yè)進行調研并選擇適合高校規(guī)模的合作企業(yè)是建立實驗平臺的重要工作。很多公司給出了可供使用的大數(shù)據(jù)平臺:IBM誖InfoSphere誖BigInsightsTMBasicEdition是一款基于開放源碼ApacheHadoop的分析平臺,用于分析大量本機格式的非常規(guī)數(shù)據(jù),支持結構化、半結構化和非結構化內容,以實現(xiàn)最大程度的靈活性;IBM誖InfoSphere誖Streams是一個高級計算平臺,幫助用戶開發(fā)的應用程序快速攝取、分析和關聯(lián)來自數(shù)千個實時源的信息;惠普公司Vertica分析平臺6.1,能夠通過Hadoop分布式文件系統(tǒng)連接器來優(yōu)化大數(shù)據(jù);ClearStoryData大數(shù)據(jù)分析新創(chuàng)公司,通過Clearstory,公司客戶可以將自身的數(shù)據(jù)與行業(yè)的公共數(shù)據(jù)融合,尋找統(tǒng)計上的新視角,目標是取代目前市場上的主流數(shù)據(jù)可視化工具,包括QlikView和Tableau等老牌工具;Informatica9.1提供首款Hadoop編譯器Hparse,這是一種針對Hadoop而優(yōu)化的數(shù)據(jù)轉換環(huán)境,該軟件支持靈活高效地處理Hadoop里面的任何文件格式,為Hadoop開發(fā)人員提供了即開即用的解析功能,以便處理復雜而多樣的數(shù)據(jù)源;Datameer:Hadoop海量數(shù)據(jù)分析平臺允許用戶在缺乏技術知識的情況下能夠分析大量數(shù)據(jù);Infochimps平臺以其完備的基礎設施和專業(yè)知識,為客戶提供端到端的大數(shù)據(jù)解決方案,Infochimps是一家位于美國德克薩斯州奧斯丁的創(chuàng)業(yè)公司,2012年2月從數(shù)據(jù)市場轉型為大數(shù)據(jù)平臺提供商后獲得谷歌投資;甲骨文大數(shù)據(jù)機———OracleBigDataAppliance集成系統(tǒng)融入了Cloudera的DistributionIncludingApacheHadoop、ClouderaManager和一個開源R;微軟SQLServer新增PDW功能,可以幫助客戶擴展部屬數(shù)百TB級別數(shù)據(jù)的分析解決方案;亞馬遜將MapReduce作為一項服務,其彈性MapReduce編程是一項能夠迅速擴展的Web服務,運行在aws的亞馬遜彈性計算云和亞馬遜簡單存儲服務上;Teradata是企業(yè)級數(shù)據(jù)倉庫(EDW)的領導者,在結構化數(shù)據(jù)、半結構化數(shù)據(jù)和大部分非結構化數(shù)據(jù)領域幾乎沒有很大成果,因此收購了AsterDa-ta———一家提供SQL-MapReduce框架的公司。AsterData是高級分析和管理各種非結構化數(shù)據(jù)領域的市場領導者和開拓者,為Teradata帶來了大數(shù)據(jù)分析市場商機。
(三)方案實施
實驗平臺的設計同時立足于大數(shù)據(jù)技術的發(fā)展的前沿性與本學院學生專業(yè)特點,與學生前序的理論、實踐課程均有良好的銜接,符合人才培養(yǎng)計劃,深化了教學大綱的內容,并針對不同專業(yè)學生設計實踐學時、內容和難度。本實驗平臺可以同大數(shù)據(jù)行業(yè)中的公司科研部門共同合作建設,雙方確定在人才培養(yǎng)、師資培訓、共建實驗室和實訓基地、推動大學生校外實習和社會實踐活動的開展等方面開展全面、廣泛、長期、深入的合作。該實驗室建設將豐富實踐教學體系,也可推動學院科研項目立項、新課題研究、專項基金申請和聯(lián)合開展商用項目開發(fā)等;該實驗室使師生能接觸高新大數(shù)據(jù)開發(fā)平臺,了解最新大數(shù)據(jù)技術的發(fā)展,進行大數(shù)據(jù)平臺的開發(fā),實現(xiàn)對大數(shù)據(jù)的分析、可視化演示,增強學生的動手能力并提升就業(yè)質量;與此同時,提升了教師的項目管理能力和教學能力。
三、結論
1 地方文獻報刊信息數(shù)據(jù)庫
地方文獻是指內容上具有地域性,同時具有重復使用價值的文獻。由于它完整、系統(tǒng)地記錄了特定地域內自然和人文方面的各種信息,從而為人們提供了研究特定地域內歷史、現(xiàn)代及未來的有關資料。
地方文獻的類型多種多樣,報刊文獻是其中的一種。它具有信息量大,傳遞周期短,內容相對客觀、翔實等特點。但由于它的總量太大,有關的地方文獻信息分散在不同時期、不同品種的報刊之中。僅靠瀏覽原始文獻,迅速查到有關資料,幾乎是不可能的。地方文獻報刊索引就是為解決這一問題而編制成的一種檢索工具。
在手工時代,地方文獻報刊索引表現(xiàn)為篇目索引或題錄索引的形式,即將報刊中所載地方文獻篇目按一定順序編排起來,以利讀者查找文章的所在位置。這種索引不反映文章的具體內容,只具有指向和示址作用。同時,也對地方事物起著揭示和報道的作用。除了作為一種綜合性的檢索工具外,還可以在這種索引的基礎上編制各種情報報導刊物,或圍繞特定學科及專業(yè)進行定向報導和檢索,以服務于地方的各項事業(yè)。
鑒于地方文獻報刊索引的重要作用,許多公共圖書館都曾積極編制這種索引。例如,首都圖書館自50年代起開始編制《北京地方文獻報刊資料索引》,涵蓋了本世紀以來的內容;甘肅省圖書館也是在同一時期開始編制西北五省的地方文獻報刊索引;長春市圖書館也曾編制了《東北地方文獻索引》等檢索工具。為了避免目錄體系過于龐大,這種卡片式篇目索引一般僅以分類方式編排。因此讀者也只能從分類途徑對報刊上的地方文獻信息進行檢索。 進入計算機時代以來,以數(shù)據(jù)庫形式來處理地方文獻信息已成為圖書館地方文獻工作的必然趨勢。計算機所具有的自動識別與排序功能,使地方文獻信息的編排檢索變得更加方便、更加快捷。通過全文掃描技術完成的報刊全文數(shù)據(jù)庫,使得報刊上的地方文獻信息得到更充分地揭示和利用。由于計算機具有一次性輸入,多途徑輸出的功能,因而在對地方文獻信息進行存儲與檢索時,增加了篇名、著者、出版、文摘等多方面的途徑。尤其是從主題途徑檢索地方文獻信息的問題得到了很好地解決。
在地方文獻報刊信息數(shù)據(jù)庫(以下簡稱報刊信息庫)中,分類標引和主題標引都是以揭示文獻內在特征為目的的標引方法,只是揭示的角度有所不同。由于地方文獻的史料特征極為明顯,故地方文獻的讀者往往是從特定的事件、人物、時間、地域的角度入手進行檢索。因而可以說主題檢索是一種最直接反映地方文獻內容特征的檢索途徑,也是建立檢索工具和檢索系統(tǒng)的基礎和前提。近些年來,圖書情報界對有關主題標引的原則和操作方法有過許多研究和探討,撰寫過很多的著作和文章。但由于地方文獻中連續(xù)出版物本身所具有的特征,其主題標引的原則和方法與其它類型文獻的標引還是有所不同。本文擬從報刊信息數(shù)據(jù)庫的建設入手,探討有關地方文獻報刊信息主題標引的一些問題。
2 地方文獻報刊信息數(shù)據(jù)庫中的主題標引
2.1詞表的編制
報刊信息庫與其它類型數(shù)據(jù)庫相比,最突出的特點是要反映地方文獻本身所具有的特征。同時還要滿足地方文獻用戶特殊的檢索需求。因此,選擇一部適合地方文獻特征的主題詞表是開展標引工作的首要問題。
《漢語主題詞表》(以下簡稱漢表)是一部供機檢使用的綜合性基礎型詞表。它所收錄的詞匯可以供各個機構和行業(yè)從中選詞,以編制適合本專業(yè)或本機構使用的專業(yè)詞表。實際上,我國很多專業(yè)情報機構和圖書館都是在參考這部國家詞表的基礎上編制自己詞表的。在編表過程中,抽取主題詞時當盡可能不破壞原有詞表的詞間關系。但必要時,詞間關系及基本范疇還是需要重新確定的。
由于地方文獻是對某一地域自然和人文現(xiàn)象的客觀描述,它所表現(xiàn)出的地域性和專指性極強。用綜合性的《漢表》來標引各地的地方文獻,則將有相當部分的文獻不能被準確地表達其主題概念;其次,地方文獻的內容范疇與《漢表》中的基本范疇也有所不同?!稘h表》是以學科體系作為劃分范疇的基本依據(jù);而地方文獻則是以特定地方的自然環(huán)境、人文環(huán)境和地方事業(yè)作為劃分范疇的基本依據(jù)。所以地方文獻主題詞表需要在《漢語主題詞表》的基礎上自行編制。
地方文獻主題詞表中所收錄的主題詞來源主要有:
①《漢表》中已有的詞匯。這是地方文獻與非地方文獻都使用的綜合性詞匯,它占將來的地方文獻主題詞表所收詞匯的絕大部分。由于是從《漢表》中選詞,所以它們是相對規(guī)范的。
②《漢表》中沒有的,帶有地方特點的詞匯,如:北京地方文獻的“琉璃廠”、天津地方文獻中的“皇會”、廣東地方文獻中的“早茶”等,這部分詞匯雖然在未來的地方文獻主題詞表中所占比例不會很大,但它們卻是出現(xiàn)頻率相對較高的詞匯。對于這部分詞匯及其詞間關系,地方文獻工作者需要加以規(guī)范。
③《漢表》作為階段性產(chǎn)品,它的編制受時間的限制,對于編表以后新產(chǎn)生的一些詞匯它不可能收錄,在新編的地方文獻主題詞表中收錄這部分詞,也需要加以規(guī)范。
由于編制先組式的主題詞表需要一段相當長的時間,同時還要編制一系列的標引細則,這將會影響報刊信息庫主題標引工作的迅速展開。因此,可以采用另一種方式,即首先確定一段時間為試驗期,先進行地方文獻的標引工作。由標引人員直接從報刊所載的地方文獻信息內容中選取有檢索意義的關鍵詞作為主題詞。這種主題詞是未經(jīng)規(guī)范的自然語言,也無詞間關系可言,待積累了一定數(shù)量之后,再對其進行修改、充實,并參照《漢表》使之規(guī)范化。確定好詞間關系和基本范疇,從而形成適用的詞表。這種詞表是后控式的,采用這種方式選詞更直觀,專指性強,還能使標引工作與修改詞表同時進行。而且標引時不用考慮詞間關系及查表抽詞,所以標引速度快。在標引時采用自然語言,對標引人員的要求也相對較低。目前,廣東省中山圖書館的地方文獻數(shù)據(jù)庫系統(tǒng)主題標引就采用了這種方法。
2.2主題詞字段的設置
無論是先有詞表,還是先進行標引工作,在報刊信息庫中,都需要設置若干個主題詞字段,以便展開具體的標引工作。在設置主題詞字段時,一定要注意反映地方文獻的時空特征;在空間方面完整、系統(tǒng)地記錄特定地域內自然和人文方面的各種信息;在時間上又形成了一個連續(xù)的信息集合。這是一切地方文獻工作最基本的原則。
在報刊信息庫中,首先應設置涉及文獻基本內容的“內容主題詞”字段。此字段選詞靈活性大,標引的內容也十分廣泛。它對所有地方文獻信息的內容范疇進行涵蓋,也是以后編制地方文獻主題詞表時確定詞表基本范疇的依據(jù)。從地方文獻的性質和特征來看,它是對特定地區(qū)自然、社會、人文諸般事物的歷史與現(xiàn)狀進行全面系統(tǒng)地綜合性記錄,涉及的內容極為廣泛。如反映一個地區(qū)所能觀察到的天文現(xiàn)象、地質水文結構、地形地貌、氣候與氣象、物種與資源以及反映該地區(qū)的人文地理、歷史、地方人物、社會經(jīng)濟、地方政治、社會結構、地方文化、教育等各個方面。
報刊信息庫中“內容主題詞”字段的主題詞性質絕大部分是綜合性的,與其它非地方文獻數(shù)據(jù)庫中的主題詞無太大區(qū)別。例如“社會治安”,“計量管理”、“住宅區(qū)”、“軟件產(chǎn)業(yè)”等;也有一部分是地方文獻內容所特有的地方性詞匯,如“敦煌石窟”、“庚子”、“廠甸”等;另外,新產(chǎn)生的一些地方文獻信息的內容,也應通過內容主題詞來表達??傊彩巧婕暗降胤轿墨I的所有內容特征,都應在此字段予以反映。
這一字段并非地方文獻數(shù)據(jù)庫所特有,有關具體標引方法的討論從略。
另一種主題字段的設置應反映地方文獻內容特征以外的其它特征。地方文獻最大的特點,就在于文獻所記載的現(xiàn)象、事實和人物都被限定在某一特指的時空范圍內。也就是說。地方文獻所涉及的內容范疇均會通過特定的時間、地點、團體機構、人物等因素反映和輸出。地方文獻用戶的檢索習慣也往往是從某一地域范疇、地區(qū)名稱、某一事件、某一人物入手。因此,有必要在地方題錄庫中設置“地域主題詞”、“時間主題詞”、“團體主題詞”和“個人主題詞”諸字段。它們是揭示地方文獻的本質特征所必須的字段。同時也是地方文獻數(shù)據(jù)庫系統(tǒng)中所特有的。
以上四個主題詞字段所反映的是有關地方文獻信息中客觀存在的某些因素,如“地域主題詞”中的“東城區(qū)”、“梅山縣”、“個人主題詞”中的“梅蘭芳”、“秋瑾”等。盡管這四種主題詞的標引與“內容主題詞”的標引相比,相對容易些,但仍需積累到一定數(shù)量后進行規(guī)范。例如“團體主題詞”中的機構名稱是用全稱還是用簡稱,以及“個人主題詞”中的人物名稱是用本名還是用筆名,這些都需要地方文獻工作者在以后的工作中根據(jù)本地區(qū)的具體情況加以規(guī)范。
具體的標引方法是:
地域主題所標引的不是整體地方文獻的地域,而是文章內容涉及的某一具體區(qū)域的名稱,或者給文章內容帶來影響的區(qū)域名稱。如有關北京地方文獻的內容不用標“北京”,直接標引具體的“東城區(qū)”、“昌平縣”等行政區(qū)劃名稱;內容涉及到較具體的地名時也可標引地名,例如“王府井大街”、“方家胡同”等;如果文章中所反映的地區(qū)更詳細,區(qū)(縣)、街道(鄉(xiāng)鎮(zhèn))、村等具體名稱都有,可逐級進行標引,中間用分隔符隔開,如北京地方文獻中的“順義縣%趙全營鎮(zhèn)%北郎中村”;在標引中,遇到舊有的行政區(qū)劃名稱或舊地名時,為反映某一地區(qū)名稱的歷史發(fā)展沿革,應將現(xiàn)行行政區(qū)劃名稱與舊有行政區(qū)劃名稱同時標引作為檢索點,現(xiàn)有行政區(qū)劃名稱或新地名標在前面, 舊行政區(qū)劃名稱或舊地名注于其后,可用括號括起。如“東城區(qū)(內三區(qū))”。以上的標引方法主要是針對地方文獻用戶特定的檢索需求而言。
年代主題標引的是文獻內容所涉及的時間范圍,而不是文獻撰寫或出版發(fā)行的時間。清以前的歷朝歷代均可使用“朝代%年號”的方法標引.如“清代%乾隆”,中華民國時期(1919年前)可標引成“民國時期”,到了1920年以后可以標引成“二十年代”、“六十年代”等。
團體主題和個人主題標引的是文章內容所涉及到某一具體機構、個人,或與某地方有關系的機構和個人。團體主題標引時,用機構和單位的標準全稱,如“北京市中級人民法院”、“重慶市技術監(jiān)督局”等;而個人主題的標引,是標具體人名,例如“梅蘭芳”;如果遇到同一人物有本名與筆名時,要同時標引,如“魯迅”與“周樹人”、“老舍”與“舒舍予”之間可用符號“%”隔開;遇到清代人物或少數(shù)民族人物的名稱較長時,一般應標引人物的全名,如“愛新覺羅·溥儀”。
總之,無論標引什么類型的主題詞,標引人員都要站在用戶的角度,即從索引的終極使用目的出發(fā),給地方文獻實際使用者提供有價值的地方文獻信息。因此,在對報刊信息庫進行主題標引過程中一定要確定好標引深度。地方文獻報刊索引的標引深度,則取決于地方文獻各類用戶的檢索需求。地方文獻的研究級用戶的檢索需求包括:決策、管理人員宏觀的檢索需求、科研人員較專深的檢索需求及設計生產(chǎn)人員的針對性檢索需求等。
盡管采用數(shù)據(jù)庫系統(tǒng)處理地方文獻信息這一手段在全國各類圖書館的地方文獻業(yè)務中開展得還不夠普遍,但這是地方文獻工作發(fā)展的必然趨勢。結合地方文獻本身的特點來制訂適用的主題詞表、分類表,是實現(xiàn)地方文獻信息處理標準化的必要步驟。它可為今后進行聯(lián)機檢索,進入國家和地區(qū)網(wǎng)絡,從而實現(xiàn)地方文獻資源共享打下堅實的基礎。同時,計算機多途徑檢索所產(chǎn)生的效果也會使地方文獻信息資源得以更充分地研究與利用。
參考文獻
1 韓樸.圖書館地方文獻工作.北京:文津出版社,1992
2 中國科學技術情報研究所.北京圖書館.漢語主題詞表.北京:科學技術文獻出版社,1979