采集的文章內容不能直接發(fā)布(開(kāi)源C#彩票*敏*感*詞*庫系列文章(1)_光明網(wǎng))
優(yōu)采云 發(fā)布時(shí)間: 2022-02-12 14:22采集的文章內容不能直接發(fā)布(開(kāi)源C#彩票*敏*感*詞*庫系列文章(1)_光明網(wǎng))
本博所有文章分類(lèi)總目錄:【總目錄】本博總目錄-實(shí)時(shí)更新
開(kāi)源C#彩票數據數據庫系列文章總目錄:【目錄】C#搭建足球比賽數據庫及預測平臺及彩票數據分析目錄
前2個(gè)月,我的系列文章:C#搭建足球比賽數據庫及預測平臺(1)基本介紹,【目錄】C#搭建足球比賽數據庫及預測平臺及彩票數據分析目錄,介紹了足球比賽數據庫平臺的基本結構,我也在文章中提出了一個(gè)大概的方案,把我花了一年的空閑時(shí)間一步步整理出來(lái)的這個(gè)數據數據庫打通,經(jīng)過(guò)2個(gè)月的時(shí)間閑暇之余,對代碼進(jìn)行了部分整理和簡(jiǎn)化,核心事件數據庫部分獨立出來(lái),下面簡(jiǎn)單介紹一下這個(gè)開(kāi)源數據庫和核心代碼。
本文原文地址:.NET足球比賽數據數據庫平臺-SmartLottery正式開(kāi)源
接下來(lái),我會(huì )每周寫(xiě)一篇文章來(lái)介紹如何使用數據庫,并做一些基本的分析。至于預知八仙入手后會(huì )大顯神通!有興趣可以關(guān)注!
1.為什么要開(kāi)源這個(gè)數據庫
全國上百家互聯(lián)網(wǎng)彩票公司都有足球比賽數據庫系統,但不共享,都是自己的采集,還有大量的業(yè)余研究人員,尤其是踢足球的程序員,很多其中對采集自己的數據,或多或少造成了很大的浪費,不僅是精力和時(shí)間的浪費,也是網(wǎng)絡(luò )資源和帶寬的浪費。如果互聯(lián)網(wǎng)公司的數據海量采集,他們也會(huì )采取相應的措施,讓采集變得更加困難。所以我開(kāi)發(fā)這些數據的目的是基于以下幾點(diǎn):
1.讓喜歡足球的程序員無(wú)需重復即可直接獲取足球比賽數據采集;
2.開(kāi)放基礎數據庫,讓更多人實(shí)現自己的想法和想法,專(zhuān)注于業(yè)務(wù),而不是這些沒(méi)有技術(shù)含量的數據;
3.采集數據,從某些角度來(lái)說(shuō),只要花時(shí)間,就可以做到。我只是分享我花時(shí)間降低每個(gè)人的門(mén)檻。
4.我們不僅開(kāi)源了核心數據庫,還開(kāi)源了數據庫的數據訪(fǎng)問(wèn)接口代碼(C#版本)。如果有數據庫,也可以自己寫(xiě)相應的代碼,但前提是了解數據庫的結構,可以參考上面提到的系列文章。
本文將對核心數據庫的情況和核心訪(fǎng)問(wèn)代碼做一個(gè)初步的介紹。我們還會(huì )準備一些文章來(lái)詳細介紹使用方法。請關(guān)注博客。
2.核心數據庫注意事項
對于某些人可能有的問(wèn)題,我將解釋相關(guān)問(wèn)題:
1.核心數據庫是*敏*感*詞*的Sqlite,有大量的子數據庫。至于結構和相關(guān)的表結構可以看這里文章:【目錄】C#搭建足球比賽數據庫和預測平臺以及彩票數據分析目錄
2.目前總數據量約為1.4G。由于獨立文件數據庫的關(guān)系,不方便我們不時(shí)更新。我們將每2-3個(gè)月更新一次數據,并向所有人開(kāi)放;
3.因為這個(gè)項目主要是研究用,所以核心采集代碼不能發(fā)布。原因是這樣的:如果我們常規的采集流量按20M/天計算,如果每天有100人采集,采集的數據源網(wǎng)站的流量會(huì )增加很多,時(shí)間長(cháng)了采集,必然會(huì )導致IP被封,導致大家采集少了,或者難度增加。所以,為了自己有穩定的數據源,也要適當考慮別人的壓力網(wǎng)站。我們選擇定期更新,如果您不定期需要采集,可以單獨聯(lián)系我。
4.另外,由于我不是專(zhuān)業(yè)的開(kāi)發(fā)人員,在程序和數據庫設計上肯定有很多不合理的地方,我的能力有限。觀(guān)點(diǎn)。
5.代碼中收錄了籃球賽事數據的相關(guān)實(shí)體類(lèi)和一些特殊的國家彩票玩法實(shí)體。你可能暫時(shí)用不上,但相關(guān)數據也是采集。至于分析方法,八仙渡海演示的能力,我們也可以交流一下。
3.數據內容介紹
目前,這個(gè)數據庫的主要數據是足球比賽的數據。當然,出于長(cháng)遠考慮,我們也采集收錄了一些籃球比賽數據,但并不完整,只是為了積累相關(guān)的實(shí)時(shí)數據,以備將來(lái)可能的研究。目前的數據庫主要包括:
1.包括全球各大洲和國家主要足球賽事的比賽數據。目前有 680 個(gè)事件?;竞w了全球所有賽事,包括洲際杯賽、聯(lián)賽、杯賽、友誼賽等;我們手動(dòng)對賽事進(jìn)行評分,最高為1級,如世界杯、歐洲五大聯(lián)賽等,最低為7級,一般我們把主要分析的科目分為1-3級。當然也可以自定義,部分事件數據如下圖所示:
2.每場(chǎng)比賽都按年份劃分賽季。我們采集采集了各聯(lián)賽近10年,即10個(gè)賽季的基本比賽成績(jì)數據。完整賠率數據僅適用于 2013 年之后的比賽。查看以下個(gè)別賽事的賽季統計數據:
3.比賽數據,比賽數據反映了主客隊的基本比對結果信息。不包括賠率,是核心內容。我們已經(jīng)根據事件劃分了數據庫。比如我們打開(kāi)了“德甲”數據庫,查看了里面的數據結構。根據以上理解,我們采集10年的匹配數據,限于篇幅,下面只展示部分字段:
4.賠率數據,賠率數據根據每個(gè)類(lèi)別和相關(guān)公司分為數據庫。因內容較多,請查看文章系列目錄的表結構及相關(guān)信息。通過(guò)直接查看實(shí)際的數據庫,也可以知道相關(guān)的結構。例如,我們的子數據庫的名稱(chēng)很容易理解。根據數據庫的名稱(chēng)和路徑可以知道子數據庫的信息。公司聯(lián)賽:
4.足球比賽數據庫下載
注意這個(gè)數據庫是2015年6月18日的更新版本,我們會(huì )繼續這個(gè)數據庫1個(gè)月,適時(shí)發(fā)布新數據
下載地址:密碼:hbnz
為了避免其他網(wǎng)站爬蟲(chóng)的影響,我們會(huì )不定期修改下載地址
如下載地址有誤,請到本文原文頁(yè)面下載:.NET足球比賽數據數據庫平臺-SmartLottery正式開(kāi)源
Sqlite數據庫打開(kāi),可以自己下載一個(gè)工具,不多說(shuō)。
5.核心接入程序下載
核心訪(fǎng)問(wèn)程序是獨立的,我們刪除了數據更新代碼,大部分是實(shí)體類(lèi)和相關(guān)訪(fǎng)問(wèn)方法。
下載地址:密碼:8r6k
如下載地址有誤,請到本文原文頁(yè)面下載:.NET足球比賽數據數據庫平臺-SmartLottery正式開(kāi)源
6.程序和數據庫的基本使用
使用程序時(shí),基本上有兩點(diǎn)需要注意。至于其他復雜的問(wèn)題,可以隨時(shí)在博客上提問(wèn),也可以通過(guò)QQ聯(lián)系我,參考本站其他文章:
1.數據庫連接字符串初始化方法應該在一個(gè)單獨的線(xiàn)程中調用,無(wú)論它在哪里使用。在這個(gè)方法中,有一個(gè)XX屬性,用來(lái)設置數據庫的路徑,一般是絕對路徑。
2.查詢(xún)時(shí)注意數據的分庫,及時(shí)切換數據庫。至于子庫的使用,很簡(jiǎn)單,不過(guò)最好看博客菜單欄中X組件的相關(guān)內容。
實(shí)體類(lèi).SetDbConnName(XXName);
接下來(lái),我會(huì )每周寫(xiě)一篇文章來(lái)介紹如何使用數據庫,并做一些基本的分析。至于預知八仙入手后會(huì )大顯神通!
可以參考代碼中的相關(guān)使用。如果大家有什么問(wèn)題,或者對具體的點(diǎn)不明白,可以直接留言或者email,我會(huì )選擇重點(diǎn)介紹,方便大家使用。
由于之前的采集和寫(xiě)代碼的過(guò)程,沒(méi)想到這么多,所以注釋和部分代碼不規范。我不是正規軍,后續會(huì )逐步完善。同時(shí)我也會(huì )抓緊時(shí)間完善注解,制作幫助文檔,編寫(xiě)Demos供查詢(xún)使用。請關(guān)注本站首頁(yè)信息。