歷史總結(jié)是了解過去經(jīng)驗的重要途徑,可以讓我們更好地應(yīng)對未來的挑戰(zhàn)。如何正確利用互聯(lián)網(wǎng)和新媒體是一個需要引起我們重視的問題,我們可以合理安排自己的上網(wǎng)時間。收集總結(jié)范文可以幫助我們了解不同類型和風格的總結(jié),從而更好地進行寫作。
大數(shù)據(jù)時代讀書心得篇一
《大數(shù)據(jù)時代》是英國維克托·邁爾-舍恩伯格教授的著作,這本書也被尊為國外大數(shù)據(jù)研究的先河之作。這本書最大的優(yōu)點就在于作者利用上百個例子來對大數(shù)據(jù)的方方面面做了詳細解說,讓外行也很容易理解。結(jié)構(gòu)上,作者通過大數(shù)據(jù)時代的思維變革、商業(yè)變革和管理變革三個角度依次闡述,條理清晰。
所謂"大數(shù)據(jù)",按作者的說法,就是"所有數(shù)據(jù)"。隨著計算機運算速度和存儲能力的發(fā)展,收集數(shù)據(jù)變得越來越簡單,儲存數(shù)據(jù)的成本越來越低。在過去,由于技術(shù)限制,人們做統(tǒng)計時只能收集有限的數(shù)據(jù)做樣本,其中要考慮隨機樣本的選擇,努力減小因樣本問題出現(xiàn)的誤差;統(tǒng)計結(jié)果往往不能重復使用,造成數(shù)據(jù)利用率低。而現(xiàn)在則可以做到"樣本=總體"。數(shù)據(jù)的增多帶來不可避免的精確性問題。"小數(shù)據(jù)"時代,一個樣本的錯誤就可以造成對總體估計的失敗,幸運的是,"大數(shù)據(jù)"時代對精確性不再那么要求苛刻——也無法要求太嚴格——數(shù)據(jù)的數(shù)量足以彌補這一缺陷。在對思維變革這一部分的闡述中,最重要也是全書的核心觀點就是大數(shù)據(jù)時代,我們應(yīng)該從追求"因果關(guān)系"的舊思維方式向追求"相關(guān)關(guān)系"轉(zhuǎn)變。在我看來,這實際上是通過大數(shù)據(jù)來透視一種事物的發(fā)展趨勢,而很多精確學科領(lǐng)域依然需要探尋"因果關(guān)系"解決更有針對性的問題,所以,這局限了這一轉(zhuǎn)變只能在特定的領(lǐng)域發(fā)生。作者自己也說,"大數(shù)據(jù)的相關(guān)性將人們指向了比探討因果關(guān)系更有前景的領(lǐng)域。"。
大數(shù)據(jù)時代的數(shù)據(jù)獲取方式是多種多樣,數(shù)據(jù)形式也是千變?nèi)f化,任何文字、行為、萬物都可以被數(shù)據(jù)化后用來分析。對這些數(shù)據(jù)的利用,不僅要考慮到其初次使用價值,更要放眼它未來可能的用途以提高數(shù)據(jù)的利用率。當然數(shù)據(jù)并不是無限使用,時效、環(huán)境的變化肯定會對數(shù)據(jù)提出新的要求,所以數(shù)據(jù)的折舊也是應(yīng)當考慮的。這又引出了對數(shù)據(jù)這一無形資產(chǎn)的估值可能性。對于facebook,twitter這樣的公司來說,數(shù)據(jù)就是他們的核心,如何在資產(chǎn)負債表上給他們一個公正的體現(xiàn)正是我們需要考慮的。
大數(shù)據(jù)時代的價值鏈由三部分構(gòu)成,我把它們簡化為"生產(chǎn)—分析—使用"三個環(huán)節(jié),這對應(yīng)書中的三種類型公司:第一種是基于數(shù)據(jù)本身的公司,第二種是基于技能,第三種則是基于思維。在大數(shù)據(jù)早期,技能和思維最有價值,但作者認為,最終,大部分的價值還是必須從數(shù)據(jù)本身來挖掘。這是假定了一個成熟的市場,人人都了解了大數(shù)據(jù)的用途。
對于普通人來說,大數(shù)據(jù)時代最關(guān)心的還是隱私問題。不知不覺中,個人的一舉一動都暴露在政府甚至私人企業(yè)之下,還面臨潛在的泄露風險。對此,作者提出了使用者承擔責任的解決辦法,而不是過去那種流于形式的使用授權(quán)。大數(shù)據(jù)甚至能預測一個人的犯罪動機,這給監(jiān)管者帶來的難題是,預測一個人要犯罪,懲罰還是不懲罰?在這點上,社會達成"個人僅需對行為而非動機負責"的共識非常重要。
大數(shù)據(jù)時代的風險控制靠的是"算法師",類似會計師一樣的職業(yè),對大數(shù)據(jù)的準確度或有效性進行鑒定。這能在一定程度上防止數(shù)據(jù)濫用的發(fā)生和數(shù)據(jù)獨裁。當今的法律亦需對大數(shù)據(jù)監(jiān)管進行修訂補充。
當代大數(shù)據(jù)發(fā)展主要由科技公司推動,相信在不久的將來更多的傳統(tǒng)領(lǐng)域會意識到大數(shù)據(jù)的重要性。但我們也應(yīng)該保持清醒,大數(shù)據(jù)并不是萬能藥,對某些領(lǐng)域或環(huán)節(jié),使用大數(shù)據(jù)是一種簡單且實用的選擇;但對某些領(lǐng)域,盲目使用大數(shù)據(jù)只會適得其反。
大數(shù)據(jù)時代讀書心得篇二
未來的十年,將是大數(shù)據(jù)引領(lǐng)下的智慧科技時代。不管你是否意識到它的存在,大數(shù)據(jù)都將越來越快地改變我們這個時代,包括我們的生活方式。
維克托·邁爾-舍恩伯格是最早洞見大數(shù)據(jù)時代發(fā)展趨勢的數(shù)據(jù)科學家之一。他通過一個大家熟知的事例,來幫助我們理解“大數(shù)據(jù)”的潛在影響力,那就是四個世紀之前望遠鏡和顯微鏡的發(fā)明。望遠鏡能夠讓我們感受宇宙,顯微鏡能夠讓我們觀測微生物,它們都是收集海量數(shù)據(jù)的新工具,因為這種工具的發(fā)明,人們同步更新了分析數(shù)據(jù)的技術(shù)和方法,促進了人們對世界更好的理解。如果說望遠鏡和顯微鏡是測量領(lǐng)域中的一場革命,那么今天的數(shù)據(jù)測量就相當于是現(xiàn)代版的望遠鏡、顯微鏡。隨著社交網(wǎng)絡(luò)的逐漸成熟,移動帶寬迅速提升,云計算、物聯(lián)網(wǎng)應(yīng)用更加豐富,以及更多的傳感設(shè)備、移動終端接入到網(wǎng)絡(luò),由此產(chǎn)生的數(shù)據(jù)及數(shù)據(jù)的增長速度比歷史上的任何時期都要多、都要快。一個大數(shù)據(jù)的時代,不經(jīng)意間順理成章地翩然而至。
一、什么是大數(shù)據(jù)?
大數(shù)據(jù)是當前最熱門的話題之一。但什么是大數(shù)據(jù),人們尚未給出確切的定義。首先,“大數(shù)據(jù)”是相對過去小的、局部性的數(shù)據(jù)而言的;其次,利用大數(shù)據(jù)進行分析和工作時,所依據(jù)的關(guān)于此事盡可能完整的數(shù)據(jù),從而“一覽眾山小”,而不是采用局部的小數(shù)據(jù),從局部推斷整體。
維克托也并未直接給出大數(shù)據(jù)的定義。不過,他用三大轉(zhuǎn)變描述了大數(shù)據(jù)的特性:
轉(zhuǎn)變之一:在大數(shù)據(jù)時代,我們可以分析更多的數(shù)據(jù),有時候甚至可以處理和某個特別現(xiàn)象相關(guān)的所有數(shù)據(jù),而不再依賴于隨機采樣。例如一項針對相撲比賽中非法操縱比賽結(jié)果的研究對64000場比賽進行了分析,這算不上一個很大的數(shù)字,但由于這是過去十年所有的比賽,所以它是大數(shù)據(jù)。
轉(zhuǎn)變之二:由于有了更多的數(shù)據(jù),我們可以接受更多的混雜、更多數(shù)據(jù)上的不精確。如果我們對于一個事物只有50個數(shù)據(jù)點,那么每一個數(shù)據(jù)點都必須非常精確,因為每個數(shù)據(jù)點都是有用的;但是如果我們有5000萬個,去掉10個,甚至去掉1000個都沒有太大的問題。
轉(zhuǎn)變之三:不再探求難以捉摸的因果關(guān)系,轉(zhuǎn)而關(guān)注事物的相關(guān)關(guān)系。分析大數(shù)據(jù)主要為了預測未來“是什么”,而不是“為什么”。因為很多時候我們以為我們找到了事情背后的原因,實際上卻沒有找到。更多時候知道了“是什么”就足夠了。例如知道流感將會擴散到哪里就足夠了,我不需要知道為什么;知道什么時候在網(wǎng)上購買機票能夠獲得最優(yōu)惠的價格就足夠了,我不需要知道為什么此時價格最低。
二、大數(shù)據(jù)帶來的變化。
大數(shù)據(jù)從根本上改變我們認識世界和改變世界的方式。很多傳統(tǒng)的習慣將被顛覆,很多舊的制度將面臨挑戰(zhàn)。舉例來說:
第一,科學探究的思路和方式受到挑戰(zhàn)。
探究是新課程改革中的一個熱詞,是促進學校教學與科學研究相融合的實踐舉措。科學探究的基本路徑是:發(fā)現(xiàn)問題,提出假設(shè),制定方案,實踐探究,分析數(shù)據(jù),得出結(jié)論。之所以會梳理出這樣一個探究的路徑,與我們對問題知曉的信息過少有關(guān)。換句話說,對所要研究的事物,我們知道的數(shù)據(jù)很少,需要從這些很小的數(shù)據(jù)出發(fā),通過猜想和假設(shè),進行試探性的研究,如果研究得出的結(jié)果和自己的假想是一致的,則說明我們的假說是正確的,這些假說會上升為對該事物描述的知識,我們掌握該事物的數(shù)據(jù)也隨之增加。
利用測量所獲得的點滴數(shù)據(jù),從一個局部來推測世界是怎樣的,這是科學探究的基本思路和方式。長期以來,我們總是通過這樣的方式來認識世界,對其有宗教般的信仰。盡管我們知道,決策者總是先有了想法,才會提出假設(shè)。如果決策者自身對所研究的事情存在著偏見,所提出的假設(shè)就很難得到實證的支持,這往往會導致探究花費了很長的時間、很大的物力和財力,也常常勞而無功。但科學研究者還是堅定不移地沿著這條道路前行,學校在教學中也將其作為科學研究的基本規(guī)范來傳授。
在大數(shù)據(jù)時代,這樣的研究方式收到了極大的挑戰(zhàn)。先舉個事例來說吧。手機輻射是否能夠致癌?關(guān)于這個問題,無論我們的假設(shè)如何,實驗的設(shè)計都很難進行。首先,樣本選擇過少,沒有統(tǒng)計學上的意義;其次,不能拿人做研究對象;第三,短時間的研究很難觀察到變化。有了大數(shù)據(jù)之后,這樣的難題就可以迎刃而解了。前段時間,丹麥就進行了這樣的研究。丹麥擁有1985年手機推出以來所有手機用戶的數(shù)據(jù)庫。他們從這個數(shù)據(jù)庫中分析了1990年至20xx年擁有手機的所用用戶的數(shù)據(jù),同時,他們還收集了這一期間醫(yī)院收集的所有癌癥患者的數(shù)據(jù),然后分析手機用戶是否比非手機用戶有更高的癌癥發(fā)病率。這兩個數(shù)據(jù)庫本身是完全獨立的,在作分析之前從來沒有想過可以做這樣的研究。結(jié)果表明,使用移動用戶和癌癥風險增加之間不存在任何關(guān)系。20xx年10月,這一研究的結(jié)果發(fā)表在《英國醫(yī)學雜志》上。
上述的案例告訴我們,在獲得了大量的數(shù)據(jù),能夠?qū)κ挛锏恼w進行全面的認識之后,假想就沒有意義了,我們可以直接根據(jù)全面的數(shù)據(jù)做出結(jié)論。
大數(shù)據(jù)時代讀書心得篇三
大數(shù)據(jù)時代成為炙手可熱的話題。筆者在這說明信息和數(shù)據(jù),只是試圖首先說明信息、數(shù)據(jù)的關(guān)系和不同,也試圖說明,為什么信息時代轉(zhuǎn)變?yōu)榱舜髷?shù)據(jù)時代?大數(shù)據(jù)時代帶給了我們什么?下面是本站小編為大家收集整理的大數(shù)據(jù)時代。
歡迎大家閱讀。
這本書里主要介紹的是大數(shù)據(jù)在現(xiàn)代商業(yè)運作上的應(yīng)用,以及它對現(xiàn)代商業(yè)運作的影響。
《大數(shù)據(jù)時代》這本書的結(jié)構(gòu)框架遵從了學術(shù)性書籍的普遍方式。也既,從現(xiàn)象入手,繼而通過對現(xiàn)象的解剖提出對這一現(xiàn)象的解釋。然后在通過解釋在對未來進行預測,并對未來可能出現(xiàn)的問題提出自己看法與對策。
下面來重點介紹《大數(shù)據(jù)時代》這本書的主要內(nèi)容。
《大數(shù)據(jù)時代》開篇就講了google通過人們在搜索引擎上搜索關(guān)鍵字留下的數(shù)據(jù)提前成功的預測了20xx年美國的h1n1的爆發(fā)地與傳播方向以及可能的潛在患者的事情。google的預測比政府提前將近一個月,相比之下政府只能夠在流感爆發(fā)一兩個周之后才可以弄到相關(guān)的數(shù)據(jù)。同時google的預測與政府數(shù)據(jù)的相關(guān)性高達97%,這也就意味著google預測數(shù)據(jù)的置信區(qū)間為3%,這個數(shù)字遠遠小于傳統(tǒng)統(tǒng)計學上的常規(guī)置信區(qū)間5%!而這個數(shù)字就是大數(shù)據(jù)時代預測結(jié)果的相對準確性與事件的可預測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數(shù)據(jù)時代“樣本=總體”的思想。我們都知道當樣本無限趨近于總體的時候,通過計算得到的描述性數(shù)據(jù)將無限的趨近于事件本身的性質(zhì)。而之前采取的“樣本總體”的做法很大程度上無法做到更進一步的描述事物,因為之前的時代數(shù)據(jù)的獲取與存儲處理本身有很大的難度只導致人們采取抽樣的方式來測量事物。而互聯(lián)網(wǎng)終端與計算機的出現(xiàn)使數(shù)據(jù)的獲取、存儲與處理難度大大降低,因而相對準確性更高的“樣本=總體”的測算方式將成為大數(shù)據(jù)時代的主流,同時大數(shù)據(jù)時代本身也是建立在大批量數(shù)據(jù)的存儲與處理的基礎(chǔ)之上的。
接下來,維克多又通過了ibm追求高精確性的電腦翻譯計劃的失敗與google只是將所有出現(xiàn)過的相應(yīng)的文字語句掃描并儲存在詞庫中,所以無論需要翻譯什么,只要有聯(lián)系google詞庫就會出現(xiàn)翻譯,雖然有的時候的翻譯很無厘頭,但是大多數(shù)時候還是正確的,所以google的電腦翻譯的計劃的成功,表明大數(shù)據(jù)時代對準確性的追求并不是特別明顯,但是相反大數(shù)據(jù)時代是建立在大數(shù)據(jù)的基礎(chǔ)住上的,所以大數(shù)據(jù)時代追求的是全方位覆蓋的數(shù)字測度而不管其準確性到底有多高,因為大量的數(shù)據(jù)會湮埋少數(shù)有問題的數(shù)據(jù)所帶來的影響。同時大量的數(shù)據(jù)也會無限的逼近事物的原貌。
之后,維克托又預測了一個在大數(shù)據(jù)時代催生的重要職業(yè)——數(shù)據(jù)科學家,這是一群數(shù)學家、統(tǒng)計學與編程家的綜合體,這一群人將能夠從獲取的數(shù)據(jù)中得到任何他們想要的結(jié)果。換言之,只要數(shù)據(jù)充足我們的一切外在的與內(nèi)在的我們不想讓他人知道的東西都見會在這一群家伙的面前展現(xiàn)得淋漓盡致。所以為了避免個人隱私在大數(shù)據(jù)時代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數(shù)據(jù)為商業(yè)部門服務(wù),而另一群人則負責審查這一些人是否合法的獲得與應(yīng)用數(shù)據(jù),是否侵犯了個人隱私。
無論如何,大數(shù)據(jù)時代將會到來,不管我們接受還是不接受!
我覺得《大數(shù)據(jù)時代》這本書寫的很好,很值得一讀。因為會給我們很多啟發(fā),比如你在相關(guān)的社交網(wǎng)站發(fā)表的言論或者照片都很有可能被“數(shù)據(jù)科學家”們利用,從而再將相關(guān)數(shù)據(jù)賣給各大網(wǎng)店。不過,事實就是我們將會成為被預測被引誘的對象。所以說,小心你在網(wǎng)上留下的痕跡。
我喜歡這本書是因為它給我展現(xiàn)了一個新的世界。
讀了《大數(shù)據(jù)時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰(zhàn)栗起來。
“在小數(shù)據(jù)時代,我們會假象世界是怎樣運作的,然后通過收集和分析數(shù)據(jù)來驗證這種假想?!薄半S著由假想時代到數(shù)據(jù)時代的過渡,我們也很可能認為我們不在需要理論了。”書中幾乎肯定要顛覆統(tǒng)計學的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學的理論已經(jīng)脫離實際”來“終結(jié)”量子力學。對此我很高興,因為統(tǒng)計學和量子力學都是我在大學學習時學到抽筋都不能及格的課目。但這兩個理論實在太大,太權(quán)威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實也不敢旗幟鮮明地提出要顛覆它們的論點,畢竟還是在前面加上了“很可能認為”這樣的保護傘。
近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應(yīng)該做到的就是要破和立,要改變自己的傳統(tǒng),跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數(shù)據(jù)是“通往未來的必然改變”,那我就必須“不受限于傳統(tǒng)的思維模式和特定領(lǐng)域里隱含的固有偏見”,跟作者一起先把統(tǒng)計學和量子力學否定掉再說。反正我也不喜歡、也學不會它們。
當我們?nèi)祟惖臄?shù)據(jù)收集和處理能力達到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調(diào)查為基礎(chǔ)的統(tǒng)計學了。但是由統(tǒng)計學和量子力學以及其他很多“我們也很可能認為我們不再需要的”理論上溯,它們幾乎都基于一個共同的基礎(chǔ)——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔心了!
《大數(shù)據(jù)時代》第16頁“大數(shù)據(jù)的核心就是預測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先后變化關(guān)系規(guī)則。兩者似乎是做同一件事??纱髷?shù)據(jù)要的“不是因果關(guān)系,而是相關(guān)關(guān)系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基于因果關(guān)系。兩者好像又是對立的。在同一件事上兩種方法對立,應(yīng)該只有一個結(jié)果,就是要否定掉其中之一。這就是讓我很擔心的原因。
可我卻不能拭目以待,像旁觀者一樣等著哪一個“脫穎而出”,因為我身處其中。問題不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個更可怕的事情。
其一:量子力學搞了一百多年,為了處理好混雜性問題,把質(zhì)量和速度結(jié)合到能量上去了,為了調(diào)和量子力學與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關(guān)系,因為爸爸就是爸爸,兒子就是兒子。那么大數(shù)據(jù)會不會通過正視混雜性,放棄因果關(guān)系最后反而搞出時間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機器的根本區(qū)別在于人有邏輯思維而機器沒有。《大數(shù)據(jù)時代》也擔心“最后做出決策的將是機器而不是人”。如果真的那一天因為放棄邏輯思維而出現(xiàn)科幻電影上描述的機器主宰世界消滅人類的結(jié)果,那我還不如現(xiàn)在就趁早跳樓。
還好我知道自己對什么統(tǒng)計學、量子力學、邏輯學和大數(shù)據(jù)來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔心根本不存在。但問題出現(xiàn)了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點迷津。
所以想向《大數(shù)據(jù)時代》的作者提一個合理化建議:把這本書繼續(xù)寫下去,至少加一個第四部分——大數(shù)據(jù)時代的邏輯思維。
在《大數(shù)據(jù)時代》一書中,大數(shù)據(jù)時代與小數(shù)據(jù)時代的區(qū)別:1、思維慣例。大數(shù)據(jù)時代區(qū)別與轉(zhuǎn)變就是,放棄對因果關(guān)系的渴求,而取而代之關(guān)注相關(guān)關(guān)系。也就是說只要知道“是什么”,而不需要知道“為什么”。作者語言絕對,卻反思其本質(zhì)區(qū)別。數(shù)據(jù)的更多、更雜,導致應(yīng)用主意只能盡量觀察,而不是傾其所有進行推理?這也是明智之舉2、使用用途。小數(shù)據(jù)停留在說明過去,大數(shù)據(jù)用驅(qū)動過去來預測未來。筆者認為數(shù)據(jù)的用途意在何為,與數(shù)據(jù)本身無關(guān),而與數(shù)據(jù)的解讀者有關(guān),而相關(guān)關(guān)系更有利于預測未來。3、結(jié)構(gòu)。大數(shù)據(jù)更多的體現(xiàn)在海量非結(jié)構(gòu)化數(shù)據(jù)本身與處理方法的整合。大數(shù)據(jù)更像是理論與現(xiàn)實齊頭并進,理論來創(chuàng)立處理非結(jié)構(gòu)化數(shù)據(jù)的方法,處理結(jié)果與未來進行驗證。4、分析基礎(chǔ)。大數(shù)據(jù)是在互聯(lián)網(wǎng)背景下數(shù)據(jù)從量變到質(zhì)變的過程。筆者認為,小數(shù)據(jù)時代也即是信息時代,是大數(shù)據(jù)時代的前提,大數(shù)據(jù)時代是升華和進化,本質(zhì)是相輔相成,而并非相離互斥。
數(shù)據(jù)未來的故事。數(shù)據(jù)的發(fā)展,給我們帶來什么預期和啟示?銀行業(yè)天然有大數(shù)據(jù)的潛質(zhì)??蛻魯?shù)據(jù)、交易數(shù)據(jù)、管理數(shù)據(jù)等海量數(shù)據(jù)不斷增長,海量機遇和挑戰(zhàn)也隨之而來,適應(yīng)變革,適者生存。我們可以有更廣闊的業(yè)務(wù)發(fā)展空間、可以有更精準的決策判斷能力、可以有更優(yōu)秀的經(jīng)營管理能力??可以這些都基于數(shù)據(jù)的收集、整理、駕馭、分析能力,基于脫穎而出的創(chuàng)新思維和執(zhí)行。因此,建設(shè)“數(shù)據(jù)倉庫”,培養(yǎng)“數(shù)據(jù)思維”,養(yǎng)成“數(shù)據(jù)治理”,創(chuàng)造“數(shù)據(jù)融合”,實現(xiàn)“數(shù)據(jù)應(yīng)用”才能擁抱“大數(shù)據(jù)”時代,從數(shù)據(jù)中攫取價值,笑看風云變換,穩(wěn)健贏取未來。
大數(shù)據(jù)時代讀書心得篇四
文中清晰的闡述了大數(shù)據(jù)的基本概念和特點,并列出明確的觀點。不管對于產(chǎn)業(yè)實踐者,還是對于政府和公眾機構(gòu),都非常具有價值。作者將本書分為3個部分。第一部分提出了大數(shù)據(jù)時代處理數(shù)據(jù)理念上的三大轉(zhuǎn)變:抽樣等于全體;要效率不要絕對精確;要相關(guān)不要因果;第二部分作者從萬事萬物數(shù)據(jù)化和數(shù)據(jù)交叉復用的巨大價值兩個方面,講述驅(qū)動大數(shù)據(jù)戰(zhàn)車在材質(zhì)和智力方面向前滾動的最根本動力;最后一部分,作者描繪了大數(shù)據(jù)帝國前夜的脆弱和不安,包括產(chǎn)業(yè)生態(tài)環(huán)境、數(shù)據(jù)安全隱私、信息公正公開等問題。
本書觀點擲地有聲,作者觀念高屋建瓴,從很多實例和經(jīng)驗中萃取普適性觀念。例子詳實豐富,囊括了進百個學術(shù)和商業(yè)實例。
引言提出了大數(shù)據(jù)將給生活、工作于思維帶來重大的變革。一個例子是20__年h1n1流行病毒背景下谷歌通過檢測檢索詞條,處理了4.5億個不同的數(shù)據(jù)模型,通過預測并與20__年、20__年美國疾控中心記錄的實際流感病例進行對比后,確定了45條檢索詞條組合,并將其用于一個特定的數(shù)學模型后,預測的結(jié)果與官方數(shù)據(jù)的相關(guān)系數(shù)高達97%。按照傳統(tǒng)的信息返回流程,通告新流感病毒病例將有一到兩周的延遲。對于飛速傳播的疾病,信息滯后兩周是致命的。而谷歌運用大數(shù)據(jù)技術(shù),以前所未有的方式,通過海量數(shù)據(jù)分析得出流感所傳播的范圍,為世界預測流感提供了一種更快捷的預測工具。此外,我聯(lián)想到原淘寶董事長馬云通過大量數(shù)據(jù)分析得出20__年經(jīng)濟疲弱,為其商家提前做好迎接經(jīng)濟危機提供了時間緩沖。(補充并清晰描述詳細)關(guān)于大數(shù)據(jù)在商業(yè)領(lǐng)域的應(yīng)用,farecast公司是一個成功的典型范例。該公司由奧倫·埃齊奧尼創(chuàng)辦,利用機票的銷售數(shù)據(jù)來預測未來的機票價格,旨在幫助用戶在購買機票方面做出預測,并對機票價格走勢預測的可信度標示出來供消費者查考。farecast系統(tǒng)利用近十萬億條價格記錄預測的準確度達75%,使得使用farecast票價預測工具購買機票的旅客,平均每張機票節(jié)約50美元。而處理如此多的數(shù)據(jù)離開了大數(shù)據(jù)技術(shù)將無法進行。
也正是由于我們進入了一個前所未有的信息化時代,人們擁有了如此多的數(shù)據(jù),才提供給我們利用大數(shù)據(jù)的分析處理手段,創(chuàng)造新的價值。也許有人以為我們大數(shù)據(jù)時代的還未來臨。其實大數(shù)據(jù)技術(shù)早已滲透到我們中間,它被應(yīng)用在垃圾郵件的過濾,新浪微博技術(shù)平臺,谷歌翻譯以及輸入文字的自動糾錯等。
文中提出的一個觀點是,預測是大數(shù)據(jù)的核心。其實從過去的時代人們就利用掌握的數(shù)據(jù)進行各種分析,從而對經(jīng)濟等各方面進行預測、矯正。只是進入了大數(shù)據(jù)時代人們掌握的數(shù)據(jù)爆炸性的速度在增長,從而數(shù)據(jù)的存儲和分析數(shù)據(jù)分方法成了釋放大數(shù)據(jù)能量的關(guān)鍵。
關(guān)于不是隨機樣本而是整體數(shù)據(jù)中。作者指出了隨機取樣是小數(shù)據(jù)時代用最少的數(shù)據(jù)獲取最大價值的做法。作者用大數(shù)據(jù)與喬布斯的癌癥治療例子說明了使用全部數(shù)據(jù)而非樣本的意義。喬布斯成為世界上第一個對自身所有dna和腫瘤dna進行排序的人。喬布斯曾開玩笑說“我要么是第一個通過這種方式戰(zhàn)勝癌癥的人,要么就是最后一個因為這種方式死于癌癥的人”。雖然最后難免死于癌癥但這種獲得所有數(shù)據(jù)而不是僅樣本的方法將他的生命延長了幾年。同樣,從事跨境匯款業(yè)務(wù)的xoom公司偵破一起犯罪集團的詐騙也是由于使用了整體數(shù)據(jù)。初此之外,他還列舉了日本“相撲”等來證明使用全體數(shù)據(jù)的重要性。
作者同時也指出隨著數(shù)據(jù)使用的越來越多,其得出的結(jié)果并一定能越來越精確,畢竟數(shù)據(jù)不能保證百分之百的正確,特別是大數(shù)據(jù)時代各種結(jié)構(gòu)化與非結(jié)構(gòu)化類型的數(shù)據(jù)聚集在一起難免導致結(jié)果的不太精確。大數(shù)據(jù)時代要求我們重新審視精確性的優(yōu)劣。作者特別舉了谷歌翻譯成功的例子。谷歌翻譯之所以優(yōu)于ibm的candide系統(tǒng)并不是因為它擁有更好的算法機制。和微軟的班科和布里爾一樣,谷歌翻譯增加了各種各樣的數(shù)據(jù),并且接受了有錯誤的數(shù)據(jù)。(其語庫來自于未經(jīng)過濾的網(wǎng)頁內(nèi)容,會包含一些不完整的句子、拼寫錯誤、語法錯誤以及其他各種錯誤)。
在不是因果關(guān)系,而是相關(guān)關(guān)系的篇章中。作者指出在大數(shù)據(jù)時代往往知道是什么要比知道為什么來的更實在。作者列舉了林登的亞馬遜推薦系統(tǒng)的成功,證實了大數(shù)據(jù)在分析相關(guān)性方面的優(yōu)勢以及在銷售中獲得的成功。沃爾瑪也是充分利用并挖掘各類數(shù)據(jù)信息的先鋒和代表,從以前廣為人事的啤酒和尿布的案例,以及作者舉的有關(guān)蛋撻和颶風天氣的案例,都說明了掌握了相關(guān)關(guān)系對于其策略的幫助。建立在相關(guān)關(guān)系分析法基礎(chǔ)上的預測是大數(shù)據(jù)的核心。aviva保險公司利用幾百種生活方式的數(shù)據(jù),如愛好、長瀏覽網(wǎng)頁等間接的預測出哪些人更可能患高血壓、糖尿病和抑郁癥。ups國家快遞公司通過使用預測性分析檢測其全美6萬輛車隊。進行防御性的修理,節(jié)約巨大得的成本。這些都充分顯示了大數(shù)據(jù)在預測方面的優(yōu)勢。
本書第二部分講的是大數(shù)據(jù)時代的商業(yè)變革。
作者用莫里繪制導航圖的例子告訴我們,遠在信息數(shù)字化之前,對數(shù)據(jù)的運用就已經(jīng)開始了。莫里利用大量的人力去分析多年保存的航海記錄,他從這些大量的數(shù)據(jù)中獲取到新的利用價值。繪制的圖表幫助商人節(jié)約一大筆錢,使年輕的海員們間接獲取了成千上萬名經(jīng)驗豐富的航海家的指導。日本先進工業(yè)技術(shù)研究所越水重臣教授通過安裝壓力傳感器將人屁股特征數(shù)據(jù)化,進而形成對乘客身份的特征識別。這項技術(shù)為汽車防盜系統(tǒng)提供了方案。公司,致力于為顧客預測商品的價格,通過收集處理海量的價格信息,預測準確率高達77%,幫助顧客在購買一個產(chǎn)品時節(jié)約了大約100美元。r部門通過分析來自210個國家的15億信用卡用戶的650億條交易記錄,分析得出商業(yè)發(fā)展和客戶消費趨勢,如通過分析發(fā)現(xiàn)如果一個人下午四點左右給汽車加油的話,他很可能在接下來的一個小時內(nèi)去購物或者去餐館吃飯,且在這一小時里大約花費35到40美元。商家正可以利用這個分析結(jié)果,在加油的小票背面附加上附近商店的優(yōu)惠券。
這些例子都證明了大數(shù)據(jù)蘊藏著巨大的商業(yè)價值。根據(jù)提供價值的不同來源,大數(shù)據(jù)價值鏈包括三大構(gòu)成部分。包括第一種是基于數(shù)據(jù)本身的公司。這些公司擁有大量數(shù)據(jù)或者至少可以收集到大量數(shù)據(jù),卻不一定有從數(shù)據(jù)中提取價值或者用數(shù)據(jù)催生創(chuàng)新思想的技能。第二種是基于技能的公司。它們通常是咨詢公司、技術(shù)供應(yīng)商或者分析公司。它們掌握了專業(yè)技能但并不一定擁有數(shù)據(jù)或者提出數(shù)據(jù)創(chuàng)性用途的才能。比如說,沃爾瑪和pop-tarts這兩個零售商就是借助天睿公司的分析來獲得營銷點子,天睿就是一家大數(shù)據(jù)分析公司。第三種是基于思維的公司。皮特.華登,jetpac的聯(lián)合創(chuàng)始人,就是通過想法獲得價值的一個例子,他通過用戶分享到網(wǎng)上的旅行照片來為人們推薦下一次旅行目的地。對于某些公司來說,數(shù)據(jù)和技能并不是成功的關(guān)鍵。挖掘數(shù)據(jù)的新價值的創(chuàng)新思維才是這些公司脫穎而出的優(yōu)勢所在。
大數(shù)據(jù)成為許多公司競爭力的來源,未來可能整個行業(yè)的結(jié)構(gòu)會發(fā)生改變,大公司和小公司最有可能成為贏家。如今的核心競爭力在于快速而廉價地進行大量的數(shù)據(jù)存儲和處理。當然公司要根據(jù)自己的情況進行調(diào)整。大數(shù)據(jù)向小數(shù)據(jù)時代的贏家以及那些線下大公司(如沃爾瑪、聯(lián)邦快遞、寶潔公司、雀巢公司、波音公司)提出了挑戰(zhàn)。同時,大數(shù)據(jù)也為小公司帶來了機遇。大數(shù)據(jù)也將會影響國家競爭力。當制造業(yè)已經(jīng)大幅轉(zhuǎn)向發(fā)展中國家,而大家都爭相發(fā)展創(chuàng)新行業(yè)的時候,工業(yè)化國家因為掌握了數(shù)據(jù)以及大數(shù)據(jù)技術(shù),所以仍然在全球競爭中占據(jù)優(yōu)勢,但這個優(yōu)勢很難持續(xù)。隨著技術(shù)的發(fā)展,西方世界在大數(shù)據(jù)技術(shù)的優(yōu)勢將會慢慢消失。對于大公司而言,好消息是大數(shù)據(jù)技術(shù)可以加劇優(yōu)勝劣汰。一旦公司掌握了大數(shù)據(jù),它不但可能超過對手還可能遙遙領(lǐng)先。
文章第三部分講了大數(shù)據(jù)帶來無數(shù)好處的同時帶來的不良影響以及如何面對這些影響。包括如數(shù)據(jù)的收益的處理問題以及數(shù)據(jù)中用戶資料的隱私和決策過程帶來的影響。作者在保護個人隱私方面提出了幾種想法。一種是使用數(shù)據(jù)時征詢數(shù)據(jù)所有個人的知曉和授權(quán)。第二個技術(shù)途徑就是匿名化。作者同時也指出了這兩種方式的難度。一方面收集到的數(shù)據(jù)可能會被后續(xù)的多次利用。另一方面,匿名化會在數(shù)據(jù)收集越來越多和數(shù)據(jù)的相互結(jié)合關(guān)聯(lián)使用時變得無效。作者列列舉電影《少數(shù)派報告》的情節(jié)說明越來越依賴數(shù)據(jù)時,大數(shù)據(jù)可能將我們禁錮在可能性之中。當然通過分析犯罪的常發(fā)地與常發(fā)時間,合理安排警力會對治安防范提供不小的幫助。作者還指出不能盡信數(shù)據(jù)的分析結(jié)果,因為不能保證獲取分析結(jié)果來源的數(shù)據(jù)準確性。大數(shù)據(jù)在給我們生活提供便利的同時,也讓隱私保護的法律手段失去了作用。我們必須杜絕對數(shù)據(jù)的過分依賴。
在高速邁進大數(shù)據(jù)時代的同時,人類信息管理準則需要重新定位,這將帶動社會核心價值觀的轉(zhuǎn)變。大數(shù)據(jù)時代,對原有規(guī)范的修修補補已經(jīng)不足以抑制大數(shù)據(jù)帶來的風險。保護個人隱私就需要對個人數(shù)據(jù)處理器對其政策和行為承擔更多責任。同時必須重新定義公正的概念,以確保人類行為的自由。作者提出了解決這些問題的方向。如個人隱私保護方面,可以讓使用者承擔更多的社會責任。將責任從民眾轉(zhuǎn)移到數(shù)據(jù)使用者有很多意義,也有充分的理由。因為他們更清楚將如何使用數(shù)據(jù)且是數(shù)據(jù)應(yīng)用最大的受益者。關(guān)于公正方面簡單的講就是個人可以并應(yīng)為他們的行為而非傾向負責。就像公司有內(nèi)部會計和外部審計人員一樣,大數(shù)據(jù)時代,公司將設(shè)置專門的人員--內(nèi)部和外部算法師對大數(shù)據(jù)活動進行監(jiān)督。還有可能出現(xiàn)第三方的機構(gòu)對大數(shù)據(jù)行為進行監(jiān)督和衡量。作者甚至考慮到對大數(shù)據(jù)存在的壟斷情況進行分析并在反壟斷反面給了建議。最后結(jié)語中作者提出大數(shù)據(jù)提供給人們的只是參考答案,提醒我們在利用這個工具時要銘記人類的作用是無法完全替代的。
大數(shù)據(jù)時代是信息化社會發(fā)展必然趨勢,我們只有緊緊跟隨時代發(fā)展的潮流,在技術(shù)上、制度上、價值觀念上做出迅速調(diào)整并牢牢跟進,才能在接下來新一輪的國際競爭中擺脫受制于人的弱勢境地,才能把握發(fā)展的方向,沖破與西方國家的差距。對于一個國家如此,對于一個企業(yè)亦是如此。在如此快速的到來的大數(shù)據(jù)時代,我們還有很多知識需要學習,許多思維需要轉(zhuǎn)變,許多技術(shù)需要研究。公司的規(guī)劃中,也需充分考慮到大數(shù)據(jù)對于公司的未來發(fā)展所帶來的機遇和挑戰(zhàn)。對于掌握大量數(shù)據(jù)的公司,需要考慮有多少數(shù)字化的數(shù)據(jù),又有哪些可以通過大數(shù)據(jù)的分析處理而帶來有價值的用途?比如國內(nèi)目前的社交網(wǎng)站,購物網(wǎng)站等都掌握了用戶的大量的數(shù)據(jù)信息。在大數(shù)據(jù)時代制勝的良藥也許是創(chuàng)新的點子,也許可以利用外部的數(shù)據(jù),通過多維化、多層面的分析給其他企業(yè)或個人帶來價值。
大數(shù)據(jù)時代讀書心得篇五
對于暢銷書刊、熱點話題、時尚科技,始終不太感興趣。書刊,喜歡有一定年份的。話題,鐘情于務(wù)虛的觀點。新奇的產(chǎn)品于我無緣,習慣使用成熟的科技產(chǎn)品。既不清高,也非冷漠,就是要與現(xiàn)實保持一定的距離,給自己留一點思考的空間。這一習慣最近破了例。由于工作的原因,耳濡目染,“大數(shù)據(jù)”這個新興概念開始頻繁步入我的視野。按捺不住內(nèi)心的好奇,網(wǎng)購《大數(shù)據(jù)時代》,手不釋卷,三天讀完,頗有收獲。此書有如下特點。
首先,作者站在理論的制高點上,條理清楚地闡述了大數(shù)據(jù)對人類的工作、生活、思維帶來的革新,大數(shù)據(jù)時代的三種典型的商業(yè)模式,以及大數(shù)據(jù)時代對于個人隱私保護、公共安全提出的挑戰(zhàn)。其次,文中的事例貼近現(xiàn)實生活,貼近時代,令讀者既印象深刻,又感同身受。此外,作者沒有使用大量的專業(yè)術(shù)語,沒有假裝一副專業(yè)的面孔。縱觀全書,遣詞造句,均通俗易懂。
作者認為大數(shù)據(jù)時代具有三個顯著特點。
一、人們研究與分析某個現(xiàn)象時,將使用全部數(shù)據(jù)而非抽樣數(shù)據(jù)。
二、在大數(shù)據(jù)時代,不能一味地追求數(shù)據(jù)的精確性,而要適應(yīng)數(shù)據(jù)的多樣性、豐富性、甚至要接受錯誤的數(shù)據(jù)。
三、了解數(shù)據(jù)之間的相關(guān)性,勝于對因果關(guān)系的探索?!笆鞘裁础北取盀槭裁础敝匾?。
作者指出,隨著技術(shù)的發(fā)展,數(shù)據(jù)的存儲與處理成本顯著降低,人們現(xiàn)在有能力從支離破碎的、看似毫不相干的數(shù)據(jù)礦渣中抽煉出真知爍見。在大數(shù)據(jù)時代,三類公司將成為時代的寵兒。一是擁有大數(shù)據(jù)的公司與組織。如政府、銀行、電信公司、全球性互聯(lián)網(wǎng)公司(阿里巴巴、淘寶網(wǎng))。二是擁有數(shù)據(jù)分析與處理技術(shù)的專業(yè)公司,如亞馬遜、谷歌。三是擁有創(chuàng)新思維的公司,他們可能既不掌握大數(shù)據(jù),也沒有專業(yè)技術(shù),但卻擅長使用大數(shù)據(jù),從大數(shù)據(jù)中找到自己的理想天地。
面對即將來臨的大數(shù)據(jù)時代,個人將如何應(yīng)對自如?這是個嚴肅的問題。
大數(shù)據(jù)時代讀書心得篇六
“大數(shù)據(jù)”概念早在1980年就有國外的學者提出,可是最近幾年才廣泛受到大家的關(guān)注。當“大數(shù)據(jù)”這個概念傳到中國的時候,瞬間引起了轟動。隨即,各種有關(guān)“大數(shù)據(jù)”的資料和書籍充斥的我們的視野。隨意打開某個電子商務(wù)平臺圖書類頁面,在搜索框中搜索“大數(shù)據(jù)”三個字,就會出現(xiàn)好多本有關(guān)“大數(shù)據(jù)”的書籍??墒牵幸粋€很有趣的現(xiàn)象就是:幾乎所有的平臺上,出現(xiàn)的第一本關(guān)于“大數(shù)據(jù)”的書籍一定是《大數(shù)據(jù)時代》。一點進去,這本書推薦欄里的第一句話就是:迄今為止全世界最好的一本大數(shù)據(jù)專著。同時,為這本書做推薦的都是各行業(yè)的精英領(lǐng)袖。所有“大數(shù)據(jù)”方面的書籍也是這本書銷量最高,評價最好。
我從來不會因為哪本書暢銷和很多人推薦就盲目跟風的去看一本書。因為我知道通常在這種情況下選擇一本書,整個閱讀的體會和感受是無法遵從自己的內(nèi)心的,整個過程都很容易夾雜著別人對這本書的感受。所以通常我讀書的節(jié)奏大多都是跟不上“潮流”的,但往往經(jīng)過風雨洗禮之后沉淀下來的都是精華。坦白講,閱讀這本書的初衷并不是因為我想從書中獲取到多少大數(shù)據(jù)方面的精華,只是很想知道對于這么一個很直白的名詞,作者是怎么寫出這么厚的一本書的。這種初衷或許很無知和幼稚,可就是這種“愚蠢”的好奇心,讓我更透徹的看到書中的精華。
在看《大數(shù)據(jù)時代》這本書之前,我的所有讀后感都是集中在書籍給了我什么思考。對于這本書的讀后感,除了觀點碰撞之外,我還會加上大部分個人看這本書的體會。因為這本書,已經(jīng)完全讓我模糊了大多數(shù)人口中的“全世界最好的書”是一種什么標準。也許《大數(shù)據(jù)時代》真的無法承載那么高的贊美!
大數(shù)據(jù)時代的入門書。
看完這本書,我隨意調(diào)查了一些閱讀過這本書并且給這本書絕對好評的朋友。詢問他們這本書好在哪里?大多數(shù)的回答是說《大數(shù)據(jù)時代》這本書讓對大數(shù)據(jù)一無所知的他們了解了大數(shù)據(jù)這個概念,同時通過很多案例說明原來大數(shù)據(jù)能有這么大的用處,影響會有這么大!僅此而已。我看完這本書最大的感受是這本書分為上、下兩部分。前120多頁為上部分,后120多頁為下部分。之所以說《大數(shù)據(jù)時代》是一本關(guān)于大數(shù)據(jù)的入門書,是因為這本書用了前面120多頁的篇幅反復的強調(diào)大數(shù)據(jù)的出現(xiàn)對社會發(fā)展影響很大,并且要人們轉(zhuǎn)變小數(shù)據(jù)時代慣有的思想。所以整本書的前半部分就強調(diào)大數(shù)據(jù)時代的三個轉(zhuǎn)變:1、大數(shù)據(jù)利用所有的數(shù)據(jù),而不再僅僅依靠一小部分數(shù)據(jù),不再依賴于隨機采樣。2、大數(shù)據(jù)數(shù)據(jù)多,不再熱衷于追求精確性,也不再期待精確性。3、大數(shù)據(jù)時代不再熱衷于尋找因果關(guān)系,而是追求相關(guān)關(guān)系。所以整個上半部分沒什么可詳說的。我們重點聊聊本書的后半部分。
既然一直都在強調(diào)大數(shù)據(jù)對我們的意義,總要有具體體現(xiàn)。整本書中,我感觸最大的一個案例就是某公司通過分析大數(shù)據(jù)發(fā)現(xiàn):新品發(fā)布的時候,舊一代的產(chǎn)品可能會出現(xiàn)短暫的價格上漲。因為人們在心理上就認為新產(chǎn)品的推出,舊產(chǎn)品就會便宜,從而就會提高購買量。這個發(fā)現(xiàn)和我們平常的心理是完全違背的,而且如果不用數(shù)據(jù)來證明,直接講道理給大家可能還是無法相信。這就是大數(shù)據(jù)對我們很多傳統(tǒng)思維的顛覆。一旦涉及到思維的改變,往往就會引起整個社會的大變動。
大數(shù)據(jù)這個概念的出現(xiàn),讓大數(shù)據(jù)逐漸發(fā)展形成一條價值鏈。在這條價值鏈上,數(shù)據(jù)本身、技能和思維是最重要的環(huán)節(jié)。隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,越來越多的公司都能收集到大量的數(shù)據(jù),這些數(shù)據(jù)也會越來越公開??墒窃谶@些公司中,不是所有的公司都有從數(shù)據(jù)中提取價值或者用數(shù)據(jù)催生創(chuàng)新思想的技能。于是就會出現(xiàn)以下兩種公司,一種是掌握了專業(yè)技能但不一定擁有數(shù)據(jù)或者提出數(shù)據(jù)創(chuàng)新性用途才能的公司,另一種就是擁有超前思維,懂得怎樣挖掘數(shù)據(jù)的新價值的創(chuàng)新公司。短時間內(nèi),我們可能會感覺擁有創(chuàng)新思維,懂得挖掘出數(shù)據(jù)新價值的大數(shù)據(jù)思維是最重要的??墒堑鹊疆a(chǎn)業(yè)成熟之后,所有人都知曉了大數(shù)據(jù)的意義,所有人便開始挖掘自己的大數(shù)據(jù)思維。同時,隨著科技的進步,掌握大數(shù)據(jù)技術(shù)的也將成為常態(tài)。所以到后來,整個價值鏈的核心環(huán)節(jié)還是回到了數(shù)據(jù)本身。而到那時候,大數(shù)據(jù)的公開性也就越來越小。
在大談完大數(shù)據(jù)對人類發(fā)展的積極意義之后,作者也考慮到大數(shù)據(jù)時代的風險。這一部分是作者腦洞大開的精彩之處,同時也是最荒謬的一部分。書中說大數(shù)據(jù)時代將要懲罰未來犯罪,這樣可以在嫌疑人在可能犯罪之前就把犯罪行為給防止。這樣的社會,大數(shù)據(jù)儼然已經(jīng)延伸到了我們每個人生活的點滴。幾乎我們在生活中所做的一切都在大數(shù)據(jù)的“監(jiān)控”之下,我想到那時候,別說我們每個人的隱私已經(jīng)沒有的了,嚴重一點可以說是我們可能連人都不算了。在我們?nèi)说纳鐣傩灾校杂蓹?quán)利是一項很重要的指標。通過大數(shù)據(jù)懲罰人的未來犯罪已經(jīng)否定了人的自由選擇能力和人的行為責任自負。同時,由于數(shù)據(jù)是永久保存,大數(shù)據(jù)預測也是通過每個人之前的數(shù)據(jù)來判斷,所以大數(shù)據(jù)同樣也否定了人的求善心理。還有,從現(xiàn)在各種大數(shù)據(jù)預測的結(jié)果來看,很多發(fā)言人都說大數(shù)據(jù)不是百分百的準確。所以利用大數(shù)據(jù)來判斷人的行為發(fā)展已經(jīng)違背了大數(shù)據(jù)不追求精確性的特征,這也是書中自相矛盾的地方。
對于一個新事物,如果能讓大家了解這個事物并且對此產(chǎn)生興趣,這已經(jīng)算是一本不錯的入門書了。
從小到大,雞湯對于我們來說一直都挺珍貴的。身體虛弱了,喝點雞湯能夠補充營養(yǎng)。心靈受傷了,看點心靈雞湯可以鼓舞人心??墒墙鼛啄?,人們生活水平提高了,營養(yǎng)富余,雞湯已經(jīng)不是人們補營養(yǎng)的期待了。同樣,心靈雞湯也是如此。
心靈雞湯其實是一個很虛偽的東西。很多人都被心靈雞湯誘人的外表給迷惑。在我看來,心靈雞湯很大的一個特征就是:立人的志,但是就不告訴你實現(xiàn)志的方法。很多人每次在失意的時候就喜歡看心靈雞湯,希望能得到慰藉??赐旰笠灿X得醍醐灌頂,感覺整個世界都亮了。但又有幾個人想過喝完這些雞湯之后你除了看似重拾夢想,你還獲得了什么?你知道怎么去做嗎?《大數(shù)據(jù)時代》就是這樣一本書。整本書從頭到尾都在向讀者講述大數(shù)據(jù)的意義,當然期間也會用相應(yīng)的案例來證明大數(shù)據(jù)確實有這樣的能力。但是,整本書從沒有涉及到技術(shù)層面的問題。或許對于大數(shù)據(jù)這種依靠互聯(lián)網(wǎng)技術(shù)的新事物,即使向讀者講技術(shù),也沒有幾個人看得懂,可是整本書沒有一點關(guān)于大數(shù)據(jù)思維的技能引導。給出的案例中只有少數(shù)案例向讀者講述了這個公司為什么要利用大數(shù)據(jù)來解決這種問題,大多數(shù)都只是告訴讀者國外某家公司運用大數(shù)據(jù)得出了某種結(jié)論。同時,在本書中文譯作者寫的序里,強調(diào)自己翻譯這本著作的一大優(yōu)點是可以結(jié)合國內(nèi)的案例來分析書中的理論,結(jié)果,看到最后一頁都沒有看到一個國內(nèi)企業(yè)關(guān)于大數(shù)據(jù)運用的案例。
之所以我稱之為“心靈雞湯”,還有一個原因就是作者在書中大講特講的大數(shù)據(jù)的作用,事實上按照現(xiàn)在的經(jīng)濟發(fā)展水平和社會文明發(fā)展程度是很難實現(xiàn)的。書中很多時候的理論都是要建立在社會各項文明都發(fā)展健全的基礎(chǔ)上才能實現(xiàn)。
大數(shù)據(jù)的“傳銷手冊”
看到這個標題,大家可能會覺得我夸大其詞,受到如此多人好評的書怎么是“傳銷手冊”呢?對于這個表達,我只想說兩點:1、此說法僅代表我個人觀點,是否認同是個人問題。2、此說法主要針對本書的上部分。
我們都知道傳銷組織在發(fā)展下線的前期是要花大力氣去培訓的,也就是洗腦。而對于一個陌生又很難以理解的事物,最好的“洗腦”方式就是重復?!洞髷?shù)據(jù)時代》這本書就是運用這種方式,前半部分為了讓讀者能夠接受“大數(shù)據(jù)”這個概念,作者反反復復提醒讀者大數(shù)據(jù)不是隨機采樣、不追求精確和不尋找因果關(guān)系。同時用很多看似很通俗易懂其實看完后還是不知道說了什么的案例來讓人信服大數(shù)據(jù)的作用。書中的后半部分雖然也是用這種方式來感染讀者,可后半部分中作者的暢想和對大數(shù)據(jù)的威脅分析還是對讀者有一些實質(zhì)意義的,所以后半部分的“傳銷”影響就不是很重要。
大數(shù)據(jù)時代是未來的趨勢,這誰都不會否認。大數(shù)據(jù)改造了我們的生活,改變著我們的世界。不管它是以一種什么樣的姿態(tài)面向世界,它都沒有錯,因為大數(shù)據(jù)只是一種工具。但當人類開始質(zhì)疑甚至恐懼大數(shù)據(jù)的時候,人類就該思考自己是否利用好這個好工具了。
大數(shù)據(jù)時代讀書心得篇七
在《大數(shù)據(jù)時代》一書中,大數(shù)據(jù)時代與小數(shù)據(jù)時代的區(qū)別:1、思維慣例。大數(shù)據(jù)時代區(qū)別與轉(zhuǎn)變就是,放棄對因果關(guān)系的渴求,而取而代之關(guān)注相關(guān)關(guān)系。也就是說只要知道“是什么”,而不需要知道“為什么”。作者語言絕對,卻反思其本質(zhì)區(qū)別。數(shù)據(jù)的更多、更雜,導致應(yīng)用主意只能盡量觀察,而不是傾其所有進行推理?這也是明智之舉2、使用用途。小數(shù)據(jù)停留在說明過去,大數(shù)據(jù)用驅(qū)動過去來預測未來。筆者認為數(shù)據(jù)的用途意在何為,與數(shù)據(jù)本身無關(guān),而與數(shù)據(jù)的解讀者有關(guān),而相關(guān)關(guān)系更有利于預測未來。3、結(jié)構(gòu)。大數(shù)據(jù)更多的體現(xiàn)在海量非結(jié)構(gòu)化數(shù)據(jù)本身與處理方法的整合。大數(shù)據(jù)更像是理論與現(xiàn)實齊頭并進,理論來創(chuàng)立處理非結(jié)構(gòu)化數(shù)據(jù)的方法,處理結(jié)果與未來進行驗證。4、分析基礎(chǔ)。大數(shù)據(jù)是在互聯(lián)網(wǎng)背景下數(shù)據(jù)從量變到質(zhì)變的過程。筆者認為,小數(shù)據(jù)時代也即是信息時代,是大數(shù)據(jù)時代的前提,大數(shù)據(jù)時代是升華和進化,本質(zhì)是相輔相成,而并非相離互斥。
數(shù)據(jù)未來的故事。數(shù)據(jù)的發(fā)展,給我們帶來什么預期和啟示?銀行業(yè)天然有大數(shù)據(jù)的潛質(zhì)。客戶數(shù)據(jù)、交易數(shù)據(jù)、管理數(shù)據(jù)等海量數(shù)據(jù)不斷增長,海量機遇和挑戰(zhàn)也隨之而來,適應(yīng)變革,適者生存。我們可以有更廣闊的業(yè)務(wù)發(fā)展空間、可以有更精準的決策判斷能力、可以有更優(yōu)秀的經(jīng)營管理能力??可以這些都基于數(shù)據(jù)的收集、整理、駕馭、分析能力,基于脫穎而出的創(chuàng)新思維和執(zhí)行。因此,建設(shè)“數(shù)據(jù)倉庫”,培養(yǎng)“數(shù)據(jù)思維”,養(yǎng)成“數(shù)據(jù)治理”,創(chuàng)造“數(shù)據(jù)融合”,實現(xiàn)“數(shù)據(jù)應(yīng)用”才能擁抱“大數(shù)據(jù)”時代,從數(shù)據(jù)中攫取價值,笑看風云變換,穩(wěn)健贏取未來。
大數(shù)據(jù)時代讀書心得篇八
讀了《大數(shù)據(jù)時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰(zhàn)栗起來。
“在小數(shù)據(jù)時代,我們會假象世界是怎樣運作的,然后通過收集和分析數(shù)據(jù)來驗證這種假想?!薄半S著由假想時代到數(shù)據(jù)時代的過渡,我們也很可能認為我們不在需要理論了。”書中幾乎肯定要顛覆統(tǒng)計學的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學的理論已經(jīng)脫離實際”來“終結(jié)”量子力學。對此我很高興,因為統(tǒng)計學和量子力學都是我在大學學習時學到抽筋都不能及格的課目。但這兩個理論實在太大,太權(quán)威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實也不敢旗幟鮮明地提出要顛覆它們的論點,畢竟還是在前面加上了“很可能認為”這樣的保護傘。
近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應(yīng)該做到的就是要破和立,要改變自己的傳統(tǒng),跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數(shù)據(jù)是“通往未來的必然改變”,那我就必須“不受限于傳統(tǒng)的思維模式和特定領(lǐng)域里隱含的固有偏見”,跟作者一起先把統(tǒng)計學和量子力學否定掉再說。反正我也不喜歡、也學不會它們。
當我們?nèi)祟惖臄?shù)據(jù)收集和處理能力達到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調(diào)查為基礎(chǔ)的統(tǒng)計學了。但是由統(tǒng)計學和量子力學以及其他很多“我們也很可能認為我們不再需要的”理論上溯,它們幾乎都基于一個共同的基礎(chǔ)——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔心了!
《大數(shù)據(jù)時代》第16頁“大數(shù)據(jù)的核心就是預測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先后變化關(guān)系規(guī)則。兩者似乎是做同一件事。可大數(shù)據(jù)要的“不是因果關(guān)系,而是相關(guān)關(guān)系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基于因果關(guān)系。兩者好像又是對立的。在同一件事上兩種方法對立,應(yīng)該只有一個結(jié)果,就是要否定掉其中之一。這就是讓我很擔心的原因。
可我卻不能拭目以待,像旁觀者一樣等著哪一個“脫穎而出”,因為我身處其中。問題不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個更可怕的事情。
其一:量子力學搞了一百多年,為了處理好混雜性問題,把質(zhì)量和速度結(jié)合到能量上去了,為了調(diào)和量子力學與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關(guān)系,因為爸爸就是爸爸,兒子就是兒子。那么大數(shù)據(jù)會不會通過正視混雜性,放棄因果關(guān)系最后反而搞出時間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機器的根本區(qū)別在于人有邏輯思維而機器沒有?!洞髷?shù)據(jù)時代》也擔心“最后做出決策的將是機器而不是人”。如果真的那一天因為放棄邏輯思維而出現(xiàn)科幻電影上描述的機器主宰世界消滅人類的結(jié)果,那我還不如現(xiàn)在就趁早跳樓。
還好我知道自己對什么統(tǒng)計學、量子力學、邏輯學和大數(shù)據(jù)來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔心根本不存在。但問題出現(xiàn)了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點迷津。
所以想向《大數(shù)據(jù)時代》的作者提一個合理化建議:把這本書繼續(xù)寫下去,至少加一個第四部分——大數(shù)據(jù)時代的邏輯思維。
大數(shù)據(jù)時代讀書心得篇九
去年的“云計算”炒得熱火朝天的,今年的“大數(shù)據(jù)”又突襲而來。仿佛一夜間,各廠商都紛紛改旗換幟,推起“大數(shù)據(jù)”來了。于是乎,各企業(yè)的cio也將熱度紛紛轉(zhuǎn)向關(guān)注“大數(shù)據(jù)”來了。有一張來自《程序員》微博的漫畫很形象。我覺得這張圖,很真實地反映了現(xiàn)實中小企業(yè)云計算,大數(shù)據(jù)的現(xiàn)狀。
不過話又還得說回來,《大數(shù)據(jù)時代》是本好書。
當然,很多it知名人士也大力推薦,寫了好多讀后感來表述對這本書的喜歡沒看此書之前,對所謂大數(shù)據(jù)的概念基本上是一頭霧水,雖則有了解關(guān)注過現(xiàn)在也比較火熱的bi,覺得也差不多,可能就是更多的數(shù)據(jù),更細致的數(shù)據(jù)分析與數(shù)據(jù)挖掘。看過此書后,感覺到之前的想法,只能算是中了一小半吧---巨量的數(shù)據(jù),而另一前:著眼于數(shù)據(jù)關(guān)聯(lián)性,而非數(shù)據(jù)精確性,或許才是大數(shù)據(jù)與現(xiàn)時bi最大的不同,不僅僅是方法,更多的時思想方法。不過坦白講,到底是數(shù)據(jù)的關(guān)聯(lián)性重佳,還是數(shù)據(jù)的精確性更好,還真的需要時間來檢驗一下,至少從現(xiàn)在的數(shù)據(jù)分析方法來論,更多的傾向于數(shù)據(jù)的精確性??赐甏藭?,我心中的一些問題:
1.什么是大數(shù)據(jù)?
查了查百度百科,是這樣定義的:大數(shù)據(jù)(bigdata),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時間內(nèi)達到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。大數(shù)據(jù)的4v特點:volume、velocity、variety、veracity--這個好像是ibm的定義吧。
以個人的觀點來看:數(shù)據(jù)海量,存儲海量都是大數(shù)據(jù)的基本原型吧。
2.大數(shù)據(jù)適合什么樣的企業(yè)?
3.大數(shù)據(jù)帶來的影響。
1)預測未來書中以google成功預測了未來可能發(fā)生流感的案例來開篇,表明通過大數(shù)據(jù)的應(yīng)用,可以為我們的生活起一個保駕護航的指向標。實質(zhì)很簡單,技術(shù)改變世界。
3)變革思維書中所說:因為有海量的數(shù)據(jù)作基礎(chǔ),未來,我們可能更關(guān)注數(shù)據(jù)的相關(guān),而非精細度。對這條,本人還是持保留意見的。
大數(shù)據(jù)時代讀書心得篇十
4月13日下午,在湖南大學東樓205參加了關(guān)于《大數(shù)據(jù)時代》的讀書交流活動。通過相互交流學習,使我更深層次的理解了大數(shù)據(jù)時代的利與弊,機遇和挑戰(zhàn)。在寫心得體會前,我想再重新審視一下關(guān)于大數(shù)據(jù)的歷史沿革和現(xiàn)實意義。
首先,最早提出“大數(shù)據(jù)”時代到來的是全球知名咨詢公司麥肯錫,麥肯錫稱:“數(shù)據(jù),已經(jīng)滲透到當今每一個行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對于海量數(shù)據(jù)的挖掘和運用,預示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來?!薄按髷?shù)據(jù)”在物理學、生物學、環(huán)境生態(tài)學等領(lǐng)域以及軍事、金融、通訊等行業(yè)存在已有時日,卻因為近年來互聯(lián)網(wǎng)和信息行業(yè)的發(fā)展而引起人們關(guān)注。大數(shù)據(jù)作為云計算、物聯(lián)網(wǎng)之后又it行業(yè)又一大顛覆性的技術(shù)革命。云計算主要為數(shù)據(jù)資產(chǎn)提供了保管、訪問的場所和渠道,而數(shù)據(jù)才是真正有價值的資產(chǎn)。企業(yè)內(nèi)部的經(jīng)營交易信息、物聯(lián)網(wǎng)世界中的商品物流信息,互聯(lián)網(wǎng)世界中的人與人交互信息、位置信息等,其數(shù)量將遠遠超越現(xiàn)有企業(yè)it架構(gòu)和基礎(chǔ)設(shè)施的承載能力,實時性要求也將大大超越現(xiàn)有的計算能力。如何盤活這些數(shù)據(jù)資產(chǎn),使其為國家治理、企業(yè)決策乃至個人生活服務(wù),是大數(shù)據(jù)的核心議題,也是云計算內(nèi)在的靈魂和必然的升級方向。
其次,進入20xx年,大數(shù)據(jù)(bigdata)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產(chǎn)生的海量數(shù)據(jù),并命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新。它已經(jīng)上過《紐約時報》《華爾街日報》的專欄封面,進入美國白宮官網(wǎng)的新聞,現(xiàn)身在國內(nèi)一些互聯(lián)網(wǎng)主題的講座沙龍中,甚至被嗅覺靈敏的國金證券、國泰君安、銀河證券等寫進了投資推薦報告。數(shù)據(jù)正在迅速膨脹并變大,它決定著企業(yè)的未來發(fā)展,雖然很多企業(yè)可能并沒有意識到數(shù)據(jù)爆炸性增長帶來問題的隱患,但是隨著時間的推移,人們將越來越多的意識到數(shù)據(jù)對企業(yè)的重要性。正如《紐約時報》20xx年2月的一篇專欄中所稱,“大數(shù)據(jù)”時代已經(jīng)降臨,在商業(yè)、經(jīng)濟及其他領(lǐng)域中,決策將日益基于數(shù)據(jù)和分析而作出,而并非基于經(jīng)驗和直覺。哈佛大學社會學教授加里·金說:“這是一場革命,龐大的數(shù)據(jù)資源使得各個領(lǐng)域開始了量化進程,無論學術(shù)界、商界還是政府,所有領(lǐng)域都將開始這種進程?!?/p>
最后,隨著云時代的來臨,大數(shù)據(jù)(bigdata)也吸引了越來越多的關(guān)注。著云臺的分析師團隊認為,大數(shù)據(jù)(bigdata)通常用來形容一個公司創(chuàng)造的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關(guān)系型數(shù)據(jù)庫用于分析時會花費過多時間和金錢。大數(shù)據(jù)分析常和云計算聯(lián)系到一起,因為實時的大型數(shù)據(jù)集分析需要像mapreduce一樣的框架來向數(shù)十、數(shù)百或甚至數(shù)千的電腦分配工作。“大數(shù)據(jù)”在互聯(lián)網(wǎng)行業(yè)指的是這樣一種現(xiàn)象:互聯(lián)網(wǎng)公司在日常運營中生成、累積的用戶網(wǎng)絡(luò)行為數(shù)據(jù)。這些數(shù)據(jù)的規(guī)模是如此龐大,以至于不能用g或t來衡量。大數(shù)據(jù)到底有多大?一組名為“互聯(lián)網(wǎng)上一天”的數(shù)據(jù)告訴我們,一天之中,互聯(lián)網(wǎng)產(chǎn)生的全部內(nèi)容可以刻滿1.68億張dvd;發(fā)出的郵件有2940億封之多(相當于美國兩年的紙質(zhì)信件數(shù)量);發(fā)出的社區(qū)帖子達200萬個(相當于《時代》雜志770年的文字量);賣出的手機為37.8萬臺,高于全球每天出生的嬰兒數(shù)量37.1萬……,截止到20xx年,數(shù)據(jù)量已經(jīng)從tb(1024gb=1tb)級別躍升到pb(1024tb=1pb)、eb(1024pb=1eb)乃至zb(1024eb=1zb)級別。國際數(shù)據(jù)公司(idc)的研究結(jié)果表明,20xx年全球產(chǎn)生的數(shù)據(jù)量為0.49zb,20xx年的數(shù)據(jù)量為0.8zb,20xx年增長為1.2zb,20xx年的數(shù)量更是高達1.82zb,相當于全球每人產(chǎn)生200gb以上的數(shù)據(jù)。而到20xx年為止,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200pb,全人類歷史上說過的所有話的數(shù)據(jù)量大約是5eb。ibm的研究稱,整個人類文明所獲得的全部數(shù)據(jù)中,有90%是過去兩年內(nèi)產(chǎn)生的。而到了20xx年,全世界所產(chǎn)生的數(shù)據(jù)規(guī)模將達到今天的44倍。
首先,談?wù)劥髷?shù)據(jù)帶給生活的轉(zhuǎn)變。大數(shù)據(jù)已經(jīng)是信息產(chǎn)業(yè)發(fā)展的必然趨勢,可以說,大數(shù)據(jù)現(xiàn)在已經(jīng)開始慢慢滲透入我們的生活,如:現(xiàn)在流行的打車軟件、三維立體化社區(qū)的建立、某些從事生產(chǎn)銷售的行業(yè)利用大數(shù)據(jù)來優(yōu)化規(guī)模和實現(xiàn)利益最大化。而我們很多人對大數(shù)據(jù)還很陌生,只是被動的適應(yīng)著大數(shù)據(jù)給生活帶來的改變。大數(shù)據(jù)時代是以云計算為基礎(chǔ)的,所以,要實現(xiàn)大數(shù)據(jù),相關(guān)的很多的硬件設(shè)備都要更新?lián)Q代,信息處理系統(tǒng)、信息傳輸系統(tǒng)、信息反饋系統(tǒng)、信息決策系統(tǒng)都將面臨新的挑戰(zhàn),相關(guān)產(chǎn)業(yè)都要重新調(diào)整產(chǎn)業(yè)結(jié)構(gòu),在那時,可以夸張的說,信息就是黃金,信息就是石油。大數(shù)據(jù)時代的到來會解放更多的勞動生產(chǎn)力,勢必將會更加加劇生產(chǎn)力過剩的現(xiàn)狀,社會兩極分化現(xiàn)象會更加明顯,掌握不了信息資源,很難再翻身,要防止信息壟斷帶來的可怕局面。大數(shù)據(jù)時代的到來會使人們的生活節(jié)奏急速加快,信息的時效性決定了它的流通速率,人們的生活節(jié)奏要跟上信息流通的速率,就不得不加快自己的節(jié)奏,人們會越來越忙,到那時,就像現(xiàn)在的日本,可能想找個人聽你說說話,真的是一件很難的事。
第二,關(guān)于數(shù)據(jù)管理的看法。大數(shù)據(jù)時代,數(shù)據(jù)管理是一件很重要的工作,如何才能避免自己的數(shù)據(jù)被非法竊取、丟失和被盜?我的看法是,人防、技防、物防一體化。人防,即我們要從思想上牢固樹立信息安全防范的意識,不主動泄露信息,要管理好自己身邊的信息設(shè)備;技防,就是要運用軟件來管理和處理數(shù)據(jù),經(jīng)常檢查更新數(shù)據(jù)庫,定時查殺電腦病毒,確保電腦狀況安全;物防,就是重要的數(shù)據(jù)一定要備份保留,而且應(yīng)當做到備份與原始文件是物理隔離,無關(guān)的信息應(yīng)當及時刪除,減輕硬盤的壓力。
三、怎么保護自己的隱私。隱私,顧名思義,就是不愿意讓別人看到的東西,所以,在大數(shù)據(jù)時代,更要管理好自己的隱私,以免對自己和家人造成麻煩和損失。越是隱私的信息,越要遠離網(wǎng)絡(luò),不要再公開的社交網(wǎng)絡(luò)儲存和展示個人圖片、資料等信息,免得被非法人士采用和竊取。建議還是用紙質(zhì)的日記代替電腦日記,避免信息傳播范圍太大,管理好自己的日記本。研發(fā)一種新的硬件連接器,總是以隨機碼來保護自己真實ip地址,提高網(wǎng)絡(luò)安全的可靠性,加強對聯(lián)網(wǎng)信息的管理和保護。
不論我們情不情愿,大數(shù)據(jù)時代都會到來,現(xiàn)實社會是我們高喊著走向大數(shù)據(jù)時代,其實大數(shù)據(jù)時代已經(jīng)向我們走來,所以與其被動接受,不如主動學習,從中找到自己的出路,成為大數(shù)據(jù)時代的建設(shè)者和受益者。
大數(shù)據(jù)時代讀書心得篇十一
《大數(shù)據(jù)時代》這本書寫的很好,很值得一讀,因為會給我們很多啟發(fā),比如你在相關(guān)的社交網(wǎng)站發(fā)表的言論或者照片都很有可能被“數(shù)據(jù)科學家”們利用,從而再將相關(guān)數(shù)據(jù)賣給各大網(wǎng)店。下面是本站小編為大家收集整理的大數(shù)據(jù)時代。
總結(jié),歡迎大家閱讀。
利用周末,一口氣讀完了涂子沛的大作《大數(shù)據(jù)》。這本書很好看,行文如流水,引人入勝。書中,你讀到的不是大數(shù)據(jù)技術(shù),更多是與大數(shù)據(jù)相關(guān)的美國政治、經(jīng)濟、社會和文化的演進。作為一名信息化從業(yè)者,讀完全書,我深刻感受到了在信息化方面中國與美國的各自特色,也看到了我們與美國的差距。有幾個方面的體會,但窺一斑基本能見全貌。
一是政府業(yè)務(wù)數(shù)據(jù)庫公開的廣度和深度。近年來,隨著我國信息公開工作的推進,各級政府都在通過政府門戶網(wǎng)站建設(shè)積極推進網(wǎng)上政務(wù)信息公開,但我們的信息公開,現(xiàn)階段還主要是政府的政策、法律法規(guī)、標準、公文通告、工作職責、辦事指南、工作動態(tài)、人事任免等行政事務(wù)性信息的公開。當然,實時的政府業(yè)務(wù)數(shù)據(jù)庫公開也已經(jīng)取得很大進步。在中國政府門戶網(wǎng),可以查詢一些公益數(shù)據(jù)庫,如國家統(tǒng)計局的經(jīng)濟統(tǒng)計數(shù)據(jù)、環(huán)保部數(shù)據(jù)中心提供的全國空氣、水文等數(shù)據(jù),氣象總局提供的全國氣象數(shù)據(jù),民航總局提供的全國航班信息等;訪問各個部委的網(wǎng)站,也能查到很多業(yè)務(wù)數(shù)據(jù),如發(fā)改委的項目立項庫、工商局的企業(yè)信用庫、國土資源部的土地證庫、國家安監(jiān)總局的煤礦安全預警信息庫、各類工程招標信息庫等等。這是一個非常大的進步,也是這么多年電子政務(wù)建設(shè)所取得的成效和價值!但是,政務(wù)業(yè)務(wù)數(shù)據(jù)庫中的很多數(shù)據(jù)目前還沒有實現(xiàn)公開,很多數(shù)據(jù)因為部門利益和“保密”等因素,還僅限于部門內(nèi)部人員使用,沒有公開給公眾;已經(jīng)公開的數(shù)據(jù)也僅限于一部分基本信息和統(tǒng)計信息,更多數(shù)據(jù)還沒有被公開。從《大數(shù)據(jù)》一書中記錄的美國數(shù)據(jù)公開的實踐來看,美國在數(shù)據(jù)公開的廣度和深度都比較大。美國人認為“用納稅人的錢收集的數(shù)據(jù)應(yīng)該免費提供給納稅人使用”,盡管美國政府事實上對數(shù)據(jù)的公開也有抵觸,但民愿不可違,美國政府的業(yè)務(wù)數(shù)據(jù)越來越公開,尤其是在奧巴馬政府簽署《透明和開放的政府》文件后,開放力度更加大。是美國聯(lián)盟政府新建設(shè)的統(tǒng)一的數(shù)據(jù)開放門戶網(wǎng)站,網(wǎng)站按照原始數(shù)據(jù)、地理數(shù)據(jù)和數(shù)據(jù)應(yīng)用工具來組織開放的各類數(shù)據(jù),累積開放378529個原始和地理數(shù)據(jù)集。在中國尚沒有這樣的數(shù)據(jù)開放的網(wǎng)站。另外,由于制度的不同,美國業(yè)務(wù)信息公開的深度也很大,例如,網(wǎng)上公布的美國總統(tǒng)“白宮訪客記錄”公布的甚至是造訪白宮的各類人員的相關(guān)信息;美國的網(wǎng)站,能夠逐條跟蹤、記錄、分析聯(lián)邦政府每一筆財政支出。這在中國,目前應(yīng)該還沒有實現(xiàn)。
二是對政府對業(yè)務(wù)數(shù)據(jù)的分析。目前,中國各級政府網(wǎng)站所提供的業(yè)務(wù)數(shù)據(jù)基本上還是數(shù)據(jù)表,部分網(wǎng)站能提供一些統(tǒng)計圖,但很少能實現(xiàn)數(shù)據(jù)的跨部門聯(lián)機分析、數(shù)據(jù)關(guān)聯(lián)分析。這主要是由于以往中國政務(wù)信息化的建設(shè)還處于部門建設(shè)階段。美國在這方面的步伐要快一些,美國的網(wǎng)站,不僅提供原始數(shù)據(jù)和地理數(shù)據(jù),還提供很多數(shù)據(jù)工具,這些工具很多都是公眾、公益組織和一些商業(yè)機構(gòu)提供的,這些應(yīng)用為數(shù)據(jù)處理、聯(lián)機分析、基于社交網(wǎng)絡(luò)的關(guān)聯(lián)分析等方面提供手段。如上提供的白宮訪客搜索工具,可以搜尋到訪客信息,并將白宮訪客與其他微博、社交網(wǎng)站等進行關(guān)聯(lián),提高訪客的透明度。
三是關(guān)于個人數(shù)據(jù)的隱私。在美國,公民的隱私和自有不可侵犯,美國沒有個人身份證,也不能建立基于個人身份證號碼的個人信息的關(guān)聯(lián),建立“中央數(shù)據(jù)銀行”的提案也一再被否決。這一點,在中國不是問題,每個公民有唯一的身份信息,通過身份證信息,可以獲取公民的基本信息。今后,隨著國家人口基礎(chǔ)數(shù)據(jù)庫等基礎(chǔ)資源庫的建設(shè),公民的社保、醫(yī)療等其他相關(guān)信息也能方便獲取,當然信息還是限于政府部門使用,但很難完全保證整合起來的這些個人信息不被泄露或者利用。
數(shù)據(jù)是信息化建設(shè)的基礎(chǔ),兩個大國在大數(shù)據(jù)領(lǐng)域的互相學習和借鑒,取長補短,將推進世界進入信息時代。我欣喜地看到,美國政府20xx年啟動了“大數(shù)據(jù)研發(fā)計劃”,投資2億美元,推動大數(shù)據(jù)提取、存儲、分析、共享、可視化等領(lǐng)域的研究,并將其與超級計算和互聯(lián)網(wǎng)投資相提并論。同年,中國政府20xx年也批復了“國家政務(wù)信息化建設(shè)工程規(guī)劃”,總投資額估計在幾百億,專門有人口、法人、空間、宏觀經(jīng)濟和文化等五大資源庫的五大建設(shè)工程。開放、共享和智能的大數(shù)據(jù)的時代已經(jīng)來臨!
讀了《大數(shù)據(jù)時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰(zhàn)栗起來。
“在小數(shù)據(jù)時代,我們會假象世界是怎樣運作的,然后通過收集和分析數(shù)據(jù)來驗證這種假想?!薄半S著由假想時代到數(shù)據(jù)時代的過渡,我們也很可能認為我們不在需要理論了。”書中幾乎肯定要顛覆統(tǒng)計學的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學的理論已經(jīng)脫離實際”來“終結(jié)”量子力學。對此我很高興,因為統(tǒng)計學和量子力學都是我在大學學習時學到抽筋都不能及格的課目。但這兩個理論實在太大,太權(quán)威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實也不敢旗幟鮮明地提出要顛覆它們的論點,畢竟還是在前面加上了“很可能認為”這樣的保護傘。
近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應(yīng)該做到的就是要破和立,要改變自己的傳統(tǒng),跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數(shù)據(jù)是“通往未來的必然改變”,那我就必須“不受限于傳統(tǒng)的思維模式和特定領(lǐng)域里隱含的固有偏見”,跟作者一起先把統(tǒng)計學和量子力學否定掉再說。反正我也不喜歡、也學不會它們。
當我們?nèi)祟惖臄?shù)據(jù)收集和處理能力達到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調(diào)查為基礎(chǔ)的統(tǒng)計學了。但是由統(tǒng)計學和量子力學以及其他很多“我們也很可能認為我們不再需要的”理論上溯,它們幾乎都基于一個共同的基礎(chǔ)——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔心了!
《大數(shù)據(jù)時代》第16頁“大數(shù)據(jù)的核心就是預測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先后變化關(guān)系規(guī)則。兩者似乎是做同一件事??纱髷?shù)據(jù)要的“不是因果關(guān)系,而是相關(guān)關(guān)系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基于因果關(guān)系。兩者好像又是對立的。在同一件事上兩種方法對立,應(yīng)該只有一個結(jié)果,就是要否定掉其中之一。這就是讓我很擔心的原因。
可我卻不能拭目以待,像旁觀者一樣等著哪一個“脫穎而出”,因為我身處其中。問題不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個更可怕的事情。
其一:量子力學搞了一百多年,為了處理好混雜性問題,把質(zhì)量和速度結(jié)合到能量上去了,為了調(diào)和量子力學與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關(guān)系,因為爸爸就是爸爸,兒子就是兒子。那么大數(shù)據(jù)會不會通過正視混雜性,放棄因果關(guān)系最后反而搞出時間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機器的根本區(qū)別在于人有邏輯思維而機器沒有。《大數(shù)據(jù)時代》也擔心“最后做出決策的將是機器而不是人”。如果真的那一天因為放棄邏輯思維而出現(xiàn)科幻電影上描述的機器主宰世界消滅人類的結(jié)果,那我還不如現(xiàn)在就趁早跳樓。
還好我知道自己對什么統(tǒng)計學、量子力學、邏輯學和大數(shù)據(jù)來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔心根本不存在。但問題出現(xiàn)了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點迷津。
所以想向《大數(shù)據(jù)時代》的作者提一個合理化建議:把這本書繼續(xù)寫下去,至少加一個第四部分——大數(shù)據(jù)時代的邏輯思維。
在《大數(shù)據(jù)時代》一書中,大數(shù)據(jù)時代與小數(shù)據(jù)時代的區(qū)別:1、思維慣例。大數(shù)據(jù)時代區(qū)別與轉(zhuǎn)變就是,放棄對因果關(guān)系的渴求,而取而代之關(guān)注相關(guān)關(guān)系。也就是說只要知道“是什么”,而不需要知道“為什么”。作者語言絕對,卻反思其本質(zhì)區(qū)別。數(shù)據(jù)的更多、更雜,導致應(yīng)用主意只能盡量觀察,而不是傾其所有進行推理?這也是明智之舉2、使用用途。小數(shù)據(jù)停留在說明過去,大數(shù)據(jù)用驅(qū)動過去來預測未來。筆者認為數(shù)據(jù)的用途意在何為,與數(shù)據(jù)本身無關(guān),而與數(shù)據(jù)的解讀者有關(guān),而相關(guān)關(guān)系更有利于預測未來。3、結(jié)構(gòu)。大數(shù)據(jù)更多的體現(xiàn)在海量非結(jié)構(gòu)化數(shù)據(jù)本身與處理方法的整合。大數(shù)據(jù)更像是理論與現(xiàn)實齊頭并進,理論來創(chuàng)立處理非結(jié)構(gòu)化數(shù)據(jù)的方法,處理結(jié)果與未來進行驗證。4、分析基礎(chǔ)。大數(shù)據(jù)是在互聯(lián)網(wǎng)背景下數(shù)據(jù)從量變到質(zhì)變的過程。筆者認為,小數(shù)據(jù)時代也即是信息時代,是大數(shù)據(jù)時代的前提,大數(shù)據(jù)時代是升華和進化,本質(zhì)是相輔相成,而并非相離互斥。
數(shù)據(jù)未來的故事。數(shù)據(jù)的發(fā)展,給我們帶來什么預期和啟示?銀行業(yè)天然有大數(shù)據(jù)的潛質(zhì)。客戶數(shù)據(jù)、交易數(shù)據(jù)、管理數(shù)據(jù)等海量數(shù)據(jù)不斷增長,海量機遇和挑戰(zhàn)也隨之而來,適應(yīng)變革,適者生存。我們可以有更廣闊的業(yè)務(wù)發(fā)展空間、可以有更精準的決策判斷能力、可以有更優(yōu)秀的經(jīng)營管理能力??可以這些都基于數(shù)據(jù)的收集、整理、駕馭、分析能力,基于脫穎而出的創(chuàng)新思維和執(zhí)行。因此,建設(shè)“數(shù)據(jù)倉庫”,培養(yǎng)“數(shù)據(jù)思維”,養(yǎng)成“數(shù)據(jù)治理”,創(chuàng)造“數(shù)據(jù)融合”,實現(xiàn)“數(shù)據(jù)應(yīng)用”才能擁抱“大數(shù)據(jù)”時代,從數(shù)據(jù)中攫取價值,笑看風云變換,穩(wěn)健贏取未來。
大數(shù)據(jù)時代讀書心得篇十二
數(shù)據(jù)已經(jīng)成為一種商業(yè)資本,一項重要的經(jīng)濟投入,可以創(chuàng)造新的經(jīng)濟利益。事實上,通過對海量數(shù)據(jù)進行分析,我們可以獲得巨大價值的產(chǎn)品或服務(wù),或者深刻的洞見。
(1)不是隨機樣本,而是全體數(shù)據(jù):在大數(shù)據(jù)時代的第一個轉(zhuǎn)變就是利用所有數(shù)據(jù),而不再僅僅依靠一小部分數(shù)據(jù)。采樣分析的精確性隨著采樣隨機性的增加而大幅提高,但與樣本數(shù)量的增加關(guān)系不大。因此樣本選擇的隨機性比樣本數(shù)量更加重要。大數(shù)據(jù)的方法不采用隨機分析法,而是采用所有數(shù)據(jù),即樣本=總體。
(2)追求數(shù)據(jù)的混雜性而不是精確性:大數(shù)據(jù)為了擴大數(shù)據(jù)規(guī)模允許不精確。大數(shù)據(jù)的簡單算法比小數(shù)據(jù)的復雜算法更加有效。大數(shù)據(jù)要求我們接受紛繁性,放棄對精確性的追求,在大數(shù)據(jù)時代我們無法獲得精確性。
(3)大數(shù)據(jù)追求相關(guān)關(guān)系而非因果關(guān)系:通過監(jiān)控一個現(xiàn)象的良好的關(guān)聯(lián)物,相關(guān)關(guān)系可以幫助我們捕捉現(xiàn)在和預測未來。大數(shù)據(jù)的相關(guān)關(guān)系分析法更加準確、更快,而且不易受傳統(tǒng)思維模式和特定領(lǐng)域里隱含的固有偏見的影響。建立在相關(guān)關(guān)系分析法上基礎(chǔ)上的預測是大數(shù)據(jù)的核心。
(1)一切皆可量化:量化是數(shù)據(jù)化的核心。我們要的是數(shù)據(jù)化而不是數(shù)字化。數(shù)據(jù)化是指一種把現(xiàn)象轉(zhuǎn)變?yōu)榭芍票矸治龅牧炕问降倪^程。數(shù)字化指的是把模擬數(shù)據(jù)轉(zhuǎn)換為0和1換算表示的二進制碼。
有了大數(shù)據(jù)的幫助,我們不再會將世界看作世界是一連串我們認為或是自然或是社會的現(xiàn)象,我們會意識到本質(zhì)上世界是由信息構(gòu)成的。將世界看作信息,看作可以理解的數(shù)據(jù)海洋,為我們提供了一個從未有過的審視現(xiàn)實的視角。它是一種可以滲透到所有生活領(lǐng)域的世界觀。
(2)數(shù)據(jù)的絕大部分價值都隱藏在表面之下:數(shù)據(jù)的價值不僅限于特定用途,它可以為同一目的而被多次使用,也可以用于其他目的。數(shù)據(jù)的基本用途是為信息的收集和處理提供依據(jù)。不同于物質(zhì)的東西,數(shù)據(jù)的價值不會隨著它的使用而減少,而是可以不斷地被處理。
數(shù)據(jù)的創(chuàng)新包括:數(shù)據(jù)的再利用(采集用戶的搜索數(shù)據(jù)判斷用戶的偏好或發(fā)展趨勢)、重組數(shù)據(jù)(多個數(shù)據(jù)集的總和重組在一起時比單個數(shù)據(jù)集更有價值)、可擴展數(shù)據(jù)(使得某種方式收集的單一數(shù)據(jù)集有多種不同的用途)、數(shù)據(jù)的折舊值(隨著時間推移,大多數(shù)數(shù)據(jù)都會失去一部分基本用途但潛在價值依然強大)、數(shù)據(jù)廢氣(使用用戶在網(wǎng)上留下的數(shù)字軌跡,如在線交互痕跡,來改善舊服務(wù))、開放數(shù)據(jù)(開放政府數(shù)據(jù)讓私營部門和社會大眾訪問)。
(3)數(shù)據(jù)、技術(shù)與思維的三足鼎立:大數(shù)據(jù)價值鏈的構(gòu)成為大數(shù)據(jù)采集掌控、大數(shù)據(jù)挖掘技術(shù)、大數(shù)據(jù)思維。現(xiàn)今我們處在大數(shù)據(jù)時代的早期,思維和技能是最有價值的。但最終大部分的價值還是必須從數(shù)據(jù)本身中挖掘。大數(shù)據(jù)公司的`多樣性表明了數(shù)據(jù)價值的轉(zhuǎn)移。隨著數(shù)據(jù)價值轉(zhuǎn)移到數(shù)據(jù)擁有者手上,傳統(tǒng)的商業(yè)模式也就被顛覆了。
未來行業(yè)專家和技術(shù)專家的光芒都會因為統(tǒng)計數(shù)學家和數(shù)據(jù)分析家的出現(xiàn)而變暗。因為后者不受舊觀念的影響,能夠聆聽數(shù)據(jù)發(fā)出的聲音。
大數(shù)據(jù)決定企業(yè)的競爭力。規(guī)模很重要,大規(guī)模的公司擁有大量數(shù)據(jù)以及采集更多數(shù)據(jù)的能力,而小規(guī)模公司則更加靈活,因此中型企業(yè)將會逐漸消亡。
(1)讓數(shù)據(jù)主宰一切隱憂:大數(shù)據(jù)的核心思想是用規(guī)模劇增來改變現(xiàn)狀,這會給我們帶來更多威脅。
在大數(shù)據(jù)時代,不管是告知與許可(很多數(shù)據(jù)在收集時并無意用作其他意圖,而最終卻產(chǎn)生了很多創(chuàng)新的用途)、模糊化(有意識的模糊化可能起到反作用)還是匿名化(大數(shù)據(jù)促進了內(nèi)容的交叉檢驗),這三大隱私保護策略都失效了。
大數(shù)據(jù)被濫用于因果分析可能導致罪責的判定是基于對個人未來的預測。進行個人罪責推定需要行為人選擇某種特定的行為,他的選擇是造成這個行為的原因。而大數(shù)據(jù)并不是建立在因果關(guān)系基礎(chǔ)上的,而是相關(guān)關(guān)系!所以大數(shù)據(jù)絕不可以用來進行罪責推定!
(2)責任與自由并舉的信息管理:大數(shù)據(jù)時代要借助限制信息濫用的規(guī)范而不是最初的審查來防止其泛濫。要想保護個人隱私就需要個人數(shù)據(jù)處理器對其政策和行為承擔更多的責任。
個人隱私保護從個人許可到讓數(shù)據(jù)使用者承擔責任:為了實現(xiàn)數(shù)據(jù)二次運用的優(yōu)勢與過度披露所帶來的風險,監(jiān)管機制可以決定不同種類的個人數(shù)據(jù)必須刪除的時間。再利用的時間框架則取決于數(shù)據(jù)內(nèi)在風險和社會價值觀的不同。公司可以利用數(shù)據(jù)的時間更長,但相應(yīng)的必須為其行為承擔責任以及負有特定時間之后刪除個人數(shù)據(jù)的義務(wù)。我們還可以開發(fā)新的技術(shù)促進隱私保護。如“差別隱私”:故意將數(shù)據(jù)模糊處理,促使對大數(shù)據(jù)庫的查詢不能顯示精確結(jié)果。
在依據(jù)大數(shù)據(jù)技術(shù)作重大決策時必須保證特定防護措施的到位:(a)公開原則。用來進行預測分析的數(shù)據(jù)和算法必須公開。(b)公正原則。具備由第三方專家公證的可靠、有效的算法系統(tǒng)。(c)可反駁原則。明確提出個人可以對其預測進行反駁的具體方式。(d)確保對人的評判依據(jù)真實行為而非大數(shù)據(jù)分析。
大數(shù)據(jù)的運作超出我們正常理解范圍。為了防止大數(shù)據(jù)的預測、運算法則和數(shù)據(jù)庫變得不透明、不可解釋、不可追蹤,大數(shù)據(jù)需要被檢測并保持透明度,當然還有使這兩項得以實現(xiàn)的新型專業(yè)技術(shù)和機構(gòu),大數(shù)計算法師將會崛起。
為了保護極具競爭力的大數(shù)據(jù)市場,必須防止壟斷。政府也應(yīng)該公布其數(shù)據(jù)。
大數(shù)據(jù)時代讀書心得篇十三
如今說起新媒體和互聯(lián)網(wǎng),必提大數(shù)據(jù),似乎不這樣說就out了。而且人云亦云的居多,不少談?wù)撜呱踔吝€沒有認真讀過這方面的經(jīng)典著作——舍恩佰格的《大數(shù)據(jù)時代》。維克托·邁爾——舍恩伯格何許人也?他現(xiàn)任牛津大學網(wǎng)絡(luò)學院互聯(lián)網(wǎng)研究所治理與監(jiān)管專業(yè)教授,曾任哈佛大學肯尼迪學院信息監(jiān)管科研項目負責人。他的咨詢客戶包括微軟、惠普和ibm等全球頂級企業(yè),他是歐盟互聯(lián)網(wǎng)官方政策背后真正的制定者和參與者,他還先后擔任多國政府高層的智囊。這位被譽為:大數(shù)據(jù)時代的預言家“的牛津教授真牛!那么,這位大師說的都是金科玉律嗎?并不一定,讀大師的作品一定要做些功課才好讀懂,如果能做足功課又具備相應(yīng)的理論功底,就能與之進行一場思想上的對話。
一讀。
舍恩伯格分三部分來討論大數(shù)據(jù),即思維變革、商業(yè)變革和管理變革。在第一部分“大數(shù)據(jù)時代的思維變革”中,舍恩伯格旗幟鮮明的亮出他的三個觀點:一、更多:不是隨機樣本,而是全體數(shù)據(jù);二、更雜:不是精確性,而是混雜性;三、更好:不是因果關(guān)系,而是相關(guān)關(guān)系。對于第一個觀點,我不敢茍同。一方面是對全體數(shù)據(jù)進行處理,在技術(shù)和設(shè)備上有相當高的難度。另一方面是不是都有此必要,對于簡單事實進行判斷的數(shù)據(jù)分析難道也要采集全體數(shù)據(jù)嗎?我曾與香港城市大學的祝建華教授討論過。祝教授是傳播學研究方法和數(shù)據(jù)分析的專家,他認為一定可以找到一種數(shù)理統(tǒng)計方法來進行分析,并不一定需要全部數(shù)據(jù)。聯(lián)系到舍恩伯格第二個觀點中所說的相關(guān)關(guān)系,我理解他說的全體數(shù)據(jù)不是指數(shù)量而是指范圍,即大數(shù)據(jù)的隨機樣本不限于目標數(shù)據(jù),還包括目標以外的所有數(shù)據(jù)。我認為大數(shù)據(jù)分析不能排除隨機抽樣,只是抽樣的方法和范圍要加以拓展。
我同意舍恩伯格的第二觀點,我認為這是對他第一個觀點很好的補充,這也是對精準傳播和精準營銷的一種反思。“大數(shù)據(jù)的簡單算法比小數(shù)據(jù)的復雜算法更有效?!备哂泻暧^視野和東方哲學思維。對于舍恩伯格的第三個觀點,我也不能完全贊同?!安皇且蚬P(guān)系,而是相關(guān)關(guān)系。”不需要知道“為什么”,只需要知道“是什么”。傳播即數(shù)據(jù),數(shù)據(jù)即關(guān)系。在小數(shù)據(jù)時代人們只關(guān)心因果關(guān)系,對相關(guān)關(guān)系認識不足,大數(shù)據(jù)時代相關(guān)關(guān)系舉足輕重,如何強調(diào)都不為過,但不應(yīng)該完全排斥它。大數(shù)據(jù)從何而來?為何而用?如果我們完全忽略因果關(guān)系,不知道大數(shù)據(jù)產(chǎn)生的前因后果,也就消解了大數(shù)據(jù)的人文價值。如今不少學者為了闡述和傳播其觀點往往語出驚人,對舊有觀念進行徹底的否定。
世間萬物的復雜性多樣化并非非此即彼那么簡單,舍恩伯格也是這種二元對立的幼稚思維嗎?其實不然,讀者在閱讀時一定要看清楚他是在什么語境下說的,不要因囫圇吞棗的淺讀而陷入斷章取義的誤讀。比如說舍恩伯格在提出“不是因果關(guān)系,而是相關(guān)關(guān)系?!边@一論斷時,他在書中還說道:“在大多數(shù)情況下,一旦我們完成了對大數(shù)據(jù)的相關(guān)關(guān)系分析,而又不再滿足于僅僅知道‘是什么’時,我們就會繼續(xù)向更深層次研究的因果關(guān)系,找出背后的‘為什么’?!盵i]由此可見,他說的全體數(shù)據(jù)和相關(guān)關(guān)系都在特定語境下的,是在數(shù)據(jù)挖掘中的選項。
大數(shù)據(jù)研究的一大驅(qū)動力就是商用,舍恩伯格在第二部分里討論了大數(shù)據(jù)時代的商業(yè)變革。舍恩伯格認為數(shù)據(jù)化就是一切皆可“量化”,大數(shù)據(jù)的定量分析有力地回答“是什么”這一問題,但仍然無法完全回答“為什么”。因此,我認為并不能排除定性分析和質(zhì)化研究。數(shù)據(jù)創(chuàng)新可以創(chuàng)造價值,這是毫無疑問的。舍恩伯格在討論大數(shù)據(jù)的角色定位時仍把它置于數(shù)據(jù)應(yīng)用的商業(yè)系統(tǒng)中,而沒有把它置于整個社會系統(tǒng)里,但他在第二部分大數(shù)據(jù)時代的管理變革中討論了這個問題。在風險社會中信息安全問題日趨凸顯,數(shù)據(jù)獨裁與隱私保護成為一對矛盾。如何擺脫大數(shù)據(jù)的困境?舍恩伯格在最后一節(jié)“掌控”中試圖回答,但基本上屬于老生常談。我想,或許凱文·凱利的《失控》可以幫助我們解答這個問題?至少可以提供更多的思考維度。正如舍恩伯格在結(jié)語中所道:“大數(shù)據(jù)并不是一個充斥著算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數(shù)據(jù)為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的未來。”謝謝舍恩伯格!讓大數(shù)據(jù)討論從自然科學回到人文社科。由此推斷,《大數(shù)據(jù)時代》不是最終答案,也不是標準答案,只是參考答案。
此外,在閱讀此書之前還必須具備一些數(shù)據(jù)科學的基本知識和基本概念,比如說什么叫數(shù)據(jù)?什么叫大數(shù)據(jù)?數(shù)據(jù)分析與數(shù)據(jù)挖掘的區(qū)別,數(shù)字化與數(shù)據(jù)化有什么不同?讀前做些功課讀起來就比較好懂了。
再讀。
概念是研究的邏輯起點,“大數(shù)據(jù)”到底是什么?在百度上搜索到的解釋是,“大數(shù)據(jù)(bigdata),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時間內(nèi)達到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊?!贝髷?shù)據(jù)的4v特點:數(shù)量(volume)、速度(velocity)、品種(variety)和真實性(veracity)。但舍恩伯格認為大數(shù)據(jù)并非一個確切的概念。他在書中的一段詮釋更具人文色彩和社會意義:“大數(shù)據(jù)是人們獲得新的認知、創(chuàng)造新的價值的源泉;大數(shù)據(jù)還是改變市場、組織機構(gòu),以及政府與公民關(guān)系的方法?!盵ii]其實,概念的界定要看研究者從哪個角度來研究它而定。
科學家的治學態(tài)度是嚴謹?shù)?,而人文學家更具有想象力。一些對大數(shù)據(jù)不甚了然的人往往夸大了它的作用,甚至把它神化。舍恩伯格認為大數(shù)據(jù)的核心是預測。“大數(shù)據(jù)不是要教機器像人一樣思考。相反,把數(shù)學算法運用到海量的數(shù)據(jù)上來預期事情發(fā)生的可能性?!盵iii]舍恩伯格甚至不回避大數(shù)據(jù)所產(chǎn)生的負面影響,他在第七章里談到讓數(shù)據(jù)主宰一切的隱憂。我覺得這是實事求是的科學態(tài)度。在量子力學里有一個測不準原理:一個微觀粒子的某些物理量(如位置和動量,或方位角與動量矩,還有時間和能量等),不可能同時具有確定的數(shù)值,其中一個量越確定,另一個量的不確定程度就越大。它是解釋微觀世界的物理現(xiàn)象,信息社會中的大數(shù)據(jù)會不會也有類似情況呢?如果我們再把凱文·凱利的《失控》對比來讀的話就更有意思了,這樣我們對整個物質(zhì)世界及至人類社會就有了更全面更深刻的洞察,從物理王國到生物世界,再到信息社會。從公共衛(wèi)生到商業(yè)應(yīng)用,從個人隱私到政府管理,大數(shù)據(jù)無處不在。與此同時,從哪個角度探討用什么方法研究,舍恩伯格都不會忘記大數(shù)據(jù)服務(wù)人類造福人類的終極目的和價值所在?!按髷?shù)據(jù)并不是一個充斥著運算法則和機器的冰冷世界,其中仍需要人類扮演重要角色。人類獨有的弱點、錯覺、錯誤都是十分必要的,因為這些特性的另一頭牽著的是人類的創(chuàng)造力、直覺和天賦。偶爾也會帶來屈辱或固執(zhí)的同樣混亂的大腦運作,也能帶來成功,或在偶然間促成我們的偉大。這提示我們應(yīng)該樂于接受類似的不準確,因為不準確正是我們之所以為人的特征之一?!盵iv]用中國話來說就是“人無完人”,人類在收獲大數(shù)據(jù)帶來的紅利的同時也要承受它帶來的危害。這不是對立統(tǒng)一的辯證唯物主義?我把它看作帶著歐洲批判學派色彩的科學發(fā)展觀。
問題是研究的價值基點,“大數(shù)據(jù)”不是舍恩伯格研究的問題,而是研究對象,他研究的是數(shù)據(jù)處理和信息管理問題,同時也討論信息安全和網(wǎng)絡(luò)倫理問題,還引發(fā)哲學上的思考,哲學史上爭論不休的世界可知論和不可知論轉(zhuǎn)變?yōu)閷嵶C科學中的具體問題??芍允墙^對的,不可知性是相對的?!按髷?shù)據(jù)”之所以為大是因它引發(fā)人類生活、工作和思維的大變革,從這個意義上來看,《大數(shù)據(jù)時代》的意義不僅在于它討論了若干重大問題,而且對研究者開出了一個問題清單,從而引發(fā)更多人來探討這些有趣的問題。
《大數(shù)據(jù)時代》實際上主要是一本討論數(shù)據(jù)挖掘的書,數(shù)據(jù)挖掘與數(shù)據(jù)分析是不同的概念,數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中自動搜索隱藏于其中的有著特殊關(guān)系性的信息的過程。數(shù)據(jù)挖掘通常與計算機科學有關(guān),并通過統(tǒng)計、在線分析處理、情報檢索、機器學習、專家系統(tǒng)(依靠過去的經(jīng)驗法則)和模式識別等諸多方法來實現(xiàn)上述目標。而數(shù)據(jù)分析的目的是把隱沒在一大批看來雜亂無章的數(shù)據(jù)中的信息集中、萃取和提煉出來,以找出所研究對象的內(nèi)在規(guī)律。數(shù)據(jù)挖掘主要運用計算機來進行處理,而數(shù)據(jù)分析既要用計算機也要人工分析,是計算機科學與人文價值判斷的統(tǒng)一結(jié)合。換言之,《大數(shù)據(jù)時代》并不是一本討論大數(shù)據(jù)所有問題的書。
《大數(shù)據(jù)時代》也是一本討論互聯(lián)網(wǎng)發(fā)展的書,從數(shù)字化到數(shù)據(jù)化,同時有濃厚的未來學色彩。當文字變成數(shù)據(jù),我們進入了互聯(lián)網(wǎng);當方位變成數(shù)據(jù),我們進入了物聯(lián)網(wǎng);當溝通變成數(shù)據(jù),我們進入了下一代互聯(lián)網(wǎng)。一切可量化,萬物皆數(shù)據(jù),正是當今互聯(lián)網(wǎng)世界的真實寫照。面對于這樣的世界及世界的未來,在《大數(shù)據(jù)時代》出現(xiàn)最多的詞是“思維”和“方法”,因此也可以把這本書視為思維科學應(yīng)用研究的書。
此外,在閱讀此書之前還必須具備一些數(shù)據(jù)科學的基本知識和基本概念,比如說什么叫數(shù)據(jù)?什么叫大數(shù)據(jù)?數(shù)據(jù)分析與數(shù)據(jù)挖掘的區(qū)別,數(shù)字化與數(shù)據(jù)化有什么不同?讀前做些功課讀起來就比較好懂了。
三讀。
今年國慶節(jié)前一天,中共中央政治局們來到中關(guān)村搞集體學習,調(diào)研、講解、討論創(chuàng)新驅(qū)動發(fā)展戰(zhàn)略。包括、在內(nèi)的七位全部出動來到中關(guān)村,這是歷史上沒有過的,百度、聯(lián)想和小米的負責人,有了一次直面最高層匯報工作的機會。雷軍和柳傳志,講解的都是本公司的各種情況,李彥宏則沒有講百度的廣告業(yè)務(wù)發(fā)展得如何好,而是講起了大數(shù)據(jù)。在講解中,李彥宏認為大數(shù)據(jù)有兩個重要價值,一是促進信息消費,加快經(jīng)濟轉(zhuǎn)型升級;二是關(guān)注社會民生,帶動社會管理創(chuàng)新。這些價值也是目前黨和國家領(lǐng)導人最為重視的,可見《大數(shù)據(jù)時代》既有理論價值也有現(xiàn)實意義。
當今大數(shù)據(jù)正在影響著新聞傳媒業(yè),大數(shù)據(jù)新聞、大數(shù)據(jù)營銷、輿情分析、受眾(用戶)研究……數(shù)據(jù)分析師變身新聞編輯,大數(shù)據(jù)正改變新聞生產(chǎn)流程、大數(shù)據(jù)在創(chuàng)造傳媒新業(yè)態(tài)?!安环料胂笠幌?,隨著數(shù)據(jù)的進一步增加,坐擁用戶資源的新媒體們完全有能力通過數(shù)據(jù)挖掘,分析用戶癖好,向電視臺定制一部電視劇甚至向好萊塢定制一部電影。到那個時候,電視臺一如那些家電廠商們,曾經(jīng)產(chǎn)業(yè)鏈的上游‘王者’,將徹底成為一個產(chǎn)業(yè)鏈最低端的內(nèi)容代工廠?!盵v]然而,情形也遠沒有人們想象的那么樂觀,李彥宏指出目前多數(shù)所謂的大數(shù)據(jù)公司其實還是空殼子,因為數(shù)據(jù)還沒有完全開放。他認為必須在政府層面上推動才能真正實現(xiàn)大數(shù)據(jù)的開發(fā)與利用。我在討論大數(shù)據(jù)時代的輿情監(jiān)測與預警時說道:“經(jīng)典自由主義傳播學說對媒體的定位:秉持公正、客觀立場的媒體被稱為代表公眾監(jiān)督政府行為的‘看門狗’。其實,媒體既是公眾利益也是國家利益的‘看門狗’。要看好門就要瞭望、洞察社情民意,傳統(tǒng)媒體信息反饋渠道單一,視野、人力十分有限。而開放互動的新媒體平臺卻大有可為。作為公共信息發(fā)布平臺的微博可以成為政府及時了解社情民意,從而選擇正確治理路徑的‘導盲犬’。”[vi]遺憾的是目前我國的數(shù)據(jù)平臺還沒有完全開放,真正的大數(shù)據(jù)時代還沒有到來。
與國內(nèi)不少教科書寫法的專著相比,國外的書寫得更有趣,尤其是大學者寫的,不僅視野開闊,而且能夠深入淺出?!洞髷?shù)據(jù)時代》不到22萬字,卻有上百個學術(shù)和商業(yè)的實例,豐富翔實的例子讓讀者感到通俗易懂,深奧的理論看起來也不費勁。這恐怕與舍恩伯格既是學者也是專家,既有理論又有實踐有關(guān)。反觀我們些學者故弄玄虛而示高明,實際上是把讀者拒之門外。我覺得優(yōu)秀的科學家也應(yīng)該是一個科普作家,優(yōu)秀的學者也應(yīng)該是一個不錯的傳播者。當然國外學術(shù)著作也有一個翻譯問題,這本書譯得還不錯。此外,《大數(shù)據(jù)時代》還附有不少it界名流的推薦意見,雖是出版商的發(fā)行所為,對解讀此書也不無益處。
除了《大數(shù)據(jù)時代》,舍恩伯格還有一本《刪除》也值得一讀。要研究大數(shù)據(jù)不能只讀一本書,該書譯者周濤教授還推薦了三部國內(nèi)出版的大數(shù)據(jù)方面的專著:《證析》、《大數(shù)據(jù)》、《個性化:商業(yè)的未來》。相比《大數(shù)據(jù)時代》的宏大視野,這些書就大數(shù)據(jù)某一局部問題給出深刻的介紹和洞見。我也推薦讀一讀中國工程院李國杰院士和中科院計算所副總工程學旗合寫的文章《大數(shù)據(jù)研究:未來科技及經(jīng)濟社會發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學思考》。
雖說開卷有益,但是由于每個人的時間精力有限,對于一個研究者來說,不讀什么書甚至比讀什么書更重要。我認為書有三種:有用的書,主要是應(yīng)用類的專業(yè)書;無用的書,主要是形而上的思想類;無字的書,人間百態(tài),社會現(xiàn)實??善氐粦?yīng)偏廢。對于學生來講這三類“書”都該讀一些,對于研究者則要讀哪些解決關(guān)鍵問題的書,《大數(shù)據(jù)時代》就是這樣一部書。當然,并非第一個讀者都是研究大數(shù)據(jù)的,但進入大數(shù)據(jù)時代,還有什么東西與數(shù)據(jù)完全沒有關(guān)系呢?麥肯錫全球研究機構(gòu)認為,未來十年里有12項對經(jīng)濟發(fā)展產(chǎn)生重大影響的技術(shù),其中包括三項新媒體技術(shù):移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和云計算。這三項新媒體技術(shù)都與大數(shù)據(jù)密切相關(guān),而這些新媒體新技術(shù)的發(fā)展都影響著當今的新聞傳播業(yè)。閱讀此書至少給我們研究新聞傳播學帶來一些啟迪。我覺得一本書的價值不在于讓你頂禮膜拜,而是引發(fā)廣泛而深入的討論。
“凡是過去,皆為序曲。”讀完此書,我們對大數(shù)據(jù)的認識才剛剛開始。
大數(shù)據(jù)時代讀書心得篇十四
當恐龍消失,人類慢慢成為了動物界的主人。
數(shù)據(jù)是我們工作、生活中的點滴記錄,它真實、樸實無華,它們也會有聲音,只是需要有慧眼和思維才能駕馭。
我們只有跨過數(shù)據(jù)化、數(shù)字化的長河,才能開啟ai時代,路途遙遠,主人!
大數(shù)據(jù)時代讀書心得篇十五
隨著信息時代的不斷發(fā)展,大數(shù)據(jù)變得越來越重要。作為普通人,我們可能不了解大數(shù)據(jù)的廣泛應(yīng)用,但它已經(jīng)深入到我們生活的方方面面。從社交媒體、搜索引擎,到在線購物、醫(yī)療保健,這些服務(wù)都依賴于大數(shù)據(jù)的快速處理和分析。在大數(shù)據(jù)信息化時代,我們需要深入理解并把握其內(nèi)在核心,以便真正發(fā)揮它的優(yōu)勢。
大數(shù)據(jù)的優(yōu)勢之一是能夠快速的處理和分析海量數(shù)據(jù)。這意味著我們能夠更準確地預測和判斷某些數(shù)據(jù)趨勢,在經(jīng)營決策中更能快速高效地行動。與此同時,大數(shù)據(jù)也能夠加速生產(chǎn)過程,使得我們在更短的時間內(nèi)生產(chǎn)出更多更高質(zhì)量的產(chǎn)品。通過真正深入理解大數(shù)據(jù)的優(yōu)勢,我們將能更加全面地運用它,使自己更具競爭力。
大數(shù)據(jù)存在很多挑戰(zhàn),其中最大的挑戰(zhàn)之一是保護與保密性。大數(shù)據(jù)包含許多個人隱私信息,如果無法妥善處理,將會給用戶帶來極大的風險。與此同時,可靠和高效的數(shù)據(jù)存儲、傳輸、處理和分析技術(shù)也是另一個重大挑戰(zhàn)。理解這些挑戰(zhàn),將有助于我們更好的提高數(shù)據(jù)分析的質(zhì)量和可靠性,同時避免數(shù)據(jù)泄漏和安全問題。
大數(shù)據(jù)信息化的應(yīng)用是多種多樣的。市場預測、廣告投放、生產(chǎn)管理、醫(yī)學研究等等領(lǐng)域都有眾多大數(shù)據(jù)的應(yīng)用案例。在市場領(lǐng)域,大數(shù)據(jù)已成為企業(yè)市場戰(zhàn)略的基礎(chǔ),因為大數(shù)據(jù)能夠分析市場需求,預測產(chǎn)品領(lǐng)域未來的趨勢和消費者行為。在醫(yī)學領(lǐng)域,利用大數(shù)據(jù)技術(shù)可以快速診斷疾病,預測和預防可能的醫(yī)療危機。不管在哪個領(lǐng)域,大數(shù)據(jù)信息化的應(yīng)用都是前所未有的,其應(yīng)用前景也是十分廣闊。
第五段:結(jié)論。
總之,大數(shù)據(jù)信息化時代是我們不可避免的未來。這需要我們深入理解它的內(nèi)在核心,同時也需要認真且客觀的看待它所帶來的優(yōu)勢和挑戰(zhàn)。通過更好地利用大數(shù)據(jù)技術(shù),我們將能夠突破自己的思維和能力,邁向更廣闊而更輝煌的未來。
大數(shù)據(jù)時代讀書心得篇十六
有人說現(xiàn)在是讀圖時代,除去小說、心靈雞湯以外,現(xiàn)在的暢銷書基本都有圖片,這本書是一個特例(書里唯一的圖是出品方湛廬文化做的)。
首先嘗試解析一下作者的三大觀點,這三大觀點是大數(shù)據(jù)業(yè)者很喜歡引用的三句話:
1不是隨機樣本,而是全體數(shù)據(jù)。
我想所有人都能意識到對全體數(shù)據(jù)的分析優(yōu)于對隨機樣本的分析,但在現(xiàn)實中我們經(jīng)常拿不到全體數(shù)據(jù):一是對象的特性:比如炸彈的威力,你不可能把所有炸彈都炸掉來得到全體數(shù)據(jù);二是數(shù)據(jù)的收集方法,每一種方法都有適用的范圍,不太可能包羅萬象;三是數(shù)據(jù)分析的角度,戰(zhàn)斗機只能統(tǒng)計到飛回來的飛機上的彈孔,而墜毀的則無法統(tǒng)計,沃德通過分析飛回來的戰(zhàn)斗機得出來最易導致墜毀的薄弱點;四是處理能力跟不上,就像以前的天氣預報太離譜是因為來不及算那些數(shù)據(jù)?!安蓸臃治鍪切畔⑷狈r代和信息流通受限制的模擬數(shù)據(jù)時代的產(chǎn)物”,作者顯然只關(guān)注了一部分原因。
從語言的理解上看,什么是全體數(shù)據(jù),究竟是“我們需要的所有數(shù)據(jù)”,還是“我們能收集到的所有數(shù)據(jù)”,書中的很多商業(yè)案例中,處理的只是“我們能收集到的所有數(shù)據(jù)”,或者說是“我們認為的全體數(shù)據(jù)”。人對自然的認識總是有限的,存在主義認為世界沒有終極的目標。書中舉例“farecast使用了每一條航線整整一年的價格數(shù)據(jù)來進行預測”,而“整整一年”就是一個采樣,或者是“我們需要的所有數(shù)據(jù)”。
從歷史的角度看,國外的托勒密建亞歷山大圖書館唯一的目的是“收集全世界的書”,實現(xiàn)“世界知識總匯”的夢想,國內(nèi)的乾隆匯編四庫全書,每個收集的過程都有主觀因素在里面,而他們當時都認為可以收集全部的書籍,到最后,我們也沒有得到那個夢中的全體。
2不是精確性,而是混雜性。
由此衍生出一個問題,大數(shù)據(jù)的品質(zhì)如何控制:一、本身就不要求精確,但是不精確到何種程度是需要定義的,否則就亂套了,換個角度,如果定義了容錯度,那符合條件的都是精確的(或者說我這句話還是停留在小數(shù)據(jù)時代?這里的邏輯我沒有理順)。就像品質(zhì)管理大師克勞斯比提出過零缺陷理論,我一直覺得是一個偽命題,缺陷是一定存在的,就看如何界定了;二、大量非結(jié)構(gòu)化數(shù)據(jù)的處理,譬如說對新聞的量化、情感的分析,目前對非sql的應(yīng)用還有巨大的進步空間。
“一個東西要出故障,不會是瞬間的,而是慢慢地出問題的”。“通過找出一個關(guān)聯(lián)物并監(jiān)控它,我們就能預測未來”。這句話當然是很認同,但不意味著我們可以放棄精確性,只是說我們需要重新定義精確度。之于項目管理行業(yè),如果一個項目出了嚴重的問題,我們相信,肯定是很多因素和過程環(huán)節(jié)中出了問題,我們也失去了很多次挽救的機會。而我們一味的`容忍混雜性的話,結(jié)果顯然是不能接受的。
3不是因果關(guān)系,而是相關(guān)關(guān)系。
這是本書對大數(shù)據(jù)理論的最大的貢獻,也是最受爭議的地方。連譯者都有點看不下去了。
相關(guān)關(guān)系我實在是太熟了,打小就學的算命就是典型的“不是因果關(guān)系,而是相關(guān)關(guān)系”。算命其實是對趨向性的總結(jié),在給定條件下,告訴你需要遠離什么,接近什么,但不會告訴你為什么那樣做。
我們很多時候都在說科學,然而,什么是科學,沒有人能講清楚。我對科學的認識是:一、有一個明確的范圍;二、在這個范圍內(nèi)樹立一個強制正確的公理;三、有明確的推演過程;四可以復制。科學的霸道體現(xiàn)在把一切不符合這四個條件的事物都斥為偽科學、封建迷信,而把自己的錯誤都用不符合前兩條來否決。從這個定義來看,大數(shù)據(jù)不符合科學。
混沌學理論中的蝴蝶效應(yīng)主要關(guān)注相關(guān)關(guān)系。它是指對初始條件敏感性的一種依賴現(xiàn)象,輸入端微小的差別會迅速放大到輸出端,但能輸出什么,誰也不知道。
人類一旦放棄了對因果關(guān)系的追求,也就放棄了自身最優(yōu)秀的品質(zhì):意志力。很多人不愿意相信算命是擔心一旦知道了命運,就無法再去奮斗。即使我相信算命,也在探求相關(guān)關(guān)系中的因果要素。我放棄第一份工作的原因之一是厭倦了如此確定的明天:一個任務(wù)發(fā)出去,大概能預測到哪些環(huán)節(jié)會出問題,只要不去follow,這些環(huán)節(jié)十有_會出問題。
解析完這三大觀點,下面是我對大數(shù)據(jù)理論的一些疑惑。大數(shù)據(jù)是目前風行的反饋經(jīng)濟中的重要一環(huán),在金融、互聯(lián)網(wǎng)行業(yè)的應(yīng)用最為廣泛,而這些行業(yè)都是大家所認為的高薪領(lǐng)域。很多時候我就在想,所謂無形的手所產(chǎn)生的趨勢究竟是不是無形的。比如幾家公司強推一個概念,說這是趨勢,不久就真的變成趨勢了。我們身邊活生生的例子就是天貓的雙十一和京東的618,一個巨頭開路,無數(shù)人跟風,自然就生造出購物節(jié),至于合理不合理,追究的意義也不大,因為很多事情是沒有可比性的。這和沒有強制控制中心的蜂群思維又不一樣。
1數(shù)據(jù)獨裁。個人意志將受制于集體意志,個人的自由在哪里?用大數(shù)據(jù)預測來懲罰人的行為又確定的違反了無罪推定的原理。
2所有數(shù)據(jù)都來源于過去,大數(shù)據(jù)分析出來的確定性結(jié)果是否意味著我們在重復過去?拉普拉斯的決定論已經(jīng)被認為是錯誤的,愛因斯坦也說過“上帝不會跟宇宙玩骰子”,但霍金不同意這句話。
大數(shù)據(jù)時代讀書心得篇十七
這本書里主要介紹的是大數(shù)據(jù)在現(xiàn)代商業(yè)運作上的應(yīng)用,以及它對現(xiàn)代商業(yè)運作的影響。
《大數(shù)據(jù)時代》這本書的結(jié)構(gòu)框架遵從了學術(shù)性書籍的普遍方式。也既,從現(xiàn)象入手,繼而通過對現(xiàn)象的解剖提出對這一現(xiàn)象的解釋。然后在通過解釋在對未來進行預測,并對未來可能出現(xiàn)的問題提出自己看法與對策。
下面來重點介紹《大數(shù)據(jù)時代》這本書的主要內(nèi)容。
《大數(shù)據(jù)時代》開篇就講了google通過人們在搜索引擎上搜索關(guān)鍵字留下的數(shù)據(jù)提前成功的預測了20xx年美國的h1n1的爆發(fā)地與傳播方向以及可能的潛在患者的事情。google的預測比政府提前將近一個月,相比之下政府只能夠在流感爆發(fā)一兩個周之后才可以弄到相關(guān)的數(shù)據(jù)。同時google的預測與政府數(shù)據(jù)的相關(guān)性高達97%,這也就意味著google預測數(shù)據(jù)的置信區(qū)間為3%,這個數(shù)字遠遠小于傳統(tǒng)統(tǒng)計學上的常規(guī)置信區(qū)間5%!而這個數(shù)字就是大數(shù)據(jù)時代預測結(jié)果的相對準確性與事件的可預測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數(shù)據(jù)時代“樣本=總體”的思想。我們都知道當樣本無限趨近于總體的時候,通過計算得到的描述性數(shù)據(jù)將無限的趨近于事件本身的性質(zhì)。而之前采取的“樣本總體”的做法很大程度上無法做到更進一步的描述事物,因為之前的時代數(shù)據(jù)的獲取與存儲處理本身有很大的難度只導致人們采取抽樣的方式來測量事物。而互聯(lián)網(wǎng)終端與計算機的出現(xiàn)使數(shù)據(jù)的獲取、存儲與處理難度大大降低,因而相對準確性更高的“樣本=總體”的測算方式將成為大數(shù)據(jù)時代的主流,同時大數(shù)據(jù)時代本身也是建立在大批量數(shù)據(jù)的存儲與處理的基礎(chǔ)之上的。
接下來,維克多又通過了ibm追求高精確性的電腦翻譯計劃的失敗與google只是將所有出現(xiàn)過的相應(yīng)的文字語句掃描并儲存在詞庫中,所以無論需要翻譯什么,只要有聯(lián)系google詞庫就會出現(xiàn)翻譯,雖然有的時候的翻譯很無厘頭,但是大多數(shù)時候還是正確的,所以google的電腦翻譯的計劃的成功,表明大數(shù)據(jù)時代對準確性的追求并不是特別明顯,但是相反大數(shù)據(jù)時代是建立在大數(shù)據(jù)的基礎(chǔ)住上的,所以大數(shù)據(jù)時代追求的是全方位覆蓋的數(shù)字測度而不管其準確性到底有多高,因為大量的數(shù)據(jù)會湮埋少數(shù)有問題的數(shù)據(jù)所帶來的影響。同時大量的數(shù)據(jù)也會無限的逼近事物的原貌。
之后,維克托又預測了一個在大數(shù)據(jù)時代催生的重要職業(yè)——數(shù)據(jù)科學家,這是一群數(shù)學家、統(tǒng)計學與編程家的綜合體,這一群人將能夠從獲取的數(shù)據(jù)中得到任何他們想要的結(jié)果。換言之,只要數(shù)據(jù)充足我們的一切外在的與內(nèi)在的我們不想讓他人知道的東西都見會在這一群家伙的面前展現(xiàn)得淋漓盡致。所以為了避免個人隱私在大數(shù)據(jù)時代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數(shù)據(jù)為商業(yè)部門服務(wù),而另一群人則負責審查這一些人是否合法的獲得與應(yīng)用數(shù)據(jù),是否侵犯了個人隱私。
無論如何,大數(shù)據(jù)時代將會到來,不管我們接受還是不接受!
我覺得《大數(shù)據(jù)時代》這本書寫的很好,很值得一讀。因為會給我們很多啟發(fā),比如你在相關(guān)的社交網(wǎng)站發(fā)表的言論或者照片都很有可能被“數(shù)據(jù)科學家”們利用,從而再將相關(guān)數(shù)據(jù)賣給各大網(wǎng)店。不過,事實就是我們將會成為被預測被引誘的對象。所以說,小心你在網(wǎng)上留下的痕跡。
我喜歡這本書是因為它給我展現(xiàn)了一個新的世界。
大數(shù)據(jù)時代讀書心得篇十八
舍恩伯格的《大數(shù)據(jù)時代》被人推崇為最佳書籍,今年安泰讀書會的重頭戲。雖然主講人最后放了個香港大黃鴨般的鴿子,但現(xiàn)場討論氛圍依舊非常熱烈——而且還是在沒幾個人讀完的情況下,也就意味著——大數(shù)據(jù)對我們的影響,已經(jīng)深入到生活的方方面面。這本書對這個大規(guī)模產(chǎn)生、分享和應(yīng)用數(shù)據(jù)的新的大時代進行了闡述和厘清,作者圍繞“要全體不要抽樣、要效率不要絕對精確、要相關(guān)不要因果”三大理念,通過數(shù)十個商業(yè)和學術(shù)案例,剖析了萬事萬物數(shù)據(jù)化和數(shù)據(jù)復用挖掘的巨大價值。
無處不在的大數(shù)據(jù):各種云計算,谷歌的神通,亞馬遜的推送,天涯人肉,微博萬能等等等等,我們掌握了新的工具,也獲取了以前從未有過的各種信息。大數(shù)據(jù)拉近了我們與現(xiàn)實的距離,“地球村”變成了“地球屋”,仿佛所有人所有事物都觸手可及,而這些牛逼哄哄的互聯(lián)網(wǎng)巨頭就在客廳展示著世界的每一寸光景。如作者所言“大數(shù)據(jù)開啟了一次重大時代轉(zhuǎn)型。就像望遠鏡讓我們能夠感受宇宙,顯微鏡讓我們看清微生物一樣,大數(shù)據(jù)要改變的是,我們的生活方方面面以及理解世界的方式”。比如,谷歌通過全球搜索分析,比國際疾病控防中心更早更準地預測了流感爆發(fā)。
然而,事實真的是這樣嗎?首先,從應(yīng)用角度出發(fā),低廉的運算能力和存儲空間,讓以前的樣本分析顯得非常簡陋——一些從全體數(shù)據(jù)挖掘出來,忽略精確而從大量數(shù)據(jù)的簡單算法得出來的結(jié)論顛覆了常識。但個人覺得,這只是統(tǒng)計學的終極目標——并沒有非常大的跨越,可能終結(jié)了回歸分析,有效性驗證等手段,但依舊還是統(tǒng)計。而革命性在于關(guān)注相關(guān)關(guān)系而非因果關(guān)系?,F(xiàn)場討論從神學角度挑戰(zhàn)了因果關(guān)系的不可能——或者說人類用簡單思考的邏輯來定義因果,以及用之前小數(shù)據(jù)演繹出大概率事件來推導因果,都是不正確的。真正的因果關(guān)系應(yīng)該屬于上帝的范疇,人類如果真的完全掌握之后,會統(tǒng)治整個宇宙。
但我覺得,無需從神學觀點來討論,而可以借鑒量子力學對經(jīng)典力學的顛覆——在原子層面上,經(jīng)典力學會失效——那么在大數(shù)據(jù)層面上,普通的抽樣調(diào)查直觀反映會失效。而且從量子力學角度是很難推導經(jīng)典力學的公式,那么從現(xiàn)在的慣有思維,也難以推導出大數(shù)據(jù)的因果關(guān)系。同時現(xiàn)場有討論,是否計算機可以精確地模擬每個原子,然后完整地展現(xiàn)微觀到宏觀的化學反應(yīng)細節(jié)?我覺得首先是計算能力不足,其次即便設(shè)定原子的運動條件真的正確,計算結(jié)果未知但宏觀結(jié)果我們卻已經(jīng)知道——牛頓的經(jīng)典力學足以應(yīng)付日常絕大部分情況了。好比切西瓜,究竟刀頭的鐵原子和西瓜的有機分子如何作用,真的重要嗎?回歸到商業(yè)領(lǐng)域,如果我們可以提高相關(guān)性的準確度,從而提高投入效率,那就已經(jīng)足夠了。本來一個產(chǎn)品受到一半客戶喜歡,但如果通過大數(shù)據(jù)挖掘到更好的定位,有百分之八十的客戶喜歡,那么價值已經(jīng)非常可觀了。
大數(shù)據(jù)時代的社會倫理——很大的命題,但重點都在討論如何保護個人隱私。因為手機越來越智能,網(wǎng)絡(luò)越來越快,個人的信息也越來越透明——隱形幾乎完全不可能。我想說的是,作為硬幣的另外一面,我們無法舍棄:互聯(lián)網(wǎng)只不過是讓人與人之間碎片的關(guān)系得以統(tǒng)一,其實各種人肉和信息只不過是坊間傳聞的升級罷了。當我們住在擁擠的小區(qū),三公里走完一圈的縣城,半小時散步完的村落,人和人之間有隱私嗎?現(xiàn)在只不過是把這個范圍放大到了一個地球而已。硬幣的一面是人和人之間有溝通的需要,去團結(jié)對抗世界的未知,那么另外一面就是隱私的缺乏。與其說是要在大數(shù)據(jù)時代保護自己的信息不被泄露,不如站起來維護自己和他人的隱私,從法律和道德的角度來尊重人與人之間的權(quán)利。在一個互相尊重的環(huán)境下,你可以穿熱褲,他也可以穿長裙走上街頭;在一個互相踐踏的社會中,人人都得帶著面具生活。
在思維變革部分,作者講述的重點是:樣本=總體,我們需要對全部數(shù)據(jù)的占有和分析;因此,數(shù)據(jù)缺乏時代的精確性不必執(zhí)迷,接受混雜基于大數(shù)據(jù)的簡單算法比小數(shù)據(jù)的復雜算法更有效;樣本推斷的因果關(guān)系不重要了,知道“是什么”的相關(guān)關(guān)系,或者結(jié)果就可以了。對于我自己最受用的是什么呢?是大數(shù)據(jù)的產(chǎn)業(yè)鏈。產(chǎn)業(yè)鏈包括大數(shù)據(jù)平臺、大數(shù)據(jù)技術(shù)提供方、大數(shù)據(jù)理念提供方。我認為大數(shù)據(jù)平臺是整個產(chǎn)業(yè)鏈條的核心,沒有數(shù)據(jù),再好的技術(shù)和理念都會是無米之炊。那么大數(shù)據(jù)平臺在當前的中國社會有哪些呢?所有的互聯(lián)網(wǎng)公司,物聯(lián)網(wǎng)公司,物流,快消品等等,實際上任何公司都是數(shù)據(jù)平臺公司,只不過之前沒有好好的利用數(shù)據(jù),而更多的是用經(jīng)驗來管理公司和迎合客戶需求?,F(xiàn)在不一樣了,我們完全可以用數(shù)據(jù)來驅(qū)動公司管理和客戶管理,畢竟數(shù)據(jù)是不會騙人的。
大數(shù)據(jù)幫助我們把未來的迷霧撥開了一點,但好比《沉重的肉身》當中討論的,更多的選擇權(quán)并不能帶給人幸?!驗橹雷约翰荒茏霾荒艿玫降囊哺嗔?。解決工作模式,生存意義,幸福之道等問題,關(guān)鍵還是看自己如何看待和使用這些新式工具以及新結(jié)論。引用《神探伽利略》里面的臺詞:可被重復的,一定有道理存在。那么現(xiàn)在重復的越來越多,更需要保持探索和敬畏之心,人才不會迷路。
大數(shù)據(jù)時代讀書心得篇十九
隨著信息技術(shù)的快速發(fā)展,大數(shù)據(jù)教育正成為教育領(lǐng)域的新熱點。在大數(shù)據(jù)背景下的教育,為教育提供了更全面、更準確的數(shù)據(jù)支持,同時也給教師和學生帶來了更廣闊的教學和學習空間。在實踐的過程中,我深刻地體會到了大數(shù)據(jù)教育這一新時代的優(yōu)勢與挑戰(zhàn)。下面我將從教學設(shè)計、學習評估、個性化教育、教育研究和信息安全五個方面,談一談自己對大數(shù)據(jù)教育的心得體會。
首先,大數(shù)據(jù)教育為教學設(shè)計提供了更有力的支持。傳統(tǒng)教育往往根據(jù)教師的經(jīng)驗和直覺進行教學設(shè)計,難以做到針對每個學生的個性化需求。而有了大數(shù)據(jù)的介入,教師可以更準確地了解學生的學習情況和表現(xiàn),從而有針對性地進行教學設(shè)計。例如,通過分析學生在課堂上的表現(xiàn),教師可以了解到學生的薄弱環(huán)節(jié),并據(jù)此調(diào)整教學內(nèi)容和方法,幫助學生更好地掌握知識。此外,教師還可以通過數(shù)據(jù)分析來發(fā)現(xiàn)學生的學習興趣和潛能,為學生提供個性化的學習資源和指導,提高教學效果。
其次,大數(shù)據(jù)教育改變了傳統(tǒng)的學習評估方式。在傳統(tǒng)教育中,評估往往依賴于考試和作業(yè),對學生的全面能力評估有所欠缺。而大數(shù)據(jù)教育可以幫助實現(xiàn)全方位的學習評估。通過收集和分析學生的學習數(shù)據(jù),可以對學生的學習進程、學習過程和學習結(jié)果進行實時監(jiān)測和評估。例如,通過分析學生在學習過程中的行為數(shù)據(jù)和學習輸出數(shù)據(jù),可以了解到學生的學習態(tài)度、學習策略和學習效果,并及時進行反饋和調(diào)整。這種全方位的評估方式更能真實地反映學生的學習情況,有助于引導學生更好地提高學習效果。
第三,大數(shù)據(jù)教育推動了個性化教育的發(fā)展。大數(shù)據(jù)的應(yīng)用使教育走出了一刀切的教學方式,實現(xiàn)了因材施教。通過分析學生的學習數(shù)據(jù),可以獲得學生的學習特點、習慣、喜好等信息,使教師能夠更準確地把握學生的個性化需求,采用針對性更強的教學方法和手段。同時,學生也可以根據(jù)自身的需要和興趣進行學習,選擇適合自己的學習路徑和資源。個性化教育以學生為中心,讓每個學生都能在適合自己的學習環(huán)境中得到最大程度的發(fā)展,提高教育的質(zhì)量和效果。
第四,大數(shù)據(jù)教育為教育研究提供了更多可能。教育研究一直致力于探索教育規(guī)律和提高教育效果,而大數(shù)據(jù)的應(yīng)用為教育研究提供了更多的研究對象和研究方法。通過分析大數(shù)據(jù),可以揭示學生學習行為、學習難點、學習效果等方面的規(guī)律,發(fā)現(xiàn)教育領(lǐng)域的問題和挑戰(zhàn),并為教育改革和教育政策提供參考和支持。此外,大數(shù)據(jù)還可以用于教師培訓和教學團隊建設(shè),幫助教師和學校提高教學效果和管理水平。
最后,大數(shù)據(jù)教育也面臨著信息安全的挑戰(zhàn)。大數(shù)據(jù)的應(yīng)用涉及到大量的個人隱私數(shù)據(jù),保護學生和教師的個人隱私和信息安全成為一項重要任務(wù)。在大數(shù)據(jù)教育中,不僅需要加強對學生和教師的隱私保護,還需要建立健全的數(shù)據(jù)安全管理體系,加強數(shù)據(jù)權(quán)限控制和訪問控制,保證數(shù)據(jù)的安全性和可靠性。
綜上所述,大數(shù)據(jù)教育為教學設(shè)計、學習評估、個性化教育、教育研究和信息安全提供了新的可能和挑戰(zhàn)。這一新時代的到來,使教育變得更加科學、智能和人性化。但同時也需要我們不斷探索和創(chuàng)新,解決其中的問題和挑戰(zhàn),使大數(shù)據(jù)教育更好地發(fā)揮其優(yōu)勢,推動教育的深入發(fā)展。
大數(shù)據(jù)時代讀書心得篇二十
大數(shù)據(jù)時代的到來,帶來了數(shù)據(jù)的爆炸式增長和深度挖掘的機會。作為一位學生,我通過觀看《大數(shù)據(jù)時代第一集》這部紀錄片,對大數(shù)據(jù)時代有了更深入的了解與體會。在觀看中,我不僅感受到大數(shù)據(jù)對于技術(shù)和商業(yè)的巨大影響,也對個人隱私與數(shù)據(jù)安全產(chǎn)生了更多的關(guān)注。大數(shù)據(jù)時代帶來的機遇與挑戰(zhàn),都需要我們理解和應(yīng)對。
《大數(shù)據(jù)時代第一集》中,紀錄片展示了大數(shù)據(jù)挖掘在商業(yè)領(lǐng)域的巨大價值。通過收集和分析大量的用戶數(shù)據(jù),企業(yè)可以更好地了解消費者需求和行為習慣,進而精準定位和推廣產(chǎn)品。例如,電子商務(wù)公司Alibaba利用大數(shù)據(jù)技術(shù),將推薦給用戶更符合其興趣的商品,提高用戶購買的準確率。這些商業(yè)實踐證明了大數(shù)據(jù)時代對于商業(yè)模式的革新和商業(yè)價值的提升。
第二段:技術(shù)進步的推動。
大數(shù)據(jù)時代的發(fā)展離不開技術(shù)的進步,尤其是人工智能和機器學習的發(fā)展。紀錄片中介紹了谷歌的“Go”人工智能系統(tǒng)戰(zhàn)勝圍棋世界冠軍的案例,以及IBM的人工智能系統(tǒng)“沃森”能夠擊敗“危險邊緣”的案例。這些成果展示了人工智能在大數(shù)據(jù)時代中的巨大潛力和推動力。同時,大數(shù)據(jù)時代也對技術(shù)提出了更高的要求,如數(shù)據(jù)處理和存儲能力的提升,數(shù)據(jù)安全和隱私保護的挑戰(zhàn)等,需要技術(shù)人員進行不斷的研發(fā)和創(chuàng)新。
第三段:數(shù)據(jù)隱私和安全的重要性。
在大數(shù)據(jù)時代,個人數(shù)據(jù)的收集、存儲和分析變得越來越普遍。然而,個人數(shù)據(jù)的濫用和泄露問題也日益突出。紀錄片中提到,一個小小的數(shù)據(jù)點,可能蘊含著個人的隱私和重要信息。因此,數(shù)據(jù)的安全和隱私保護變得至關(guān)重要。不僅是企業(yè)和組織需要采取相應(yīng)措施,個人也需要對自己的數(shù)據(jù)有更多的保護意識。此外,政府和監(jiān)管機構(gòu)也應(yīng)該制定相應(yīng)的法規(guī)和政策,來保護個人的數(shù)據(jù)安全和隱私權(quán)。
第四段:數(shù)據(jù)倫理與責任。
大數(shù)據(jù)時代,數(shù)據(jù)的挖掘和應(yīng)用對于社會帶來巨大的影響。紀錄片中提到,大數(shù)據(jù)分析可以應(yīng)用于疾病預防、城市規(guī)劃等領(lǐng)域,使社會更加智能和高效。然而,數(shù)據(jù)的應(yīng)用也需要考慮數(shù)據(jù)倫理和責任問題。例如,數(shù)據(jù)的歧視性使用和不當利用可能會對個人和社會帶來負面影響。因此,在大數(shù)據(jù)時代,我們需要思考如何在數(shù)據(jù)利用的同時,確保公平、公正和倫理的原則。
作為一個個體,我認識到在大數(shù)據(jù)時代里我將面臨隱私泄露和數(shù)據(jù)濫用的風險。因此,我會在使用網(wǎng)絡(luò)和社交媒體時更加小心,避免泄露個人隱私。同時,我也會更加關(guān)注數(shù)據(jù)倫理和責任的問題,盡量避免對他人數(shù)據(jù)的濫用和歧視性使用。另外,我也會在學習和工作中更加重視數(shù)據(jù)科學和技術(shù)的學習,以便更好地適應(yīng)大數(shù)據(jù)時代的發(fā)展。
在大數(shù)據(jù)時代,我們需要認識到數(shù)據(jù)的重要性和價值,同時也需要關(guān)注數(shù)據(jù)安全、隱私保護、數(shù)據(jù)倫理和責任等問題。只有在全社會共同努力下,才能充分利用大數(shù)據(jù)的潛力,推動社會的發(fā)展和進步。
大數(shù)據(jù)時代讀書心得篇二十一
小數(shù)據(jù)時代,我們在數(shù)據(jù)的精準性上花費很多,包括規(guī)則和準則、復式記賬的平衡規(guī)則、信息系統(tǒng)等等,數(shù)據(jù)閉環(huán),所以數(shù)據(jù)具有結(jié)構(gòu)性,所以可以找根尋蹤,找尋問題的根源,尋求解決方案。
大數(shù)據(jù)時代來臨,因為數(shù)據(jù)量的龐大,以及數(shù)據(jù)背后的繁雜性,以及處理數(shù)據(jù)的知識it工程師和計算者,別忘了,擁有數(shù)據(jù)的是政府和獨角獸商人,所以,他們很難對數(shù)據(jù)進行深度分析,這樣也會催生各個領(lǐng)域的數(shù)據(jù)分析業(yè)務(wù),數(shù)據(jù)生態(tài)鏈核心就清晰了起來。
大數(shù)據(jù)會取代小數(shù)據(jù)嗎?這是不可能的事,大數(shù)據(jù)和中小數(shù)據(jù)之間的防火墻更會高筑!
大數(shù)據(jù)都是基于樣本的非結(jié)構(gòu)性數(shù)據(jù),推送到我們面前的數(shù)據(jù)指引,都已經(jīng)經(jīng)過了各種算法的粗加工,融入了計算者的各種算法,算法會因人而異,利用我們過去的電子痕跡,預測我們的現(xiàn)在和未來,一花一世界。
初期的一大一小,數(shù)據(jù)的交融,像極了海上的漁網(wǎng),具有強關(guān)聯(lián)性。
數(shù)據(jù)就像是一個神奇的鉆石礦,在其首要價值被發(fā)覺后,仍能不斷創(chuàng)造價值。大數(shù)據(jù)擁有者依賴技術(shù)專家挖掘數(shù)據(jù)的價值,但技術(shù)專家(數(shù)據(jù)武士)并沒有想象中那么耀眼,他們在大數(shù)據(jù)中淘金,發(fā)現(xiàn)了金銀珠寶,可最后卻要把這些財富拱手讓給大數(shù)據(jù)擁有者。
【本文地址:http://www.aiweibaby.com/zuowen/18842781.html】