數(shù)據(jù)解讀是數(shù)據(jù)分析師的基本功,如果不能充分理解數(shù)據(jù)分析中出現(xiàn)的各類指標(biāo)及術(shù)語,數(shù)據(jù)分析工作將很難展開。對于數(shù)據(jù)分析師來說,了解常用的分析指標(biāo)和術(shù)語是做好數(shù)據(jù)解讀的前提。本節(jié)將對數(shù)據(jù)分析常用指標(biāo)及術(shù)語進行講解。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2022-03-29 |傳智教育 |數(shù)據(jù)分析師,數(shù)據(jù)分析常用的術(shù)語和指標(biāo)
Spark是基于內(nèi)存計算的大數(shù)據(jù)并行計算框架,比MapReduce計算框架具有更高的實時性,同時具有高效容錯性和可伸縮性,在學(xué)習(xí)Spark操作之前,首先介紹Spark運行架構(gòu)和基本運行流程... 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2022-03-29 |傳智教育 |Spark集群的運行架構(gòu)和基本原理
使用Hadoop進行大數(shù)據(jù)運算,當(dāng)數(shù)據(jù)量極其大時,那么對MapReduce性能的調(diào)優(yōu)重要性不言而喻,尤其是Shuffle過程中的參數(shù)配置對作業(yè)的總執(zhí)行時間影響特別大。下面總結(jié)一些和MapReduce相關(guān)的性能調(diào)優(yōu)方法,主要從五個方面考慮:數(shù)據(jù)輸入、Map階段、Reduce階段、Shuffle階段和其他調(diào)優(yōu)屬性。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2022-03-28 |傳智教育 |MapReduce性能調(diào)優(yōu)方法
matplotlib內(nèi)置了眾多預(yù)定義的顏色映射表,使用這些顏色映射表可以為用戶提供更多的顏色建議,為用戶節(jié)省大量的開發(fā)時間。pyplot模塊中提供了colormaps()函數(shù)用于查看所有可用的顏色映射表,示例代碼及運行結(jié)果如下。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2022-03-28 |傳智教育 |matplotlib,顏色映射表
執(zhí)行查詢操作時,集合中的文檔存在適當(dāng)?shù)乃饕?,MongoDB就可以使用該索引限制必須檢查的文檔數(shù)量。MongoDB的索引可以分為六種,即單字段索引、復(fù)合索引、多鍵索引、地理空間索引、全文本索引以及哈希索引,六種索引的詳細介紹,具體如下: 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2022-03-25 |傳智教育 |索引,MongoDB中有幾種索引
高爾基說:“書籍是人類進步的階梯。”據(jù)統(tǒng)計韓國人年均閱讀量為7本,日本人年均閱讀量為40本。相比較而言,中國人的閱讀量還有進步空間。已知地區(qū)1和地區(qū)2對各類圖書的采購情況如表4-3所示。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2022-03-25 |傳智教育 |Python培訓(xùn),圖書采購堆積圖
matplotlib通過靈活地修改配置項來改變圖表的樣式,而不必拘泥于系統(tǒng)默認(rèn)的配置。圖表的樣式可以通過兩種方式進行修改:局部修改和全局修改。下面介紹一下局部修改的方式。局部修改的方式是指通過代碼動態(tài)地修改matplotlib配置項,此方式用于滿足程序局部定制的需求。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2022-03-24 |傳智教育 |matplotlib,圖表樣式修改
美好的一天從早餐開始,果醬面包是常見的早餐且深受大家喜愛,無論是大人還是小孩都很愛吃。已知某果醬面包需要準(zhǔn)備的配料如表3-4所示。根據(jù)表3-4的數(shù)據(jù),將“配料名稱”一列的數(shù)據(jù)作為圖例項,將“重量”一列的數(shù)據(jù)與總重量的比例作為數(shù)據(jù) 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2022-03-24 |傳智教育 |Python培訓(xùn),繪制果醬面包配料比例