數據質量的評價指標主要包括數據的準確性(accuracy)、完整性(completeness)、簡潔性(concision)及適用性(applicability),其中數據的準確性、完整性和簡潔性是為了保證數據的適用性。下面針對數據質量的主要評價指標進行詳細的介紹。 查看全文>>
Python+大數據技術文章2022-06-28 |傳智教育 |數據質量的評價指標
無論是在Scala中還是Java中,類都是對象的抽象,而對象都是類的具體實例;類不占用內存,而對象占用存儲空間。由于面向對象的核心是對象,若想要在應用程序中使用對象,就必須得先創(chuàng)建一個類。類是用于描述一組對象的共同特征和行為。 查看全文>>
Python+大數據技術文章2022-06-17 |傳智教育 |Scala面向對象的特性
邏輯結構反映的是數據元素之間的關系,它們與數據元素在計算機中的存儲位置無關,是數據結構在用戶面前所呈現的形式。根據不同的邏輯結構來分,數據結構可分為集合、線性結構、樹形結構和圖形結構4種形式,接下來分別進行簡要介紹。 查看全文>>
Python+大數據技術文章2022-06-08 |傳智教育 |描述元素與元素間的邏輯關系,數據結構類型劃分
一個正常運營的產品每天會產生大量的數據,如果把這些數據都收集起來進行分析,不僅會使工作量增加,浪費大量時間,很可能還會得不到想要的分析結果。作為一名數據分析人員,更不應該為了分析而分析,而是應該緊緊圍繞你的分析目的(了解現狀、分析業(yè)務變動原因、預測發(fā)展趨勢等)去進行分析。所以,在開始數據收集工作之前,就應該先把數據分析的目的梳理清楚,防止出現”答非所問”的數據分析結果。 查看全文>>
Python+大數據技術文章2022-05-31 |傳智教育 |數據分析常見的誤區(qū)
今天的Python大數據培訓課程我們講一下MapTask工作原理,MapTask作為MapReduce工作流程的前半部分,它主要經歷了5個階段,分別是Read階段、Map階段、Collect階段、Spill階段和Combine階段,如圖4-7所示。 查看全文>>
Python+大數據技術文章2022-05-26 |傳智教育 |Python大數據培訓,MapTask工作原理
數據庫是存儲和管理數據的倉庫,但數據庫并不能直接存儲數據,數據是存儲在表中的,在存儲數據的過程中一定會用到數據庫服務器,所謂的數據庫服務器就是指在計算機上安裝一個數據庫管理程序,如MySQL。數據庫、表、數據庫服務器之間的關系,如圖所示。 查看全文>>
Python+大數據技術文章2022-05-25 |傳智教育 |數據庫中數據的儲存結構和方式
在Scala中,集合有三大類:List、Set以及Map,所有的集合都擴展自Iterable特質。Scala集合分為可變的(mutable)和不可變(immutable)的集合。其中,可變集合可以在適當的地方被更新或擴展,意味著可以對集合進行修改、添加、移除元素;不可變集合類,相比之下,初始化后就永遠不會改變。 查看全文>>
Python+大數據技術文章2022-05-23 |傳智教育 |List,Set,Map
MySQL安裝完成后,需要啟動服務進程,否則客戶端無法連接數據庫。在前面的配置過程中,已經將MySQL安裝為Windows服務,當Windows啟動時MySQL服務也會隨著啟動,然而有時需要手動控制MySQL服務的啟動與停止,此時可以通過兩種方式來實現。 查看全文>>
Python+大數據技術文章2022-05-23 |傳智教育 |MySQL的使用