基于人工智能的用戶畫像構建
-
課程目標
社交網絡用戶的數(shù)據(jù)對象、數(shù)據(jù)主題、數(shù)據(jù)類型、數(shù)據(jù)維度和數(shù)據(jù)關系都十分豐富。面對數(shù)據(jù)應用業(yè)務場景的多樣性,如何滿足業(yè)務靈活多變的數(shù)據(jù)需求,構建用戶畫像大數(shù)據(jù)生態(tài)體系,是當前用戶大數(shù)據(jù)提出的解決方案之一。本課題旨在幫助學員了解各種數(shù)據(jù)挖掘算法的基本原理及其編程實現(xiàn)方法,以及最新的深度學習算法的原理及其Python編程實現(xiàn)方法等內容,實現(xiàn)用戶畫像的快速、準確構建。本課程班采用“實際案例講解、動手編程實踐”相結合的方式進行授課。
-
師資團隊
-
華清創(chuàng)客企業(yè)內訓講師,均是來自各個領域的資深專家,均擁有6年以上大型項目經驗。
-
培養(yǎng)對象
學員學習本課程應具備下列基礎知識:
①具備Python/Java語言編程的基本知識和初步技能;
②了解基本的數(shù)據(jù)挖掘知識; -
培訓方式
第一種:華清創(chuàng)客講師面授
課時:共4天,每天6學時,總計24學時
◆費用:3200元
◆外地學員:代理安排食宿(需提前預定)
第二種:線上直播授課
直播課時:共8天,每天3學時,總計24學時;
輔導:授課期間,輔導老師每天有1小時的輔導直播
◆費用:3200元
第三種:企業(yè)訂制培訓
課時:根據(jù)定制的大綱確定課時
費用:根據(jù)課程難度,每課時2000~3500元
-
-
質量保證
1、培訓過程中,如有部分內容理解不透或消化不好,可免費在下期培訓班中重聽;
2、培訓結束后免費提供一個月的技術支持,充分保證培訓后出效果;
3、培訓合格學員可享受免費推薦就業(yè)機會。
-
課程大綱
第一部分 用戶畫像概述
1. 用戶畫像的概念
2. 用戶畫像的用途
3. 用戶畫像實戰(zhàn)場景介紹
4. 用戶畫像構建方法
第二部分 基礎工具包介紹
1. Python編程入門
2. Scikit-learn工具包簡介
3. Weka工具包簡介
4. 系列案例:常用機器學習方法的Python實現(xiàn)
5. 系列案例:基于Scikit-learn的分類模型構建
第三部分 數(shù)據(jù)預處理
1. 數(shù)據(jù)預處理目的
2. 數(shù)據(jù)預處理原則
3. 數(shù)據(jù)預處理內容
4. 數(shù)據(jù)預處理方法
5. 案例實踐:微博數(shù)據(jù)清洗實戰(zhàn)
第四部分 特征選擇
1. 特征選擇概念
2. 特征選擇基本步驟
3. 特征選擇方法
4. 案例實踐:微博數(shù)據(jù)特征選擇實戰(zhàn)
第五部分 用戶畫像體系構建
1. 基于規(guī)則的特征標簽識別技術
2. 基于模型的特征標簽識別技術
3. 基于算法的人物特征標簽識別技術
4. 用戶畫像構建的常用技術總結
第六部分 傳統(tǒng)文本分類方法
1. 文本分類定義
1. 詞袋模型
2. 共現(xiàn)矩陣
3. TF-IDF
4. 文本分類的常用方法和主流算法
5. 文本分分類的評估指標
6. 案例實踐:樸素貝葉斯分類器實戰(zhàn)
第七部分 深度學習文本分類模型
1. TextCNN模型
2. LSTM模型
3. RCNN模型
4. FastText模型
第八部分 用戶畫像案例實戰(zhàn)
1. 微博用戶性別畫像
2. 搜索用戶畫像構建
- 贊