2019Python爬蟲與文本挖掘核心技術(shù)培訓(xùn)班(8月北京班)
時間:2019-08-16 09:00 至 2019-08-19 16:30
地點:北京

- 參會報名
- 會議通知
- 會議日程
- 會議嘉賓
- 參會指南
-
手機(jī)下單
首頁 > 商務(wù)會議 > IT互聯(lián)網(wǎng)會議 > 2019Python爬蟲與文本挖掘核心技術(shù)培訓(xùn)班(8月北京班) 更新時間:2019-09-06T09:07:49
![]() |
![]() 2019Python爬蟲與文本挖掘核心技術(shù)培訓(xùn)班(8月北京班) 已截止報名會議時間: 2019-08-16 09:00至 2019-08-19 16:30結(jié)束 會議地點: 北京 北京科技大學(xué) 北京市海淀區(qū)學(xué)院路30號 周邊酒店預(yù)訂 會議規(guī)模:50人 主辦單位: 北京軟數(shù)信息技術(shù)研究院
|
會議通知
會議內(nèi)容 主辦方介紹

2019Python爬蟲與文本挖掘核心技術(shù)培訓(xùn)班(8月北京班)宣傳圖
?“Python爬蟲與文本挖掘核心技術(shù)”培訓(xùn)班通知
隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡(luò)信息呈現(xiàn)指數(shù)式增長,要在短時間內(nèi)獲取大量信息,網(wǎng)絡(luò)爬蟲無疑是一種最適合的方法。通過爬蟲獲取的海量信息,我們可以對其進(jìn)行進(jìn)一步的分析:市場預(yù)測、文本分析、機(jī)器學(xué)習(xí)方法等。
Python作為一門腳本語言,它靈活、易用、易學(xué)、適用場景多,實現(xiàn)程序快捷便利,早已經(jīng)成為程序員們的一門編程利器。Python這門編程語言包羅萬象,可以說掌握了python,除了一些特殊環(huán)境和高度的性能要求,你可以用它做任何事。為提升相關(guān)科技工作者的技術(shù)水平,北京軟數(shù)信息技術(shù)研究院特舉辦“Python爬蟲與文本挖掘核心技術(shù)”培訓(xùn)班,本次培訓(xùn)從爬蟲的基本知識入手,使用Python作為實現(xiàn)工具,一步步地講述網(wǎng)絡(luò)爬蟲的實現(xiàn),具體內(nèi)容如下:
【培訓(xùn)目標(biāo)】
1、讓學(xué)員快速掌握python語言基礎(chǔ)及Python爬蟲項目的編寫,學(xué)會獨立開發(fā)常見的爬蟲項目,并能勝任相關(guān)工作;2、解決學(xué)員實際工作中的疑難問題。
【時間地點】
2019年08月16日——2019年08月19日 ??北京
(時間安排:第一天報到,授課三天)
【培訓(xùn)對象】
?各省市、自治區(qū)從事為電信、電力、政府、互聯(lián)網(wǎng)、生產(chǎn)制造、零售、銀行、生物、化工、醫(yī)藥等與數(shù)據(jù)分析、挖掘相關(guān)的企事業(yè)單位技術(shù)骨干、科研院所研究人員和大專院校相關(guān)專業(yè)教學(xué)人員及在校研究生、碩士、博士等相關(guān)人員。
【頒發(fā)證書】
參加相關(guān)培訓(xùn)并通過考試的學(xué)員可獲得由工業(yè)和信息化部通信和信息技術(shù)創(chuàng)新人才培養(yǎng)工程頒發(fā)《數(shù)據(jù)挖掘應(yīng)用》職業(yè)水平證書。
北京軟數(shù)信息技術(shù)研究院
2019年07月17日?
查看更多
會議日程
(最終日程以會議現(xiàn)場為準(zhǔn))
python爬蟲與文本挖掘核心技術(shù)課程大綱
第一天:python基礎(chǔ) ??與爬蟲入門 |
第一章:Python基礎(chǔ) |
<1.0>初識Python與Anaconda <1.1>變量類型、數(shù)據(jù)結(jié)構(gòu) <1.2>?Python控制流語句 <1.3>?Python函數(shù)與類 |
第二章:Python數(shù)據(jù)分析常用庫 |
<2.0>使用Numpy進(jìn)行數(shù)值計算 <2.1>使用Matplotlib進(jìn)行數(shù)據(jù)可視化 <2.2>使用Pandas進(jìn)行數(shù)據(jù)分析 <2.3>使用Sci-Kit Learn進(jìn)行模型構(gòu)建 |
|
第三章:Python爬蟲技術(shù)入門 |
<3.0>認(rèn)識爬蟲與反爬蟲 <3.1>配置環(huán)境變量 <3.2>Python爬蟲的基本流程 <3.3>正則表達(dá)式 |
|
案例1:航空公司客戶價值分析 案例2:使用正則表達(dá)式提取電話號碼 |
||
第二天:python爬蟲進(jìn)階 |
第四章:Python爬蟲核心技術(shù) |
<4.0> urllib3, requests模塊實現(xiàn)HTTP請求 <4.1>網(wǎng)頁解析(正則表達(dá)式、XPath、BeautifulSoup) <4.2>數(shù)據(jù)存儲 <4.3>模擬登陸(表單登陸、Cookies登陸) <4.4>驗證碼識別 |
第五章:Python爬蟲技術(shù)進(jìn)階 |
<5.0>安裝Selenium庫及瀏覽器補(bǔ)丁 <5.1>打開瀏覽器對象并訪問網(wǎng)頁 <5.2>頁面等待 <5.3>頁面操作 <5.4>預(yù)期條件 <5.5>信息提取 |
|
案例1:前程無憂招聘信息提取 案例2:模擬登陸數(shù)睿思網(wǎng)站 案例3:《流浪地球》豆瓣影評分析? |
||
第第三天:文本分析基礎(chǔ)和進(jìn)階 ? |
第六章:文本挖掘入門 |
<6.0>文本挖掘概述 <6.1>分詞(jieba庫) <6.2>去除停用詞 <6.3>詞云(WordCloud)繪制 <6.4>文本的向量表示 |
第七章:文本挖掘進(jìn)階 |
<7.0>文本分類(Text Classifier) <7.1>文本聚類(Text Clustering) <7.2>主題模型(Topic Model) |
|
案例1: 基于文本挖掘的垃圾短信識別 案例2:電商評論主題模型構(gòu)建 |
查看更多
會議嘉賓
(最終出席嘉賓以會議現(xiàn)場為準(zhǔn))
【主講專家】
楊老師:北京軟數(shù)信息技術(shù)研究院特邀講師,具備豐富的培訓(xùn)經(jīng)驗,曾為多家企業(yè)、院校服務(wù)過專業(yè)培訓(xùn)工作。從事數(shù)據(jù)挖掘工作五年,擅長文本挖掘及深度神經(jīng)網(wǎng)絡(luò)RNN,熟悉常用機(jī)器學(xué)習(xí)算法原理及應(yīng)用,如神經(jīng)網(wǎng)絡(luò)、SVM、決策樹、貝葉斯等算法;精通R、Python、Matlab等常用數(shù)據(jù)挖掘處理工具。具有豐富的實踐項目經(jīng)驗。如“京東電商產(chǎn)品評論情感分析”項目;“珠江數(shù)碼大數(shù)據(jù)營銷推薦應(yīng)用”項目;“電子商務(wù)網(wǎng)站智能推薦服務(wù)”項目。
查看更多
參會指南
會議門票 場館介紹
【培訓(xùn)費用】
A類:¥RMB:3900/人(含報名費、培訓(xùn)費、教材資料費、場地費、午餐費、證書費等)
B類:¥RMB:3500/人(含報名費、培訓(xùn)費、教材資料費、場地費、午餐費、證書費等)
此費用為學(xué)生優(yōu)惠價,需簽到時出示學(xué)生證;
食宿可統(tǒng)一安排,費用自理。
頒發(fā)證書:參加相關(guān)培訓(xùn)并通過考試的學(xué)員可獲得由工業(yè)和信息化部通信和信息技術(shù)創(chuàng)新人才培養(yǎng)工程頒發(fā)《數(shù)據(jù)挖掘應(yīng)用》職業(yè)水平證書。
查看更多

交通指南:
北京市海淀區(qū)學(xué)院路30號
北京科技大學(xué)(University of Science & Technology Beijing,USTB)是教育部直屬全國重點大學(xué),為國家“211工程”、“985工程優(yōu)勢學(xué)科創(chuàng)新平臺”重點建設(shè)院校,入選“2011計劃”、“卓越工程師教育培養(yǎng)計劃”、“高等學(xué)校學(xué)科創(chuàng)新引智計劃(111計劃)“、“國家建設(shè)高水平大學(xué)公派研究生項目”,設(shè)有研究生院,是北京高科大學(xué)聯(lián)盟成員 。
學(xué)校于1952年由原北洋大學(xué)、清華大學(xué)等6所國內(nèi)著名大學(xué)的礦冶科系組建而成,初名北京鋼鐵工業(yè)學(xué)院,1960年更名北京鋼鐵學(xué)院,是全國首批成立研究生院的22所高校之一。1988年定名北京科技大學(xué),1997年5月,學(xué)校首批進(jìn)入國家211工程”建設(shè)高校行列。2006年,學(xué)校成為首批“985工程”優(yōu)勢學(xué)科創(chuàng)新平臺建設(shè)項目高校。2014年,入選國家“2011計劃”?,F(xiàn)已發(fā)展成為一所以工科為主,工學(xué)、理學(xué)、管理學(xué)、文學(xué)、經(jīng)濟(jì)學(xué)、法學(xué)等多學(xué)科協(xié)調(diào)發(fā)展的研究型重點大學(xué)。
溫馨提示
酒店與住宿:
為防止極端情況下活動延期或取消,建議“異地客戶”與活動家客服確認(rèn)參會信息后,再安排出行與住宿。
退款規(guī)則:
活動各項資源需提前采購,購票后不支持退款,可以換人參加。
您可能還會關(guān)注
-
2025中國互聯(lián)網(wǎng)大會
2025-07-23 北京
-
AiCon深圳2025|全球人工智能開發(fā)與應(yīng)用大會
2025-08-22 深圳
-
AI+創(chuàng)新技術(shù)大會
2025-11-20 上海
-
AiCon北京2025|全球人工智能與大模型應(yīng)用峰會·12月
2025-12-18 北京