職位描述
崗位職責:
1、對百度CDN PB級別數(shù)據(jù)進行離線、實時處理;
2、基于Hadoop、Spark、Storm設計并實現(xiàn)大規(guī)模機器學習算法;
3、參與大規(guī)模數(shù)據(jù)服務平臺架構(gòu)的系統(tǒng)設計、實現(xiàn)和調(diào)優(yōu);
任職資格:
1、較好的數(shù)學基礎(chǔ)和算法基礎(chǔ);
2、熟練掌握一門以上編程語言(Java/Python/Scala/C&C++),熟悉Linux開發(fā)環(huán)境;
3、熟悉主流分布式處理框架——Hadoop、HBase、hive、Kafka等,掌握MapReduce、Storm或者Spark編程。
4、熟悉機器學習的基本理論,了解常見機器學習算法;
5、熟悉分布式開發(fā)環(huán)境,熟悉多線程及并發(fā)技術(shù),熟悉網(wǎng)絡編程
6、有較強的分析和解決問題的能力;
7、有持續(xù)學習新知識的能力和意愿,善于溝通和邏輯表達,優(yōu)秀的團隊合作意識,積極主動。
企業(yè)介紹
百度,全球最大的中文搜索引擎、最大的中文網(wǎng)站。2000年1月創(chuàng)立于北京中關(guān)村。
百度擁有數(shù)千名研發(fā)工程師,這是中國乃至全球最為優(yōu)秀的技術(shù)團隊,這支隊伍掌握著世界上最為先進的搜索引擎技術(shù),使百度成為中國掌握世界尖端科學核心技術(shù)的中國高科技企業(yè),也使中國成為美國、俄羅斯、和韓國之外,全球僅有的4個擁有搜索引擎核心技術(shù)的國家之一。
從創(chuàng)立之初,百度便將“讓人們最便捷地獲取信息,找到所求”作為自己的使命,成立以來,公司秉承“以用戶為導向”的理念,不斷堅持技術(shù)創(chuàng)新,致力于為用戶提供“簡單,可依賴”的互聯(lián)網(wǎng)搜索產(chǎn)品及服務,其中包括:以網(wǎng)絡搜索為主的功能性搜索,以貼吧為主的社區(qū)搜索,針對各區(qū)域、行業(yè)所需的垂直搜索,Mp3搜索,以及門戶頻道、IM等,全面覆蓋了中文網(wǎng)絡世界所有的搜索需求,根據(jù)第三方權(quán)威數(shù)據(jù),百度在中國的搜索份額超過80%。