職位描述
職位概述作為AI算法工程師(專注于圖像/視頻生成技術(shù)),您將在我們的團(tuán)隊(duì)中扮演關(guān)鍵角色,負(fù)責(zé)開發(fā)和優(yōu)化深度學(xué)習(xí)模型,以生成高質(zhì)量的圖像和視頻內(nèi)容。您的工作將不僅限于傳統(tǒng)的生成對(duì)抗網(wǎng)絡(luò)(GANs)和變分自編碼器(VAEs),還將深入探索最新的技術(shù),如Transformer和擴(kuò)散模型,這些技術(shù)已經(jīng)開始在圖像合成、風(fēng)格轉(zhuǎn)換、文本到圖像的生成等領(lǐng)域展示出其強(qiáng)大的能力。主要職責(zé)- 設(shè)計(jì)和實(shí)施使用GANs、VAEs、Transformer和擴(kuò)散模型的高效、可擴(kuò)展的圖像和視頻生成、編輯和增強(qiáng)算法。- 積極跟蹤最新的人工智能研究和技術(shù)發(fā)展,特別是在圖像和視頻生成領(lǐng)域的最新進(jìn)展,如Transformer和擴(kuò)散模型,并將這些新技術(shù)應(yīng)用到實(shí)際項(xiàng)目中。- 與產(chǎn)品和工程團(tuán)隊(duì)緊密合作,將復(fù)雜的機(jī)器學(xué)習(xí)模型有效集成到產(chǎn)品中,確保技術(shù)解決方案可以滿足業(yè)務(wù)需求,并在性能和質(zhì)量方面達(dá)到高標(biāo)準(zhǔn)。- 深入分析和解決模型在訓(xùn)練和部署過程中遇到的挑戰(zhàn),包括但不限于模型優(yōu)化、擴(kuò)展性問題和計(jì)算資源利用率。- 扎實(shí)的機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)和transformer基礎(chǔ);精通大語言模型技術(shù)棧,熟練實(shí)踐LLMs微調(diào)、agent workflow、RAG等技術(shù)應(yīng)用,尤其在工作流(類langchain)、RAG(類graphRAG)、webRTC上具備技術(shù)開發(fā)、調(diào)優(yōu)和創(chuàng)新能力。- 貢獻(xiàn)高質(zhì)量的代碼庫,編寫詳盡的技術(shù)文檔,并通過內(nèi)部分享提升團(tuán)隊(duì)的技術(shù)能力和知識(shí)水平。職位要求- 擁有計(jì)算機(jī)科學(xué)、人工智能、應(yīng)用數(shù)學(xué)或相關(guān)領(lǐng)域的碩士學(xué)位。- 至少2年以上在深度學(xué)習(xí)、計(jì)算機(jī)視覺或相關(guān)領(lǐng)域的實(shí)際工作經(jīng)驗(yàn),特別是在圖像和視頻生成領(lǐng)域。- 扎實(shí)的機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)和transformer基礎(chǔ);精通大語言模型技術(shù)棧,熟練實(shí)踐LLMs微調(diào)、agent workflow、RAG等技術(shù)應(yīng)用,尤其在工作流(類langchain)、RAG(類graphRAG)、webRTC上具備技術(shù)開發(fā)、調(diào)優(yōu)和創(chuàng)新能力。- 對(duì)GANs、VAEs、Transformer和擴(kuò)散模型等生成模型有深入理解,并具有實(shí)際的應(yīng)用和研究經(jīng)驗(yàn)。- 精通Python編程,以及TensorFlow、PyTorch等主流深度學(xué)習(xí)框架。- 具備優(yōu)秀的問題解決能力,能夠獨(dú)立研究并解決技術(shù)問題。- 良好的團(tuán)隊(duì)合作精神和溝通技巧,能夠在快節(jié)奏的環(huán)境中與多個(gè)團(tuán)隊(duì)有效合作。加分項(xiàng)- 在圖像/視頻生成領(lǐng)域的會(huì)議或期刊上發(fā)表過相關(guān)論文。- 有使用GPU和TPU等硬件加速技術(shù)來優(yōu)化大規(guī)模深度學(xué)習(xí)模型的經(jīng)驗(yàn)。- 對(duì)其他深度學(xué)習(xí)技術(shù),如自監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等,有實(shí)際的應(yīng)用經(jīng)驗(yàn)和深入理解。
企業(yè)介紹
一、公司介紹 愛化身科技是一家專注于融合虛擬現(xiàn)實(shí)與人工智能的技術(shù)提供商,致力于以AI賦能下一代數(shù)字內(nèi)容生產(chǎn)。公司2021年成立于北京市,核心業(yè)務(wù)為數(shù)字人及其相關(guān)衍生應(yīng)用的開發(fā),應(yīng)用場(chǎng)景涵蓋5G新通信、企業(yè)私域、線下終端等領(lǐng)域。 公司核心團(tuán)隊(duì)成員均出自北京大學(xué)以及全球計(jì)算機(jī)圖形學(xué)和虛擬現(xiàn)實(shí)領(lǐng)域的研究機(jī)構(gòu),憑借自主研發(fā)打造出一套全面的技術(shù)體系,覆蓋了2D和3D數(shù)字內(nèi)容生產(chǎn)的同時(shí),融入了AIGC的創(chuàng)新技術(shù),為數(shù)字內(nèi)容創(chuàng)作和生產(chǎn)帶來了革命性的變革。 公司是國家高新技術(shù)企業(yè)、創(chuàng)新型中小企業(yè)與科技型中小企業(yè),多次榮獲行業(yè)重量級(jí)獎(jiǎng)項(xiàng)。已為上海銀行、興業(yè)銀行、百信銀行、中國移動(dòng)、西門子等頭部金融機(jī)構(gòu)和大型企業(yè)提供了技術(shù)和營(yíng)銷服務(wù),并以專業(yè)的技術(shù)能力和卓越的服務(wù)態(tài)度獲得了客戶一致的認(rèn)可和贊賞。二、業(yè)務(wù)介紹 基于長(zhǎng)期在數(shù)字人落地應(yīng)用方面的探索,愛化身現(xiàn)提供一整套 AI數(shù)字人營(yíng)銷解決方案。通過綜合運(yùn)用2D/3D數(shù)字人的資產(chǎn)納管、實(shí)時(shí)驅(qū)動(dòng)和視頻生產(chǎn)能力,結(jié)合先進(jìn)的智能交互、內(nèi)容生成等AIGC技術(shù),打造以數(shù)字人為核心的視頻內(nèi)容和直播內(nèi)容,并基于5G新通信、企業(yè)私域、線下終端等渠道實(shí)現(xiàn)分發(fā),豐富營(yíng)銷形式、拓展?fàn)I銷觸達(dá)、提升營(yíng)銷效果,讓數(shù)字人成為企業(yè)營(yíng)銷的好工具、好幫手、好伙伴。