品牌时光机-品牌案例《快手校招职位解读・算法类↓↓还有运营、产品、工程类解读请领取》

校 / 招 / 职 / 位 / 解 / 读

序言

快手2022校招已经启动。本次快手在多个算法领域开出校招职位，包括机器学习、CV、图形学、音视频处理等，共计13个细分领域。为了帮助大家深入了解快手在每个算法领域专注的研究方向和相关成果，我们为大家准备了这份“校招职位解读”，请查收～

导言

2013 年底，快手开始在产品中注入推荐算法。从草根江湖到星辰大海，快手已然成为一家以人工智能（AI）为核心技术的科技公司。AI深入产品骨髓，贯穿于内容生产、内容审核、内容分发、内容消费的全业务流程。快手的AI算法致力于让每一个人的生活都被看见，用有温度的科技提升每一个人的幸福感。在快手，用AI拥抱每一种生活。

算法类职位细分为机器学习、数据科学、自然语言处理、推荐、广告、搜索、计算机视觉、计算机图形学、视频增强和处理、音频处理、视频编解码、网络传输、系统架构等领域。

01.机器学习

点击空白处查看解读

机器学习着重对AI通用方法论和AI系统进行探索和挖掘，是计算机视觉（CV）、图像、自然语言处理（NLP）、推荐、广告、搜索等业务和应用场景的核心基础。机器学习在快手主要承担了两方面的角色，一是支持各个业务线的算法研发和业务突破，帮助解决业务线最棘手的技术问题；二是为公司搭建通用AI生成和上线的流程并建设通用的AI工具，比如通用训练和推理框架、AutoML的能力等，以提升公司的整体流程。快手这些领域都取得了非常瞩目的技术成果和业务成果，下面列举一些涉猎到的方向——

● 训练框架：

包括sparse（搜推广）场景的训练框架和dense（CV/NLP/speech）场景的训练框架，快手在这两方面都取得了业内瞩目的成就。快手新创建sparse场景的训练框架“Persia”GPU广告模型训练平台，把GPU引入推荐场景，相对于经典的CPU方案提升了两个量级的效率。dense场景的训练框架Bagua是多机多卡训练框架，相较其他开源框架取得了显著的性能提升，扩展效率相比其他系统有显著提升。

● 推理框架：

快手有着丰富和超大规模的推理服务需求。我们自研的推理框架融合了算法、GPU优化、编译优化等大量的技术手段，能达到广告场景千万量级的全量召回。

● AutoML：

涵盖了AutoML所涉猎的所有方向，包括模型压缩、模型结构搜索、超参搜索三个功能。其中自研的Hammer框架实现了端到端，并且融合了所有压缩手段的模型压缩工具，在公司内部30余个业务场景中使用，跟当前开源框架相比，Hammer新增多种特点。

此外，在图计算、强化学习、游戏AI、对抗学习等方向也非常丰富的业务成果和技术产出，其中斗地主AI、麻将AI都长期占据botzone天梯第一。

在快手，机器学习方向是一个能同时在技术和方法论上提升，同时还能有丰富业务落地场景的方向。除了丰硕的业务成果，还保持每年20篇以上的顶会论文发表。

⬇️链接：

- 单机训练速度提升640倍！独家解读快手商业广告模型GPU训练平台Persia

- 剪枝需有的放矢，快手&罗切斯特大学提出基于能耗建模的模型压缩

- ICLR 2021 | 快手联合多所高校提出: 一体化模型压缩框架(UMEC), 加速推荐场景落地

- 快手开源斗地主AI，入选ICML，能否干得过「冠军」柯洁？

- 快手接连获得2项重量级科技奖项

- 快手八卦！突破TensorFlow、PyTorch并行瓶颈的开源分布式训练框架来了！

- 快手&UT Austin手提出Once-for-All对抗学习算法实现运行时可调节模型鲁棒性

02.数据科学

点击空白处查看解读

如何将商业理解、量化模型、和数据技术进行高度融合，并通过数据驱动赋能让决策更科学与高效，是快手不断探索的话题。快手是一个拥有海量UGC数据和复杂商业场景的用户社区，为了更好地理解丰富的用户行为和社区生态，数据分析师和数据科学家们需要将开放的商业问题进行收敛，并有针对性地选择适当的量化框架进行后验数据分析和建模；同时，我们也需要通过A/B实验分析、复杂实验设计和因果推断对决策者所提出的业务假设进行科学、严谨的验证。在这里，同学们将有机会学习和应用——

● 观测分析：

在非实验场景中的不同商业场景下将统计学、心理学、行为学、计量经济学理论框架与机器学习相结合，包括基于生存模型的用户活跃与留存分析，基于韦伯费希纳定律的用户行为理解，基于矩阵分解技术的用户行为规律发掘，以及基于可解释模型技术的商业场景挖掘等。

● 机器学习：

借助快手内部前沿的离线模型训练平台，利用用户行为序列数据和BST对用户历史行为进行建模，使用DL、MMOE多任务等模型框架建设用户的生命周期价值和活跃度的预测模型体系，搭建快手的长期关键业务指标的预测与仿真模拟体系。

● 因果推断：

针对快手业务场景，设计和分析各类A/B实验，识别和解决网络效应对于实验因果推断的干扰，从统计数据科学模型角度完善公司级别A/B实验因果推断平台；结合前沿的机器学习算法和计量经济学方法，开发和应用因果图、面板数据、异质性因果效应等因果推断算法工具，准确度量活动、产品框架、推荐算法迭代的影响。

● 优化算法：

借助多臂老虎机、强化学习、线性规划理论，将数据与最优化理论结合起来帮助业务寻找推荐算法的优化方向、进行长期预算的最优分配。

快手的数据科学家和数据分析师们来自于国内外一流大学及一线互联网公司。他们擅长将日常工作中的优秀理论与实践进行系统化总结和沉淀，多名同学都曾参与出版了《数据科学工程实践》一书。

⬇️链接：

- 高维固定效应的面板数据因果推断Python开源工具

https://github.com/ksecology/FixedEffectModel

- 快手自研的基于深度学习框架的生存分析开源软件

https://github.com/kwaiDA/KwaiSurvival

03.自然语言处理

点击空白处查看解读

快手拥有海量的视频、图片和文本信息。在快手，NLP的任务是针对文本信息进行深入的挖掘、理解和生成，并进一步与其他视频、图像等模态的信息进行融合，完成内容的多模态理解和多模态数据的生成。

行业领先的NLP技术是快手实现凝聚用户的技术基石，是快手维持稳定发展的技术保障。快手独特的应用场景，对传统的NLP技术提出了更多的挑战。快手在NLP领域有着积累深厚的研发团队，汇聚了文本分类、序列标记、机器翻译、文本生成、观点/热点挖掘、多语言、预训练等多个方向的资深专家和工程师。他们致力于应用精湛的NLP技术更好地服务客户，应用场景涉及评论分析、智能标题/弹幕、字幕翻译、新闻推荐、视频搜索以及社区安全等多个业务领域。

在快手做NLP，具有得天独厚的优势——

● 广阔的业务场景：

评论分析，智能标题，字幕翻译，搜索推荐，内容安全……广阔业务待你大展拳脚。

● 海量的UGC数据：

快手DAU数亿，用户每日生产视频数千万，评论数亿。海量数据供你训出更强大的模型。

● 深厚的技术积累：

自研KwaiBERT模型在多个业务中落地，获得公司技术突破奖；风控模型为快手节约大量成本，获得公司成本优化奖；在NLP多个方向上深耕多年，持续为公司输出先进的技术能力。

● 完善的机器学习系统基建：

依托公司的AI平台，我们搭建了一套高效稳定的训练和预测系统，极大地方便算法同学迭代和上线模型。

04.推荐

点击空白处查看解读

个性化内容推荐是快手的核心引擎。快手创新运用了大量业界领先的智能推荐算法技术，为用户推荐更多感兴趣、多元化的内容。快手在业内首先实现将万亿参数模型应用于线上排序任务，同时将图神经网络技术应用于工业级推荐系统，也是业界首次在工业级推荐系统中大规模应用强化学习。目前平台向用户日均个性化推送超过千亿条短视频和直播优质内容。

● 深度学习：

实现业界领先的大规模实时级联深度学习技术，采用多层级联式的深度特征学习模型，支持亿级视频池，实现从触发到排序、端到端的在线级联学习，实现推荐全链路目标自适应学习。

● 强化学习：

业界首次做到在工业级视频推荐系统中大规模应用强化学习，能够优化每次推荐中若干视频组成的视频序列的整体收益。

● 图表达学习：

快手社区的社交特性决定了数据构成大规模动态图网络，数十亿节点和千亿的边，更新频次高。快手在业界率先使用图神经网络表达学习技术，在大规模动态图网络上在线学习并更新推荐策略。

● 长期兴趣建模：

短视频内容丰富、覆盖广泛，因此推荐系统的最大挑战之一是如何精准地捕捉用户的兴趣。推荐团队致力于对用户的超长期行为序列进行建模，使得模型能够捕捉用户的长期兴趣，提供更好的推荐体验。

● 自动寻参：

利用各种寻参算法，在线搜索当前系统链路中的最优参数。快手开发了一套通用的在线自动寻参解决方案，解决了人工经验手动调参效率低，离线算法迭代慢的问题。

● 全图化推荐引擎：

推荐系统的离线和在线系统都采用基于算子的全图化引擎，能够支持各类推荐业务场景的快速迭代和功能扩展。全图化引擎能够针对不同业务场景、系统规模和异构硬件 (CPU, GPU和AEP等) 进行端到端的优化，高效的响应每天千亿规模的实时推荐在线请求和离线训练。

⬇️链接：

- 多目标排序在快手短视频推荐中的实践

- 超越Google，快手落地业界首个万亿参数推荐精排模型

- 2亿日活，日均千万级视频上传，快手推荐系统如何应对技术挑战？

- 首家强化学习大规模落地工业应用，快手是如何做到的？

05.广告

点击空白处查看解读

在线智能营销是快手商业版图的重要组成部分。快手通过短视频信息流广告、直播广告、粉条广告、电商广告、搜索广告、联盟广告、品牌广告等营销产品矩阵，为广告主提供智能、精准、高效的营销服务。在这些产品中，应用了基于人工智能的计算广告技术，实现对用户的精确广告投放。在保证用户体验的情况下，为广告主提供推广营销价值。在这里，你会接触和学习到——

● 广告点击率模型：

短视频广告的点击率预估，需要算法模型对用户的兴趣、短视频内容以及被推广的产品都有充分的理解。除了充分研究前沿的用户兴趣建模技术，搭建短视频/产品理解模型之外，快手通过大规模的广告与自然作品点击率模型联合训练，充分地通过用户全生命周期行为来预估广告点击率，从而实现精确实时的广告推荐。

● 广告转化率模型：

在oCPM广告时代，广告主要求优化的转化链路越来越深。这意味着转化率模型的样本越来越稀疏，目标转化事件的回传延迟时间也越来越长。快手通过研发针对不同广告转化类型的多任务学习技术，回传延迟建模技术，全转化链路数据利用/多渠道数据应用技术，在例如ROI出价等领域，做到了行业领先。

● 客户机制算法：

对于一个优秀的在线智能营销平台，机制和算法设计是最核心的技术之一。快手在广告智能出价、智能定向、程序化创意、智能托管、自动素材生成、视频素材理解等等技术方向，都有深入的研究，相关成果发表于CVPR等顶会。用技术服务广告主，用AI赋能广告主。

● 流量机制算法：

对于流量侧的机制与算法，快手在自然结果与广告、短视频与直播混合排列机制和算法、合约广告保量、流量价值预估、流量动态分配、用户体验建模等领域，运用了强化学习、规划算法、因果建模等技术，与业界传统方案相比，做出了许多务实的创新。

● 广告产品创新带来的新技术方向：

在广告程序化投放领域，快手应用RTA广告技术，也较早发展了RTA相关的算法。此外，快手也探索了与广告主联合建模的产品，在联邦学习上进行了很多有意义的全新尝试。

海量的数据、丰富的广告类型、鼓励创新的工作环境，使得快手成为了广告新人算法技术进步、业务知识积累、职业素质培养的橙色乐园。

06.搜索

点击空白处查看解读

搜索是快手内容分发的重要途径之一，满足用户日常问答、找视频、找人、找图等多样需求。快手社区存在丰富且多样的内容，天然的多媒体形态使快手在搜索技术体系中，除大规模的应用NLP、机器学习及深度学习等业界搜索技术外，还要更早引入多模态技术，以创造自身的独有优势。

● 语义匹配：

探索新的深度学习方案，满足搜索中语义召回与匹配需求。召回阶段，基于级联训练方案，实现多模态语义召回能力，索引上百亿资源。粗排、精排实现全面深度模型化，以BERT、多模态语义为基础，针对不同阶段任务做深度定制化网络设计，不断提升效果上限。

● Query理解：

为保证不同场景对Query的灵活&深度处理，我们采用最先进技术优化切词、专名、紧密度、重要性、纠错、改写、意图分析等基础分析任务。同时探索Query扩展、依存分析等技术在搜索中的应用。

● 视频内容处理：

基于多模态技术，分析视频的主题、关键词等信息，面向搜索任务做更好的结构化/半结构化内容组织，以及用于视频整体判断的领域标签、质量及权威性等更丰富特征。

快手搜索的日检索量已达数亿规模，让用户快捷的找到所需是我们搜索的基本使命。同时我们也不断做大用户搜索后体验，为用户在社区内带来更大的增量。

07.计算机视觉

点击空白处查看解读

快手生态下，有丰富的短视频、直播等内容，内容规模庞大、高实时性、形式丰富，对视觉信息的感知、理解、创作等计算机视觉技术（即 CV：Computer Vision）有很强的依赖，且技术上极具挑战。在快手，我们的技术涵盖了CV领域的各个方面，包括——

● Low-level vision:

computational photography, image/video processing and enhancement, video compression, etc.

● Mid-level vision:

segmentation, detection, estimation, tracking, reconstruction, synthesis, SLAM, etc.

● High-level vision:

recognition and classification, generation, retrieval, multi-modal, visual reasoning, etc.

计算机视觉作为公司重要的核心技术，快手在CV领域有强大的研发团队和技术积累。在CVPR、ICCV、T-PAMI等顶级学术会议和期刊上发表了一系列论文，并在大部分技术应用上行业领先。在崇尚创新和最高标准的同时，我们研发的先进CV技术真正落地到了公司丰富的业务场景中，在搜索、推荐、广告、电商、直播、生产、内容运营、内容安全、生态分析等多个场景都有非常成功的应用和非常显著的业务价值。CV技术，已经成为快手生态不可或缺的组成部分，且实实在在服务着数以亿计的用户，实践快手的使命：帮助人们发现所需，发挥所长，持续提升每个人独特的幸福感。

⬇️链接：

- 14篇论文入选CVPR！快手视觉研究成果精华总结

- 快手登顶多模态理解权威榜单VCR，机器“看图说话”能力再上新台阶

08.计算机图形学

点击空白处查看解读

行业领先的计算机图形学技术是快手凝聚用户的核心壁垒与重要法宝。快手的计算机图形学技术板块拥有领先的全平台覆盖的自研高级图像引擎、次世代图形引擎、图形AI平台、异构理化引擎。美颜美妆、魔法表情、智能剪辑、虚拟偶像这些耳熟能详的高频、前沿应用都源自计算机图形学领域的突破性创新。在快手发展的十年来，计算机图形学为快手用户的快速增长与稳定保持提供了坚实有力且无可替代的技术保障。

快手在计算机图形学领域云集了超过百人的研发团队，覆盖了从渲染管线、粒子系统、图像处理、三维造型、异构系统、风格化、真实感等各个领域的资深专家和工程师。团队以提升用户幸福感为价值观，在生成式技术、图形图像闭环工具链、虚拟世界技术、基于物理的高级渲染技术等多个方面持续发力，创新性地打造“必扬特效开放平台”，让每个人都能够制作出高质量的特效。大量由快手研发的图形学技术（如移动端轻量级的延迟渲染技术等）不但拥有上亿的用户人群，更是引领和推动了学术界和工业界的发展。团队在SIGGRAPH、TVCG、CVPR等顶级学术会议和期刊上发表了一系列学术论文。

● 图像特效引擎领域：

快手自研图像引擎，支持使用内部工具自由调整并生成效果描述文件应用到实际产品中。图像特效引擎提供了自研的渲染API实现，后端同时支持Metal、Vulkan、OpenGL，提供移动端最佳的性能。

● 图形AI领域：

快手自主研发的风格化算法平台，基于业内前沿的StyleGAN等生成式技术，能高效完成各种图像和视频风格化应用的数据生成和模型训练等任务；自研数字人建模和实时渲染框架，能支持虚拟偶像和虚拟主播等相关业务；从事通用GPU计算和编程语言相关的研发，落地一系列移动端实时流体物理特效。

● 图形引擎领域：

快手自研图形引擎由一批业界资深专家研发，支持PBR、IBL、延迟渲染管线、光照融合等次世代渲染技术，支持碰撞、布料、软骨等物理解算，支持GPU粒子。

⬇️链接：

- 快手人像艺术风格化技术的普惠之路

- KAIFX ——服务于AI训练的虚拟数据开放式生成平台

- 浅谈延迟渲染、移动GPU架构和Metal

- 一种基于Metal、Vulkan多线程渲染能力的渲染架构

- 走样与反走样技术（Aliasing & Anti-aliasing）

- GPU文字渲染

09.视频增强和处理

点击空白处查看解读

快手致力于视频画质分析、增强和编辑处理等，图像视频算法是快手的核心算法之一。针对短视频和直播场景，快手打做了一整套画质分析的方案，监控快手的视频质量。针对低质量视频，利用AI算法做画质提升，包括超分辨率、降噪、去模糊、去抖动以至HDR转换等工作，为用户提供更优质的视频内容。在视频编辑方向，支持快影的各种编辑功能，为视频生产者提供更智能的工具。

图像视频领域的负责人是现任香港科技大学的客席教授，发表过超过100篇CV顶会文章，曾担任CVPR、ICCV、ECCV的领域主席，拥有丰富的研究和产品落地经验。该技术领域的团队在北京、深圳和美国均设有办公室，成员均来自于中美顶尖学府毕业的博士和硕士。未来将持续支持和引领快手在短视频和直播的核心AI算法，为用户带来更优质的体验。

⬇️链接：

- CVPR2021系列（一）—— 语义图像抠图

- CVPR系列（二）—— 双图层实例分割，大幅提升遮挡处理性能

- CVPR系列（三）—— 协同显著性物体检测

- CVPR2021系列（四）—— 深度视频抠图

10.音频处理

点击空白处查看解读

快手致力于研发用于各种业务场景的智能音频理解和处理算法，并为快手的短视频、直播、PK、连麦、聊天室、K歌和视频会议业务提供全方位的音频技术解决方案。同时，快手不断探索和研究语音和音频领域的前沿科技，以构建业界最优的音频体验。

该领域的成员均为来自于国内外一流大学毕业的博士和硕士，以及知名企业的音频专家，他们在音频领域有着丰富的经验。团队在音频处理技术上处于业界领先水平，其中语音前处理技术AEC、ANS在顶会Interspeech比赛中名列世界前茅并发表多篇学术论文。

⬇️链接：

- AI降噪参赛ConferencingSpeech 2021，快手以较大优势取得世界第一

- 全球顶级语音技术比赛中获双料冠军，这家中国公司靠什么？

- 黑马冠军快手在国际回声消除大赛中战绩颇丰

- 风多大都能让你听见，快影短视频降噪效果业内领先

- 快手成为业内首家实现基于深度学习实时变声直播的公司

- 全球五分之一的人听力受损，快手为保护你的听力做了哪些努力？

11.视频编解码

点击空白处查看解读

在当今的互联网中，超过80%的流量来自于视频内容，而在快手每天新增的视频达到数千万级，播放次数超过数百亿次。快手致力于保障视频及图像内容的体验，为用户提供全链路“更清晰，更流畅，更智能”的消费体验。业务覆盖短视频、长视频、直播、RTC视频通话、海外应用、以及ToB等场景。为上传、转码、解码及播放全链路提供视频/图像压缩及内容智能分析与处理的一站式解决方案。

当前在超大规模视频转码领域整体压缩比业界领先，累计为公司及用户节约成本百亿级。该技术领域的团队在北京、深圳、杭州及美国硅谷均设有办公室，未来团队目标为持续拓展视频相关算法的前沿边界，为用户提供极致的服务。

⬇️链接：

- 快手智能视频图像编码处理服务架构

- 快手自研H.266/VVC解码器KVVCDec，助力新一代视频压缩标准落地

12.网络传输

点击空白处查看解读

快手致力于优化快手网络与传输体验，为用户提供清晰、流畅的音视频体验。业务覆盖短视频、长视频、直播、RTC、海外、ToB等各种场景，覆盖传输协议、拥塞控制、弱网对抗、ABR、强化学习等多个领域。该技术领域的团队以极致的用户体验为目标，并引领和推动行业的发展。自研的私有传输协议、多码率自适应标准处于业界的领先地位。团队在INFOCOM、ACM MM、TON、TMC、JSAC等顶级学术会议和期刊上发表了一系列学术论文。

⬇️链接：

- 山里开播不卡顿？快手传输算法团队获得“北京市发明专利奖”

- 快手传输算法团队获“电子学会技术发明一等奖”

- 自研多码率标准发布。快手传输算法负责人周超博士：LAS标准的推出离不开信念感

- 快手与直播延迟卡顿较劲的这些年

- 快手私有传输协议《快手多媒体传输算法优化实践》

- 基于机器学习的自适应码率算法的进一步探索与改进

13.系统架构

点击空白处查看解读

系统架构是为公司业务部门提供强大、高效、安全的计算系统，研发包括自研芯片、自研服务器、FPGA、ASIC、CPU、GPU、NPU的混合计算平台和网络、存储、计算一体化解决方案。主题包括：高性能芯片；FPGA、GPU、NPU、片上系统（SoC）、加速器系统、服务器系统、big.LITTLE和特定体系结构的计算系统；网络、存储、计算一体化软硬件联合解决方案；人工智能、深度神经网络、视频转码与处理、大数据系统与异构系统的融合等在超大计算系统上的应用；数据密集型计算；深度学习；科学计算；用于解决复杂系统（多核、混合集群、网格或云）问题的并行算法；混合2D和3D架构上的调度和分配策略；大规模并行系统上的调度和资源管理。

快手在IEEE TCSVT、IEEE Access、ISCAS、ICCC等高水平学术期刊、会议发表论文，并申请了大量中英文专利。自研芯片项目受政府“人工智能关键技术源头创新专项”资助，攻克了“卡脖子”关键技术。我们在系统架构业界声誉卓著，GTC全球开发者大会中国区仅有的4篇报告之一，GTC中国开发者大会上的报告被社区评为最受欢迎的报告Top2。

⬇️链接：

- 如何让Transformer在GPU上跑得更快？快手：需要GPU底层优化

- 日播放量200亿，快手背后的AI异构计算技术解密