原文 https://medium.com/netflix-techblog/re-architecting-the-video-gatekeeper-f7b0ac2f6b00

本文介绍了了内容配置工程团队使用Hollow,一个Netflix OSS技术,重新架构与简化我们内容管道上的基础组件 - 在流程中交付巨大业务价值。

上下文

每个在Netflix服务上的电影和秀都被精心处理以提供最佳的观看体验。团队对处理主要负责标题运营(Title Operation)。标题运营会确认,除了:

  • 我们确保合同符合规范 - 我们为每个标题配置的视频日期时间段与位置是正确的。
  • 视频的标题,字幕,第二音轨都被翻译并被正确分发到世界各地。
  • 标题名与概要都可用并被翻译。
  • 每个国家都有合适的观影等级

当标题达到了以上需求的最低要求,它就可以发布到服务上上线。Gatekeeper是在Netflix负责评估网站上视频和资产的“活跃度”。在Gatekeeper批准前标题对于会员是不可见的 - 如果它验证不了设置,它会指出从客户体验基线上缺了什么来辅助标题运营(Title Operation)。

Gatekeeper通过聚合多个上游系统的数据来完成预处理任务,使用合适的业务逻辑,生产和输出每个国家每个视频的详细状态。

技术

Hollow, 是我们几年前发布的OSS技术。并被描述为一种靠近缓存的全高密度(total high-density near cache)技术:

  • 全:在每个节点上都缓存着这个数据集 - 没有驱逐策略,没有缓存命中丢失。

  • 高密度:编码,解码,反重复技术都被用来数据集上的内存指纹。

  • 靠近:在每个需要存取数据集的实例上都有RAM上的缓存。

对于这个全(total)技术有一个令人兴奋的内容 - 因为我们不需要担心清除内存中的数据项,我们可以对内存中的数据集展示做一些假设与预计算,没有这个特性是不可能的。结果是,对许多数据集,提高了很大的内存使用效率。而在传统的部分缓存方案上你可能会想是否你只缓存了5%的数据集,或者你需要被10%保留足够的空间用来得到一个可接受的命中/丢失率 - 使用同样的内存Hollow可以缓存100%的数据集数据并得到100%的命中率。

很明显,如果你有100%的命中率,你可以消除所有访问你数据的IO需求 - 并可以更有效的提高数据访问效率,可以开启更多可能性。

现状

在不久以前,Gatekeeper是一个完全的事件驱动系统。当任何上游系统对视频有改动,系统会发送给Gatekeeper发送一个事件。Gatekeeper会对那条事件进行响应,进入每一个它的上游服务,收集必要的输入数据来评估视频与它的对应资产的活跃性。它会产生一条输出记录来输出这条视频的详细状态。

这个模型有一些相关的问题:

  • 这个进程完全与IO绑定,并对上游系统产生了很大的负载。

  • 因此,这些事件会将一天的吞吐队列化并产生处理的延迟,导致标题的处理不能及时的上线。

  • 更坏的,事件可能偶尔丢失,这将导致标题不能上线,知道某一个标题运营人员发现可能有问题。

为了减轻这些问题可以“清扫”目录让视频可以匹配特定的查询条件(比如,计划下周上线)可以让事件自动注入到处理队列中。不幸的是,这种方式会往队列中增加更多的事件,会使问题更加恶化。

很明显,很有必要改变方向。


本文来自微信公众号「麦芽面包,id「darkjune_think」
转载请注明。微信扫一扫关注公众号。
交流Email: zhukunrong@yeah.net

最新文章

  1. inotify+rsync实现实时同步部署
  2. exe文件放在其他位置
  3. C#-WinForm-对话框控件
  4. Android项目结构分析
  5. [Ubuntu] Linux下使用google app engine,无法打开https网站的解决方法
  6. Qt之自定义控件(开关按钮)
  7. CSS 外边距(margin)重叠及防止方法
  8. cocos2d-x make: *** [clean-box2d_static-armeabi] Error 1
  9. 说说C#和.NET的关系
  10. 算法 - 求和为n的连续正整数序列(C++)
  11. opencv Iplimage结构简介
  12. javascript语言精粹:继承
  13. Kong(v1.0.2)代理参考
  14. 数据库sql语句常见面试题
  15. Python进程-理论
  16. BlueZone automation note1
  17. 一个正则表达式,只含有汉字、数字、字母、下划线,下划线位置不限【Z】
  18. 50道Java线程面试题(转载)
  19. 基于ARM、linux的MF RC522射频读卡器
  20. C#取色器

热门文章

  1. HDU 2121:Ice_cream’s world II(不定根的最小树形图)
  2. 使用wincc vbs脚本查找进程及如何运行进程
  3. android_sdcard读写(一)
  4. ng-bootstrap 组件集中 tabset 组件的实现分析
  5. 开发板编译./camera显示-/bin/sh: ./camera: not found解决方案
  6. js继承的关系(一)
  7. python基础知识二 列表、元组、range
  8. tomcat启动成功但是没有监听8080端口
  9. 《VR入门系列教程》之14---面向大众的Unity3D
  10. 在windows中使用 nvm 实现node多版本管理