最近,知名开发者知识分享社区博客园发布一则通告,将展开为期7天的内容整改,引发不少开发者的热议。

博客园下载_博客园官网_博客园

博客园是一个很神奇的网站,知名度高又十分低调,内容质量高,界面又太low,整个网站UI仍是零几年的水平,以至于很多新晋开发者,都以为这么土的网站,根本不会有什么有价值的技术文章,或者认为这个网站离倒闭不远了。

经常逛博客园,不难看出运营和开发团队非常小,整改结束后,bug不断,一度无法访问。原以为会受到广大开发者的吐槽,没想到百度和CSDN两个网站莫名躺枪。

有网友吐槽道:

你在谷歌搜索某一个技术问题,点进StackOverflow或github的issues讨论区,发现已经有人分析了bug的成因,给出了解决方案和示例代码。

在百度搜索某一个技术问题,点进CSDN、简书,文章会告诉你,要将框架重装,使用旧版,要修改另一个框架的什么东西,二者有冲突,或者干脆说得修改某一个配置/参数,利用玄学解决bug……

最终在搜索结果的第二页找到博客园的文章,才解决了问题。

一个技术分享社区的小小整改公告,折射出许多问题,值得企业深思。

内容为王

博客园用户体验极其糟糕,但内容质量较高,也能留住用户。很多企业不断追求精美华丽的用户界面,却忽略了内容本身的重要性。

为用户提供优质的内容,还能帮助企业顺利渡过公关危机,挽回品牌形象。

内容安全

除了各大自媒体平台被勒令整改过外,很多与开发相关的网站,也难逃厄运。去年思否开发者社区也因违规信息被要求整改2天。内容安全已经直接影响企业业务的正常运行,甚至还有被责令关停的风险。

因此,内容安全审核技术和逻辑,显得十分重要。

内容审核通常有两个系统,一个是政治审核,一个是其他内容审核。

其他内容审核比较弹性,可以根据企业运营需求调整。而政治审核基本上是根据国家法律法规、地方网监法律法规、文化部和公安部的政策规定进行审核。政治审核一般比其他内容都要严格,市面上云服务提供商所提供的方案,违规内容检测率都接近100%。

那么内容安全图像、文字、视频是如何审核的呢?

博客园官网_博客园下载_博客园

图像审核

政治人物图片的审核,可直接调用云服务商的接口,云服务商的图像识别技术很成熟,可直接判断该图片是否涉黄、涉政,或者涉嫌违法违规。

对于图片识别技术而言,一般采用大数据标签学习和相似度对比技术。涉及政治人物,则通过区域特征算法,提取人像特征来确定个人身份信息。

文本审核

文本审核比图像审核更难,文本可以是签名、词汇或者一篇文章,还包括一些异形变体字。

图片中存在的文字,最多的是采用文本识别技术,根据上下文的语义,分析是否有垃圾文本的出现,只要出现垃圾文本或者不想管的文字或词组,会立即识别并判断出来。

这种检测方式,最适合用于评论区灌水、刷屏和辱骂性内容的检测。

由于文本的复杂性,目前技术上还不能做到机器完全取代人工,企业仍然要有人工审核程序,体量较大的审核,可组建专门的审核团队,或外包出去。

视频审核

视频审核与图像审核类似,只不过多了一道截帧程序,对视频进行截帧上传到服务器进行对比识别,判断人脸、色情、涉黄涉暴等违规信息。

内容安全是最令企业头疼的问题之一,既需要一套严谨的审核逻辑,帮助企业规避风险,又不能损害用户体验,可谓任重而道远。

限 时 特 惠: 本站每日持续更新海量各大内部创业教程,一年会员只需98元,全站资源免费下载 点击查看详情
站 长 微 信: lzxmw777

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注