视觉智能开放平台

推荐内容

能力如何计费

新手如何接入使用

API接口如何调用，SDK如何使用

离线SDK如何使用

售后联系方式

人脸人体

文字识别

内容审核

图像理解

分割抠图

视觉生产

视频理解

视觉搜索

创新专区

行业能力

离线SDK

人脸人体

高精度人脸/人体的检测、定位、属性识别和人脸比对

分割抠图

实现秒级全自动、发丝级、主体/场景像素级分割抠图

视频人脸融合

将视频中指定的某个人脸，融合进另一人的人脸特征

人脸人体

立即开通

技术文档

人脸人体识别技术是基于阿里云深度学习算法，结合图像或视频的人脸检测、分析、比对以及人体检测等技术，为用户提供人脸/人体的检测定位、人脸属性识别和人脸比对等能力。可以为开发者和企业提供高性能的在线API服务，应用于人脸AR、人脸识别和认证、大规模人脸检索、照片管理等各种场景。

人脸编辑

智能美肤

自动匀肤、去瑕疵、皮肤美白

智能瘦脸

自动多人脸五官瘦脸生成

图像人脸融合

图像自适应多人脸融合

人像素描风格化

人像素描人物风格化

人物动漫化

多样化人物动漫风格重绘

人脸修复增强

人脸脸部细节修复增强

人脸美颜

人脸磨皮、美白、锐化、平滑度

人脸美妆

多风格彩妆自动妆容生成

人脸滤镜

多种滤镜，一键风格转化

人脸美型

人脸轮廓、五官精细化调整

人脸信息脱敏

人脸模糊化，自动脱敏处理

人体识别

人体检测

正面、侧面、高角度人体检测

指纹提取

二值化黑白按压式指纹生成

人体结构化属性

人体结构化属性智能识别

线上监考

聊天工具和考生状态检测

静态手势识别

静态手势动作高精度识别

行人区域进入检测

行人区域进入入侵检测

动作行为识别

打电话、玩手机等行为识别

手姿势关键点

二十一个手势关键点识别

人体姿势关键点

十八个人体姿势关键点检测

人体计数

图片人体高精度检测计数

活体检测

换脸鉴别

深度合成假脸自动鉴别

人脸活体检测

RGB人脸活体检测与拦截

红外人脸活体检测

红外IR人脸活体智能检测

视频活体检测

视频人脸活体在线检测

人脸识别

人脸比对1:1

高精度人脸1:1比对识别

口罩人脸比对1:1

戴口罩人脸极速1:1比对

人脸搜索1:N

百万级人脸库秒级1:N检索

公众人物识别

重要公众人物识别与审核

明星识别

图像明星人物自动检测识别

人脸属性

人脸属性识别

性别、年龄、表情等属性判断

表情识别

高兴、惊讶等9种表情识别

金融级人脸检测

人脸核身App认证

权威公安库App人脸认证

人脸核身服务端

人脸核身服务端在线认证

人脸检测

人脸检测与五官定位

人脸105关键点自动检测

文字识别

立即开通

技术文档

文字识别技术是基于阿里云深度学习技术，为用户提供通用的印刷文字识别和文档结构化等能力。文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景，满足认证、鉴权、票据流转审核等业务需求。

通用文字识别

通用文字识别

多场景图像通用文字识别

视频文字识别

视频文字内容、区域、时间识别

PDF识别

PDF文字结构化在线识别

表格识别

表格内容信息自动识别

车辆交通类识别

车牌识别

车牌位置、类型、号码识别

驾驶证识别

别驾驶证关键字段内容

行驶证识别

识别行驶证关键字段内容

VIN码识别

精准识别车辆VIN码数值

个人卡证类识别

身份证识别

识别二代身份证关键字段内容

银行卡识别

发卡行、卡号、有效日期识别

二维码识别

二维码文本信息识别

资产类证件类识别

营业执照识别

识别营业执照关键字段内容

行业票证类识别

增值税发票识别

精准识别增值税发票内容

增值税发票卷票识别

增值税发票卷票结构化识别

定额发票识别

发票号码、代码、金额识别

出租车发票识别

出租车发票结构化识别

火车票识别

火车票8个关键信息识别

内容审核

立即开通

技术文档

内容安全技术是基于阿里云视觉分析技术和深度识别技术，并经过在阿里经济体内和云上客户的多领域、多场景的广泛应用和不断优化，可提供风险和治理领域的图像识别、定位、检索等全面服务能力，不仅能帮助用户降低色情、暴恐、涉政、广告、垃圾信息等违规风险，而且能大幅度降低人工审核成本。

图片内容安全

图片智能鉴黄

性感、色情、低俗内容智能检测

图片敏感内容识别

武器、恐怖、血腥等内容识别

图片logo识别

台标、水印、商标等内容检测

图片风险人物识别

图片敏感人物、明星识别

图片垃圾广告识别

图片垃圾广告精准分类识别

图片不良场景识别

毒品、赌博、画中画等内容识别

文字内容安全

文字暴恐内容识别

文字暴恐内容智能识别

文字垃圾内容识别

文字垃圾内容智能识别

文字广告内容识别

文字广告内容智能识别

文字敏感内容识别

文字敏感内容智能识别

文字辱骂内容识别

文字辱骂内容智能识别

文字鉴黄内容识别

文字鉴黄内容智能识别

文字灌水内容识别

文字灌水内容智能识别

文字违禁内容识别

文字违禁内容智能识别

图像理解

立即开通

技术文档

图像识别技术是基于阿里云深度学习技术，可实现精准识别图像中的视觉内容，包括上千种物体标签、数十种常见场景等，为用户提供图像打标、场景分类、颜色识别、风格识别以及元素识别等能力。图像识别技术可广泛应用于数字营销、新零售、广告设计等行业场景。

基础识别

菜品识别

识别出菜品类别名称和热量

垃圾分类

图片物品垃圾进行分类

元素识别

人物、修饰、文案元素识别

颜色识别

颜色值与占比信息检测

风格识别

图像风格类型进行分析

证件照质量审核

证件照质量全方位审核

图像打标

广告素材分析

明星、素人、CG人物、场景等打标

通用图像打标

千个物体品类内容标签打标

场景识别

场景识别

图像场景环境智能识别

商品理解

商品分类

超过六千种类目商品分类

通用检测

物体检测

检测物体名称、坐标位置

白底图检测

检测图片背景是否为白底图

猫鼠识别

猫、老鼠等动物在线检测

着装检测

帽子、口罩、工作服等穿戴检测

IPC图像目标检测

人、车辆、宠物图像目标检测

主体检测

图片进行主体定位信息检测

车辆检测

车辆拥堵检测

图片车辆拥堵智能检测

车辆违停检测

目标区域内是否有车辆停放

视频检测

IPC视频目标检测

人、车辆、宠物视频目标检测

分割抠图

立即开通

技术文档

实现高精视觉分割能力，可实现秒级全自动主体、场景像素级识别，制作4通道透明素材。不仅实现了发丝级精抠，对高度镂空主体、复杂背景等场景都有很好的效果。

通用分割

通用分割

前景物体图与背景进行分离

通用高清分割

分割输出PNG格式透明图

天空高清分割

天空进行像素级高清抠图

室外场景分割

13种场景场景像素级抠图

天空分割

天空进行像素级抠图分割

Mask精细化分割

粗糙Mask进行精细化分割

食品分割

食品进行像素级抠图

分割替换

天空替换

天空样式风格丝滑替换

商品分割

商品分割

前景商品图（4通道）分割

服饰分割

主体服饰进行精细化抠图

人像分割

人体分割

前景人像图（4通道）分割

高清人体分割

前景人像图高清分割

头像分割

PNG格式人物头像透明图

头发分割

人物头发矩形透明图输出

五官分割

眼睛、鼻子、嘴像素级语义分割

皮肤分割

皮肤区域mask图分割输出

视频人像分割

视频人像分割

人像区域mask视频序列返回

视觉生产

立即开通

技术文档

图像生产提供图像增强、图像编辑与图像评分等能力。图像生产服务可灵活应用于摄影、艺术、广告、媒体等行业，满足老照片修复、图像去噪、图像质量矫正与图像评分等业务需求。

图像编辑

照图修图

光照、色彩等风格迁移至目标图

智能构图

图像智能输出bounding box

图像隐形文字水印

添加或解析指定文字水印

图像隐形图片水印

图像添加或解析图片水印

图像标志擦除

台标、平台Logo标志擦除

字幕擦除

擦除图片中标准字幕

图像裁剪

自动判断主体对图像裁剪

图像增强

图片上色

黑白照片、图像自动上色

图像色彩增强

饱和度、亮度、对比度等优化

高清色彩迁移

高清图像进行颜色拓色

图像超分

支持1-4倍图像分辨率放大

风格迁移

色彩、笔触等视觉风格转化

色彩迁移

自动或指定色板色彩转换

图像微动

天空、头发区域静转动处理

图像评分

图像清晰度评分

图像清晰度在线智能评分

图像曝光评分

图像曝光在线智能评分

构图美学评分

图像构图美学智能评分

视频增强

视频综合增强

插帧、超分辨率综合增强

视频超分辨

视频放大2倍尺寸输出

视频插帧

低帧率转化高帧率视频

视频SDR调色

自动优化SDR视频的颜色

视频校色

视频相似性进行关联调色

SDR转HDR

SDR视频转化HDR视频

视频人像增强

视频人脸清晰度提升增强

视频降噪

视频各类噪声信息进行降低

视频编辑

视频人脸融合

视频多人脸精准换脸

视频人像卡通化

人像视频进行卡通化转换

视频画幅变换

视频进行智能裁剪和填充

视频字幕擦除

擦除视频中的标准字幕

视频标志擦除

擦除视频中的常见标志

视频封面摘要

电商视频摘要

按照指定时长输出视频摘要

影视视频摘要

影视视频提取指定时长视频

视频生成

通用视频生成

智能生成短视频素材

视频理解

立即开通

技术文档

基于阿里云深度学习技术，对视频内容理解进行视频镜头分析和抓取视频中精彩片段或单张画面作为视频封面，提升视频的点击率和用户体验。

视频理解

视频拆条

镜头、主题多维度视频拆条

视频OCR

识别视频中的多类型文本

视频内容理解

明星、素人、画面等元素理解

镜头解析

视频按镜头进行智能切分

视频封面

一键输出多个视频封面

视频画质评估

画质与瑕疵视频质量评估

视觉搜索

立即开通

技术文档

基于阿里云深度学习技术，进行视觉内容搜索，在指定图像库中搜索出相同或相似的视觉信息，适用于内容比对、内容精确查找、相似素材搜索等场景。

图像搜索

商品图像搜索

商品图片间相似性检索

图像搜索淘宝联盟版

商品图像搜索淘宝联盟版

创新专区

立即开通

技术文档

灵感与智能结合，输入文字即可生成美妙画面

创新专区

交互式涂抹分割

自动对涂抹目标进行分割

交互式全图分割

实现分割元素的自由选择

生成式图像超分

生成式图像超分辨率提升

行业能力

立即开通

技术文档

图像分析处理，基于阿里云深度学习技术，对图像分析后进行相关处理，多用于特殊行业如医疗辅助诊断、工业辅助生产等应用场景。

医疗视觉能力

新冠病毒肺炎辅助诊断

新冠病毒肺炎辅助诊断

胸部CT平扫筛查

人体胸部多器官、多病种检测

胸部CT肺结节检测

胸部CT肺结节辅助诊断

肋骨骨折检测

胸部CT肋骨骨折辅助诊断

胸部CT配准

胸部CT精准配准分析

冠脉钙化积分测算

胸部CT冠脉钙化积分测算

皮肤病检测

自然图像皮肤病分类预测

医学智能问答

面向皮肤病预问诊场景

医疗视觉能力

主动脉瘤肺动脉高压检测

主动脉瘤肺动脉高压检测

胰腺癌筛查

胸部平扫CT评估胰腺癌风险

淋巴结检测

胸部平扫肿大淋巴结检测

多器官分割

胸部CT图像多器官分割

食管癌检测

胸部CT评估食管癌风险

放疗靶区勾画

癌症靶区类型智能靶区勾画

淋巴站分割

指定目标部位淋巴站分割

学习教育视觉能力

线上监考

对考生屏幕和状态进行检测

离线SDK

立即开通

技术文档

基于阿里云深度学习技术，为用户提供图像分割、视频分割、文字识别等离线SDK能力。离线SDK激活后即可在无网环境下工作，可根据业务需要进行灵活的上层业务开发，且所有数据都可以在设备本地运行处理。

人脸人体

肢体关键点离线SDK

人体15个关键点图像检测

肢体动作计数离线SDK

识别人体关键点并自动计数

肢体动作计数反馈离线SDK

15种不规范的肢体动作反馈

动作打分离线SDK

人物动作标准度进行打分

人脸关键点离线SDK

单人脸或多人脸精准定位

基础美颜离线SDK

磨皮、美白、红润等人脸美颜

服务端人脸识别离线SDK

服务端人脸识别部署包

文字识别

通用文字识别SDK

设备端通用文字离线识别

证件识别SDK

银行卡、身份证、驾驶证等识别

车辆类识别SDK

中国内地单行车牌及VIN码

分割抠图

实时视频分割SDK

实时全自动场景像素级分割

实时无损分割SDK

影视级无瑕疵实时视频分割

离线图片分割SDK

精细化、无瑕疵的抠像处理

离线视频分割SDK

视频图像序列化分割

视觉生产

视频增强离线SDK

多维视频端侧实时增强处理

图片增强离线SDK

图片无损增强放大一倍

滤镜离线SDK

支持8种多样化滤镜风格