Day 10 Azure cognitive service: image description- 看图说故事

Azure cognitive service: image description- 看图说故事


a cat sleeping on a wooden structure

Image Description 影像描述,顾名思义是利用电脑视觉分析影像,产生出人类看得懂的句子,以描述图片中的内容。通常这样的作法被称为 Image Captioning,意味着帮影像下标题。其原理大致上是以 Convolutional Neural Network- CNN,作为 Encoder 撷取图片中的特徵,在透过 Recurrent neural network- RNN,作为 Decoder 生成文句。

金钥与端点

这边用的金钥和端点跟之前物体侦测所用的是一样的。

示范程序

# 套件:azure-cognitiveservices-vision-computervision
from azure.cognitiveservices.vision.computervision \
import ComputerVisionClient
from msrest.authentication import (
  CognitiveServicesCredentials
)
# 利用金钥SUBSCRIPTION_KEY和端点ENDPOINT,取得使用电脑视觉服务的权限。
SUBSCRIPTION_KEY = "YOUR SUBSCRIPTION_KEY"
ENDPOINT = "YOUR ENDPOINT"
CV_CLIENT = ComputerVisionClient(
    ENDPOINT, CognitiveServicesCredentials(SUBSCRIPTION_KEY)
)

# 利用 describe_image 取得描述影像的句子与信心程度

description_results = CV_CLIENT.describe_image(url)
output = ""
for caption in description_results.captions:
    output += "'{}' with confidence {:.2f}% \n".format(
        caption.text, caption.confidence * 100
    )
print(output)

把物体侦测和影像描述结合在一起,加到 chatbot server 之中,就可以得到以下效果。下一篇,我们就可以把之前所说的各项功能综合起来,完成可以看图说故事的 chatbot。


<<:  [GAS] 启动配置档as.xcf设定详解

>>:  Day 10 CSS <元素显示模式>

找LeetCode上简单的题目来撑过30天啦(DAY29)

题号:59 标题:Spiral Matrix II 难度:Medium Given a positi...

用React刻自己的投资Dashboard Day7 - CORS与Proxy Server

tags: 2021铁人赛 React 上一篇在串接API的时候有遇到一个前端蛮常见的问题,跨来源资...

[Day 16] Reverse 小疲累

终於到星期五啦 明天就是周末六日了 今天也是我课最多的一天 从早八到五点连八堂 我遇到做图障碍的挫折...

Day25 Vue 双向绑定 vs 单向绑定

什麽是单向绑定什麽是双向绑定?简单来说一个只有单方面的传送,另一个则是可以来回传,wow讲完了,今天...

自动化测试,让你上班拥有一杯咖啡的时间 | Day 17 - 如何勾选元素

此系列文章会同步发文到个人部落格,有兴趣的读者可以前往观看喔。 在 E2E 测试中,不仅有选取元素...