Day 10 Azure cognitive service: image description- 看图说故事

Azure cognitive service: image description- 看图说故事

a cat sleeping on a wooden structure

Image Description 影像描述，顾名思义是利用电脑视觉分析影像，产生出人类看得懂的句子，以描述图片中的内容。通常这样的作法被称为 Image Captioning，意味着帮影像下标题。其原理大致上是以 Convolutional Neural Network- CNN，作为 Encoder 撷取图片中的特徵，在透过 Recurrent neural network- RNN，作为 Decoder 生成文句。

金钥与端点

这边用的金钥和端点跟之前物体侦测所用的是一样的。

进入https://portal.azure.com/#home
点选所有资源
点选刚刚建立的电脑视觉服务
点选金钥与端点
复制金钥与端点

示范程序

# 套件：azure-cognitiveservices-vision-computervision
from azure.cognitiveservices.vision.computervision \
import ComputerVisionClient
from msrest.authentication import (
  CognitiveServicesCredentials
)
# 利用金钥SUBSCRIPTION_KEY和端点ENDPOINT，取得使用电脑视觉服务的权限。
SUBSCRIPTION_KEY = "YOUR SUBSCRIPTION_KEY"
ENDPOINT = "YOUR ENDPOINT"
CV_CLIENT = ComputerVisionClient(
    ENDPOINT, CognitiveServicesCredentials(SUBSCRIPTION_KEY)
)

# 利用 describe_image 取得描述影像的句子与信心程度

description_results = CV_CLIENT.describe_image(url)
output = ""
for caption in description_results.captions:
    output += "'{}' with confidence {:.2f}% \n".format(
        caption.text, caption.confidence * 100
    )
print(output)

把物体侦测和影像描述结合在一起，加到 chatbot server 之中，就可以得到以下效果。下一篇，我们就可以把之前所说的各项功能综合起来，完成可以看图说故事的 chatbot。

<<: [GAS] 启动配置档as.xcf设定详解

>>: Day 10 CSS <元素显示模式>

DAY01 - [CSS＋RWD] 满版、非满版区块显示

杂谈

30.unity输出

杂谈

#3. Expanding Cards（原生JS版）＋用tailwindcss玩grid排版

杂谈

[11] 建立进入页面和流程控制

杂谈

Factory 工厂模式

杂谈

找LeetCode上简单的题目来撑过30天啦(DAY29)

题号:59 标题：Spiral Matrix II 难度：Medium Given a positi...

用React刻自己的投资Dashboard Day7 - CORS与Proxy Server

tags: 2021铁人赛 React 上一篇在串接API的时候有遇到一个前端蛮常见的问题，跨来源资...

[Day 16] Reverse 小疲累

终於到星期五啦明天就是周末六日了今天也是我课最多的一天从早八到五点连八堂我遇到做图障碍的挫折...

Day25 Vue 双向绑定 vs 单向绑定

什麽是单向绑定什麽是双向绑定?简单来说一个只有单方面的传送，另一个则是可以来回传，wow讲完了，今天...

自动化测试，让你上班拥有一杯咖啡的时间 | Day 17 - 如何勾选元素

此系列文章会同步发文到个人部落格，有兴趣的读者可以前往观看喔。在 E2E 测试中，不仅有选取元素...