AI ninja project [day 16] 文字处理 -- 回归

我们已经有了语音转文字的技术,
那我们也能将文字进行向量化。

那我们是否能收集客服人员顾客的回答,
然後将回应进行量化,
当作对客服人员考绩的参考呢?

这篇参考autokeras的文字回归攻略:
https://autokeras.com/tutorial/text_regression/

colab:
https://colab.research.google.com/github/keras-team/autokeras/blob/master/docs/ipynb/text_regression.ipynb

安装套件及载入:
https://ithelp.ithome.com.tw/upload/images/20210916/20122678hnFBF7xaPV.png

https://ithelp.ithome.com.tw/upload/images/20210916/20122678rufWM9ozeO.png

一样使用IMDB影评的资料集,
不同於之前载入资料集的方法,这里采用sklearn的load_files来载入资料集
可以发现已经自动帮忙把pos及neg两个类别,转换成0或1的数值:
https://ithelp.ithome.com.tw/upload/images/20210916/20122678UUbzdqWoDO.png

https://ithelp.ithome.com.tw/upload/images/20210916/20122678tN3EP95DER.png

这里我们采用autokeras的TextRegressor来进行训练,并将测试集预测结果印出:
https://ithelp.ithome.com.tw/upload/images/20210916/20122678hoHY15ogrA.png

https://ithelp.ithome.com.tw/upload/images/20210916/20122678T4LepSclDj.png

可以发现预测结果为介於0到1之前的数值。

官网也特别说明可以使用tensorflow dataset的资料格式用来训练:
https://ithelp.ithome.com.tw/upload/images/20210916/20122678rmuegbxO5q.png


<<:  [DAY 3] _ 开发板规划补充(stm32f030)

>>:  DAY 01 前言

随身碟无法读取,在磁碟管理中显示为No Media

本文将向您说明修复随身碟无法读取,在磁碟管理中显示为No Media错误的详细步骤。如何修复USB在...

pCloud - 免费 10 GB 云端空间,输入限时优惠码即可取得 3 个月免费 500 GB 储存空间

pCloud 是一间注册於瑞士的 IT 资讯公司,目前主要提供专业的线上云端空间服务,所有使用者都...

【PHP Telegram Bot】Day20 - sendMessage:发送和转换 Markdown 讯息

今天先来点轻松的,先来看看各种 sendMessage 的功能,最後来转换使用者发送的 Markd...

[区块链&DAPP介绍 Day26] Dapp 实战 投票系统 - 2

延续昨天没做完的议题,今天来把 js & html 补完,让变成一个完整的 Dapp 首先 ...

Ruby基本介绍(三)-P与Puts方法的差异

今日K-pop推荐! 本篇文章会提到的事 预防针:如资讯有错,欢迎指正分享,感谢您。 P与Puts差...