[DAY 03]物品拍卖价格查询功能(1/4)

制作FF14 chatbot主要步骤如下:

  1. 功能需求
  2. 资料收集
  3. 资料前处理
  4. chatbot功能能开发
  5. 使用者回馈
  6. 更新功能

接下来的笔记我会照上面步骤进行介绍,单一步骤需要详细介绍的话我会单独拉一篇出来

FF14有个系统叫 军队筹备 ,每个 生活职业 每天缴交指定物品後会给予职业经验以及 军票

由於经验相当多再加上又有军票可以拿,如果有新手90天经验加成光每天缴交筹备物品就能很快地把所有生活职业一起练满等,CP值很高,缴交的筹备物品在拍卖场都可以买到,因此不要成为盘子买到价格低的物品就是一项很重要的课题

目前可以查询拍卖的网站叫 universalis ,它提供物品各种价格指标,不过它只能用物品的英文搜寻,这对使用中文或日文介面的人来说还要找物品英文就比较不方便

因此我希望做的功能是在discord上直接输入中文就能查询到物品的拍卖价格网址,所以目前第一件要做的事情是对FF14的物品进行命名实体识别(NER),我从github找到有人从官方解包下来的资料:
中文资料
英文资料
如果放官方解包资料不妥的话,麻烦留言通知我,我把连结拿掉

资料里跟物品有关的档名是Item.csv,中英都是这个档名,目前我们只需要#Name这两个栏位,#就是物品的ID

将中英rawdata合并的程序码如下给大家参考:

import pandas as pd

if __name__ == '__main__':
    #前处理rawdata,将中英rawdata合并
    endf = pd.read_csv("Item_en.csv",header=1)
    cndf = pd.read_csv("Item_cn.csv",header=1)

    endf = endf[["#","Name"]]
    endf.rename(columns={"Name": "英文","#":"ID"},inplace=True)
    cndf = cndf[["#","Name"]]
    cndf.rename(columns={"Name": "简体中文","#":"ID"},inplace=True)

    df = pd.merge(cndf,endf, how="left", on=["ID"])
    df.to_csv("FF14_rawitem.csv",encoding="utf-8-sig",index=0)

现在有了ID、中文及英文,还差日文,由於日文目前没有找到相关解包资料,因此我是从灰机WIKI那边爬下来的

资料清整好後明天就会分享灰机WIKI的爬虫介绍


<<:  Day03:【TypeScript 学起来】自动编译 tsc + nodemon 好方便

>>:  树选手2号:random forest

来画一个视力检查表吧!

前言 今天要来研究的是 canvas~ 踩下去才发现是一个大坑XD,以下先从最基本的开始认识起,最後...

[Android Studio 30天自我挑战] ImageView元件介绍

现在在手机或是平板上都会许多图片的应用,这次介绍ImageView与ImageButton这两个元件...

Day26 Let's ODOO: ODOO Studio

今天来介绍Odoo studio,对於程序苦手或非程序人员,运用Odoo studio可以直接透过见...

Day12:全端工程师的生活常态

一、前言   上一篇的文章有提到需要具备什麽样的特质,才能在一间案子微多的小型接案公司当一名菜鸟全端...

[Q&A] 04 专案必要文件难产

资讯安全管理制度运行会产出一系列的文件化纪录,着也是稽核程序中可能会发现的不合理之处。 其中,在风险...