前段时间,我司上线并投入使用了一款名为「智能动产融资登记数据查验系统」的人工智能金融科技产品。作为这个产品的 PM,我复盘了下整个项目过程,希望能给大家带来一些思考。
了解业务,分析需求
很多时候,需求就藏在你和人聊天的过程中。
在动产融资和担保领域,人行征信中心的「动产融资统一登记平台(中登网)」是任何一家合规运营、规范开展业务的机构无法绕过的网站。作为经物权法授权、由人行征信中心建立的国内动产融资登记服务平台,中登网提供了应收账款质押、应收账款转让、融资租赁等动产担保的登记和查询服务。
在动产融资和担保领域,基本上全流程都会出现它的身影:在贷前为了满足合规要求、防止重复融资并提前识别风险需要针对融资设计的动产信息进行查询。在贷中需要对融资和担保的动产信息进行登记,以便提示资产归属、优先资产受偿、避免法律纠纷。
在年初,我们团队就克服了春节假期和新冠疫情的影响,如期完成了中登网的接口对接,将过去的人工登记升级成了系统自动登记,并提供基于接口的查询功能。似乎已经满足了业务中对于中登网的应用,但是作为一个爱随时出现在各个办公区撩闲愿意倾听用户反馈的产品经理,在和风控同学的调(xian)研(liao)过程中发现因为查询接口返回的数据并非结构化数据,风控同学需要逐个去下载登记表的 PDF 文件,而中登网的官方网站页面则提供基于查询条件的 Excel 汇总数据。如果使用我们提供的查询页面,非但没有减轻风控同学的压力,反而对他们来说是一种折磨。所以他们更愿意使用中登官网进行查询,哪怕我们提供的服务不需要输入手机验证码,不需要打开多个网页。
那么他们仅仅只有汇总成 Excel 的需求么?显然不是,在进一步的了解中,我发现他们重点关注的是登记表中的「财产描述」部分,而这一部分在登记录入的时候是一个多行文本框,写什么完全靠人来决定,并非标准化。需要融资和担保的动产信息是否已经被人登记存在于查询到的登记中只能靠人眼看,效率极其低下,工作强度和压力都非常大。
每天晚饭吃完,我都要做到风控审单同学的旁边聊闲。通过不断的「烦」这些小哥哥们进而整理得到了他们的真实诉求,我通过 KANO 模型整理了出来,当然用户不多而且功能点不多,所以没做Better/SI和 Worse/DSI的计算:
- 下载 PDF 完全不能接受,如果能将查询结果汇总成列表,可以一眼从上到下看到所有的「财产描述」,和中登网官网查询结果保持一致。(必备属性)
- 在融资页面可以直接查看该企业的中登网记录(期望属性)
- 合并初始登记、变更登记的信息,将一条初始登记对应多条变更登记汇总起来(魅力属性)
- 可以剔除部分与审单无用的登记(魅力属性)
如果大家有兴趣,我会写一篇关于通过 KANO 模型计算优先级的文章,介绍如何通过 Better/Worse 系数来进行需求的排序。
一旦开始,相信自己
你要坚定的相信你自己要做的事情是有价值的,如果你说服不了你自己,那你就不要去做了
既然发现了需求,那就开始干起来。但是,我遇到了一个所有产品经理都会遇到的问题——研发没资源。而且我这个需求不是一个老板拍下来的需求,完全是我自己没事找事。
怎么办呢?不管了,先做了一个 PPT+原型,找到我们负责中登接口的小哥,画个饼:这是风控有切身需求呀!AI+大数据,这是未来的方向呀!这做完升职加薪迎娶白富指日可待呀!反正我估计差点小哥就报警说我传销……
反正我是列出了 N 条必须做这个事情的理由,而且我自己竟然都信了!!!!
其实,如果你自己说服不了自己,你自己都不相信你自己代表的是你对于这个事情没有完全想清楚。想清楚再说吧。
最后又是靠着我的磨人神功,小哥答应了我。我的课外活动小组终于可以成立了,虽然只有两个人……
MVP,持续迭代
互联网时代,快是一种美德。极致应该是你的追求
只有一个后端小哥……我忍了
我俩利用课余时间,开始完成我们的课外作业。我们首先对官方的接口进行了分析,发现并没有什么我们可以使用的。
我俩先明确了我们需要实现的功能一定要用到 OCR,如果有 NLP 的话可以显著提升我们的产品质量。
我们从开始做到正式发布,短短一个月,我们利用课余时间一共做了三个 Alpha 版:
- 第一版,仅仅实现了文件的 OCR 识别(至于 OCR 准确度和效率……emm,能识别)
- 第二版,我们认真分析了需要识别的文件,通过一些技巧(被我们称为「文字识别辅助增强及目标检测算法」,但是我绝对不会透露这个算法只需要半天的开发量……是一个奇技淫巧),将识别准确率提高到了难以置信的 95%以上(2000 份文件,我们准确识别出了 1912 份,文字的准确率 100% )😝
- 第三版,我们加入了 NLP 服务,基本服务算是成型了,为以后功能的迭代提供了基础
这个项目给我最大的感受就是:一旦定下目标,就要立马开干。不然一旦拖下来,就会变得遥遥无期。快速出活,哪怕不甚完美。所有人都需要看到产出,热情一旦耗尽产出就会变得遥遥无期。
出活之后要快速确定下一步要解决的问题,持续迭代。不能放下不管。发布了 Alpha 版以后,我们又迅速针对一些遗憾的地方,进行补充。老板看到了成果也愿意为此投入资源。
善于发现身边的资源
没有人手中的资源是完全够用的,重点是你要善于去发现你身边的资源。
在做 Alpha 版的时候,我们就选定了技术路径:OCR 从中登网获取的 PDF 文件得到文字,再通过 NLP 对数据进行处理,最终得到我们需要的数据。
想法是美好的,但是现实是挫折的。
我们团队的自研 OCR 模型主要针对的是企业和个人证件以及发票,并没有针对表格文字进行训练。识别效率惨不忍睹。这可如何是好。
如果说 OCR 只是效果不好,那么 NLP 可真的是我们无知无畏了。我俩只是在网站上看到过这个词,听说很牛逼~emmm,但是问了一圈,没人会呀,这都是个什么玩意儿……
这时候,当年前同事教我的绝技——没有什么是花钱买不来的给了我启发——从阿里云上买了相关的服务,先用起来。(主要是不贵,贵我自己也买不起)
感谢云厂商,阿里云这是广告请打钱!
之前有一个小朋友跟我吐槽,说他们团队什么积累也没有,想做些事情研发同学告诉他:做不了。我当时就反驳了他这种想法——你作为一个 PM,你首先要想的是你怎么把这个事情做成,而不是说在抱怨团队没有资源。任何一个团队的资源都不会 100% 满足每一个需求。如果事事都等到团队的资源到位,那事情也不需要做了。
在 Alpha 版上我们处理处理逻辑以外均采用了云服务商的服务,用最小的代价实验了想法的可行性。
在 Alpha 版开发的同时,我们也看到了集团 NLP 团队的一些成果,不要犹豫,快速在 OA 上找到了他们的负责人,需求他们的帮助:最终他们专门为这个需求训练了一套模型,最后的结果是识别率高达 97%。一个非常不错的识别率。
这里我要说的是,很多技术其实早就有成熟的解决方案,可能在你身边,也可能通过云、github 等各种方式很容易找到。重点是你要善于发现。