最近工作有点杂,主要在技术困难、工作对接、人际沟通方面都遇到了一些挑战,发现问题是好事。
01、技术方面
思绪有点乱,发现自己有很多问题需要处理,一样一样来,先从技术方面梳理一下。从前天晚上开始,考完试我就开始干实验室的事情了,刚刚上手就发现了很多之前没有预料到的问题。
第一个问题,先从技术上开始,大语言模型调用的速度非常慢。一开始我以为是HTTPS加密的问题,可是之后我使用内网直接用HTTP传输访问,发现还是很慢,并发量到10的话就再也上不去了。
那么我就开始思考是不是这个模式没有开,于是我就根据DeepSeek的建议开了那个非思考模式,然后按照那个模式启动之后发现速度还是有点偏慢,但是比之前要快一些了。可是它导出的一些文本依然带有这个思考的标签,说明这个速度慢的问题还是没有解决。而且根据师兄的反馈,之前料子将它部署的模型并发量达到四五十,很快很快的,所以这里面我还需要想办法去优化,看看哪些参数分别是干嘛的,应该怎么改。直接看文档吧,直接试错成本太高了。
关于这个问题我有一些思考的方向,就是我可不可以写一个脚本自动帮我启动模型、关闭模型,然后测试这个并发的速度、并发实验,生成一个测试表出来,这样的话我就知道在哪些模式下启动运行这个任务,同一个任务啊,它的效果怎么样。当然这个前提就是我必须在服务器终端把Claude Code给打通。
第二个问题,就是我在使用服务器的这个终端的时候,我发现我的这个VS Code Cline的插件总是卡住,每次当我这个Cline要交互这个终端的时候,它就卡死了,就怎么也动不了的那种,每次只有我重新关闭软件重新开VS Code,它才能继续工作。那么我最终还是要解决如何在服务器的终端上启动Claude Code这样一个效果,不然的话还是属于那种没有从根源就解决吧。
第三个问题,这个问题比较模糊,我不知道师兄访问我的模型的问题是否有从根源去解决,就是那个IP,是否可以直接用容器的IP来访问,我忘记那里没有试过,所以这一步还需要再测试一下。当然这一步是放之后的位置,我需要先把怎么高效率的使用大语言模型这一块给搞清楚。
这里有一个问题,就是我这个明明是容器用户吧,那么我容器用户只开了一个端口就是我的SSH端口,这个端口它是可以让别人访问的,但是我没有其他的端口来作为我的模型服务,可是师兄又可以测试到我的模型,这是一个很奇怪的事情。我开了8001端口它可以访问到,从这个角度来讲我开的端口岂不是公网端口,可我没有公网端口的权限啊。
那么这一点的话,我是一个想问记想要知其所以然的人,所以我还需要在王晶的配合下再测试一下到底行不行,并且去深挖他的原理。然后我还要知道是不是博士李书阳给我开了这个权限呢,那假如说他给我开权限,我也不能自己指定端口啊,我没有这个权限啊。
第四个问题是关于我自己的工作。
第一部分数据抽取的这一块吧,这一块的话有一些歧义,分开来说。其中第一点是我对这个问题进行了一个分类嘛,分到21个类别,所以说我现在的情况是一条新闻它会映射到多种类别,那么我这种多种类别我是按照新闻来分的还是按照这个类别来分的?如果按类别来分一条新闻可能就要被拆开来,被拆开来分析。
第二个问题是我看了一下第二种数据的那种格式和样式,第二种数据文本非常简短,那么在文本非常简短的情况下这种数据的质量肯定很低啊,那么就涉及到七元组它能不能提取出来的原因,因为在很长的新闻文本来看有些新闻文本它七元组还是抽不出来,质量还是不够,那么更不用说是那些推特上的评论了。
第三个问题就是数据分布不合理,我昨晚批量跑了一下这个21个类别分类,发现就是我已有的一个随机采样的话它的分类是极其不均匀的,有些类别甚至在1000条数据当中它一个都没有,所以的话这一块是我未来需要急切解决的问题。
那么总结一下,我下面有几个要点是需要跟老师对接的,第一个是这个类别的分类问题映射问题,第二个是这个三元组到底是干嘛的,这个需要搞清楚,第三个我最终要得到的一个效果是怎么样的,我的下游它到底需要怎么样的数据,数据格式是什么,时空关系是什么,然后文档当中的事件要素到底是什么,因为这个三元素它也可以理解为事件要素,一个客观发生的事实也可以理解为事件要素。第四个要点是,也是今天我最懵的,我们未来那个召回率准确率如何定义,这是一个问题,我到底要怎么样才能判断这个东西是准确的,这个东西它是抽取了出来的,并且可以用一个公式来量化,今天时间太短了我没有时间做这个事情了。
02 工作对接
接下来说说这个工作对接方面,工作对接方面的话昨天有个事情我要复盘一下。昨天我去找了莫里斯老师关于这个端口映射的问题,但是这个背景是这样的,我不认识他,我不知道他长什么样。据我所知呢那个办公室里有三个老师,其中有一个是翟老师,另外一个老师呢没有见过面,但是跟我是对接工作的在微信上,然后另一个就是我今天要找到老师了,所以说我并不认识他,也不知道他长什么样,他工位在哪。
那么我进去办公室的时候我就在门口问了一句,问莫老师在吗,这个是有问题的,因为这个就到反天纲了,就不像是一个学生在找老师,反而是老师的领导在找他这种感觉,比如说有费老师找他们这是可以的,但是我在办公室门口就要叫一句,虽然效率很高但是这是不合适的,有以下犯上的意味。然后旁边的翟老师就笑笑,他没有回答我也没有帮我,他让我自己去理解,我概笑到了那个笑容,我也get到了,他只是就自言自语,意思说你自己想呗。
这个事情要好好复盘复盘啊,假如说我再来一次,那么碰到这个陌生的老师陌生的环境,我应该怎么找自己名上的领导,这个是需要斟酌的。那么如果再来一次呢,我会这样,我会走到一个老师旁边,弯腰问他,您是莫老师吗,请问莫老师在吗,这样子才是一个正确的做法。而我直接在门口喊,是很没有礼貌的一个行为,下次注意啊,下次注意。还好有这个试错的缓冲期啊,在这个阶段试错没有什么成本,但是再到下一个阶段就不一样了,所以我也不知道未来自己所在的环境是偏民企开放一点还是偏国企传统一点,但我觉得无论环境怎么样,这是一些必要的礼貌吧,一些必要的修养。
因为我自己也感觉不对,这种我说不出来哪里不对,但我第一反应我就是感觉这样不好,我的潜意识第六感还是很灵敏的,就是我在事发的时候总是会有一种感觉,这种感觉是很灵敏的。然后呢我会在事后进行复盘的时候用一种逻辑来解释我这种感觉,但实际上我在那一时刻我只需要倾听自己的感觉就可以了,大概率是正确的。
当然还有一点是可以避免的,就是我是把自己处到这个环境下,我不得不再到办公室里找老师,但是正确的姿势应该是什么呢?这种情况可以避免,我应该就跟同学跟老师进行打听,或者莫老师是坐在办公室的哪个位置,然后再去找他,这样就不会出现任何尴尬的情况了。所以的话聪明人士不会把自己处于这种需要随机应变的禁地的,一开始就是被避免的,这个是第二个问题。
继续在工作对接上还有这个文档能力的问题啊,这个低级错误必须改正。今天飞老师接收文档的时候提到我第一部分的那个手行缩进有问题,这个是大一实训的时候就教会我的事情,做了这么多次了不可能到现在还犯这种低级错误,确实偷懒了,确实偷懒了,这个没得说,因为这个改过来很简单嘛。
这个也确实可以看出来自己在一些行为习惯上的一些问题啊,还是不够细心,或者说我有时候明明细心察觉到了,我也对这些小节没有这么关注吧,没有这么在意,对其重要性还是看得太低了。可能是在这上面没有吃过瘪,总是有人在给我擦屁股给我兜底,因为之前打比赛的时候有凯哥在帮我负责格式方面的问题,这方面我在给自己八字拍盘的时候也发现,我和梁璨都是这一种类型,让我们俩一起干这种很精细的活,是要了我们的命。
都说让事来教人嘛,反正现在最好的状态就是干事,干事他能发现问题啊,现在干事犯错成本比较低,成本比较低就只能这么说。
可能费老师也察觉到了,我这方面的问题,所以我觉得自己未来大概率不是现在徐友俊师兄的那个生态位,因为我就没有这么适合干这个事情,他就比较细心,在一些文档的整合还有一些总之就是一种偏秘书性的岗位方面,他会做的更细心一点。就是感觉女生这方面会更好一些,当然也看性格。
第三个就是和费老师的具体工作对接,这个的话我觉得自己的个人原因占一半,然后经验问题占一半。
那么这个个人问题是什么呢?因为早在一星期前费老师就跟我们提过这个事情了嘛,所以他其实是早早有所准备的。那么我个人的话是,到6月1号考完才开始上手,但是我记得另一个同门他是早在好几天前吧,四五天前就有点在负责这方面的工作的,所以的话这方面要注意。因为我那会也没有头绪,不知道这个事情到底是具体怎么样的,之前有什么先例没有,问了一下师兄他们也说这个达到基本要求就可以了,所以我也没有太上心了。
所以我其实对这个事情是在意的,并且也咨询了师兄的意见,那么到真正最后只有一天的时候,我在提交的话师兄再跟我说这样子是有问题的,然后再跟我说具体的方案还有框架,我才意识到这个事情应该怎么做吧,所以这是客观原因啊,这不是主观原因。
那么说说在主观上我有哪些原因吗?就是我在沟通的技巧上当然是严格的按照我之前的工作对接方式来的,那么那个工作对接方式很高效,也帮我规避了一些可能发生的问题,但是我现在看来还不够。
但是毕竟这是一个工具层面的方法,更大层次的是什么呢?就是我需要知道费老师做这个事情他的需求是什么,这方面我关注的少了,我认为这个事情很简单,或者前面有事情把我挡着,所以的话就没有觉得说我要知道费老师他具体是需要怎么样一个东西,达到什么标准什么要求,之前的经验是怎么,我没有在意。
所以我对这个项目这个过程流程是一个之前知其然不知其所以然的一个情况,所以接下来呢我做的一个措施和算是一个优化是什么的,我需要跟我的导师去沟通,知道他最近两天在外面他是做了什么,他需要达到一个什么要求,然后呢他需要达到一个什么要求从而推导出我们需要达到一个什么要求。因为在沟通不准确的情况下做的工大概率是无用工,我之前就意识到了这一点,然后到今天我算踩了一个坑吧,这个坑也不大,占用时间什么不高,但是是可以规避的。
我明明比如说花五到十分钟时间,问一下费老师为什么让我们做这个工作,为什么让我们去整理一下这些方案,那么他这些方案在未来他在研究所对接的过程当中所需要的一个状态是怎么样的,对费老师的作用是什么,那么我就知道了做到什么程度才可以一个交付。那么主要是第二方面还是主观上,我从师兄的态度那里进行了一个揣摩和揣测,认为这个事情没有这么重要或者要求没有这么高,因此便发挥主观的能动性了。
03 人际交往
这个的话简单提一下吧,不是本文章的重点。昨天我找廖师兄要了一下他的服务器的账号密码,这方面我就其实觉得挺神奇的吧,就我每次在廖师兄对接的时候总是抓不到重点,就是他给我发了一些消息啊,然后我会觉得你给我发这个东西,那我是不是就可以用这个账号去登录了呢,你给我说这个事情那我是不是就可以用这个事情去搞一些研究了呢,但是好像廖师兄他也仅仅是提到了一下,所以我不知道这个原因是什么,下次跟他对接的时候我还是有点迷茫,或者说感觉有点压力,跟其他师兄不一样。
那么其实在所有研二的同学当中我对他的印象最深,肯定是在实验室里有一些影响力或者是比较活跃的,这是必然的,但是我有一次看到他在研三那里就是比较刻意啊,我觉得比较刻意,感觉他在研三面前刷脸什么的,但是研三他们却不为所动吧,或者有些漠然,没有这么主动,有点热脸贴冷屁股的感觉,可能是我个人性格的原因,觉得这种有点不太合适,当然能加强跟研三的联系这是肯定的,这一方式方法上我感觉是不是有点太刻意了。
其实也反衬出来自己其实是一个比较骄傲的人,这个之前也发现了,本质上是有一些傲骨。
然后就感觉廖师兄,好像客观上他帮助了我很多,可是我主观上就感觉好像有点怪怪的,那这是帮到还是没帮到呢?所以这也算是我可以给自己的一个警示嘛,就是未来在帮助他人的时候呢,就默默地帮就可以了,也不需要说太刻意,也不需要在言语上故意有一种大家长的感觉。就不要说你应该怎么样这样子,当然这种是没法避免的,会有一些表述上的,但是这些需要注意一下。
转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。可以在下面评论区评论,也可以邮件至 kipleyarch@gmail.com