Kyle's Blog
加载中...
零成本自建碎碎念API
Vercel + Cloudflare Workers + MongoDB Atlas 零成本方案
Windows剪切板剖析
背景 问题发现 场景描述: 我在复制消息准备粘贴到知乎进行搜索时,手误复制了多余的内容。 粘贴到知乎时,内容变成了如下格式: 12345 ㅤ: 02-15 19:09:01我才没看ln: 02-15 19:09:26你在知乎每天搜一遍怎么哄女朋友开心 进一步观察:将同样的内容粘贴到QQ聊天输入框时,内容却变成了转发消息的格式: 剪切板历史:按下 Win + V 打开Windows的剪切板历史,看到的内容与粘贴到知乎时一致: 问题思考 剪切板中可能存在一些隐藏的数据格式,导致粘贴到不同应用程序时呈现不同的效果。联想到一些博客网站在复制内容时,会自动添加禁止转载的文案,或者在Word中粘贴时带有奇怪的格式和背景,这些现象进一步坚定了我的猜想。 技术探索 获取剪切板数据 为了验证猜想,我编写了一个Python脚本,使用 win32clipboard 模块来获取剪切板中的所有数据格式及其内容。 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474 ...
并查集
引言 在AB测试中,确保用户的一致性和唯一性是获得准确结果的关键。然而,在非强制登录的Web项目中,用户的唯一标识可能会因退出、登录、切换浏览器等行为而发生变化。这可能导致同一个用户被误认为是多个不同的用户,进而影响实验结果的准确性。本文将探讨如何解决这一问题,以提高AB测试的有效性。 问题描述 在Web应用中,如果简单地使用后端生成的用户token作为唯一用户标识,可能会遇到以下问题:用户在登录前后或退出登录时,会获取新的token。如果以token作为实验分流的唯一属性,可能会导致实验结果不准确。 具体原因 用户token变化:用户在登录前后或退出登录时,token会发生变化。如果仅依赖token作为唯一标识,同一个用户在不同状态下会被视为不同的用户。 前端尝试策略:前端生成一个唯一的客户端标识(client_id),并将其存储在cookie中。只要用户不清除浏览器缓存,无论登录状态如何变化,都能通过client_id唯一标识用户。但考虑到用户可能 后端订单创建:后端在创建订单时,使用token作为用户标识。前端的client_id与订单业务没有直接关联,导致token与 ...
A/B测试
GrowthBook -- 一个免费的AB测试框架
MathML转OMML写入Word,插入公式
业务背景 想在生成的文档中插入公式,丰富文档格式,提高专业度。但大模型输出的公式中,LaTeX 是最稳定的生成格式,但是也不排除生成错误的情况,导致 Word 无法正确渲染。因此,本文需要解决以下两个问题: 将 LaTeX 公式转换为 MathML,然后转换为 OMML,并写入 Word。 目前,LaTeX 转 MathML 的方案较为成熟,因此本文重点探讨 MathML 转 OMML 的实现。 校验最终插入 Word 文档的 OMML 是否可以正常渲染。 方案实现 经过我的一番搜索,在stackoverflow上找到了一个解决方案,微软提供了 XSLT 样式表,用于使用 XSLT 将 OMML 转换为 MathML. 整体公式处理链路如下 大模型生成LaTeX格式的公式,随后转为MathML 调用服务将MathML转为OOML,并写入Word文档 使用Open-Xml SDK 校验Word文档格式是否有误。 Program.csstartup.csValidatorController.cs123456789101112131415161718192021222 ...
FastAPI
感觉有必要系统性的学一遍
如何DIY一个QQ智能体
初衷其实是给楠楠做个每日提醒机器人的,结果越走越偏...
反编译jar包破解ASPOSE
破解版本为aspose-html-22.8-jdk11.jar
策略模式 + 函数式编程 简化代码
基于模板方法模式的核心思想,但用 策略模式 + 函数式编程 进行优化
基于图的任务调度算法
基于DAG的并发任务调度实现
Win10 解决L2TP连接尝试失败,因为安全层在初始化与远程计算机的协商时遇到一个处理错误
装机总是会遇到各种各样的问题
局域网文件迁移
装完新机,需要迁移数据
泰拉瑞亚-坐骑Mod开发
持续更新中...
泰拉瑞亚Mod开发指南
持续更新中,咕咕咕
浅谈操作系统的虚拟内存
新需求还没出来,刚好可以系统性的学点东西,提升一下自己
实现一个Cache,包括LRU和在X秒后过期的逻辑
最近有些懈怠了,刷刷题,这种底层实现还是挺有意思的
Navicat在结构同步时的注意事项
在修改字段名时,Navicat提供的SQL是先删除这列再新增
LangChain入门指南
什么是LangChain LangChain是一个强大的框架,旨在帮助开发人员使用语言模型构建端到端的应用程序。它提供了一套工具、组件和接口,可简化创建由大型语言模型 (LLM) 和聊天模型提供支持的应用程序的过程。LangChain 可以轻松管理与语言模型的交互,将多个组件链接在一起,并集成额外的资源,例如 API 和数据库。 官方文档:https://python.langchain.com/en/latest/ 如何使用LangChain 要使用 LangChain,开发人员首先要导入必要的组件和工具,例如 LLMs, chat models, agents, chains, 内存功能。这些组件组合起来创建一个可以理解、处理和响应用户输入的应用程序。 LangChain 为特定用例提供了多种组件,例如个人助理、文档问答、聊天机器人、查询表格数据、与 API 交互、提取、评估和汇总。 LangChain的模型 LangChain model 是一种抽象,表示框架中使用的不同类型的模型。LangChain 中的模型主要分为三类: LLM(大型语言模型):这些模型将文本字符 ...
Attributes
avatar
The furthest distance in the world
ls not between life and death
But when l stand in front of you
Yet you don't know that l love you
公告栏
恰饭广告,一个文本类AIGC网站,写各种作业的时候有大用!!
可以一键生成开题报告毕业论文答辩PPT等各种文档生成需求,近期还上线了新版降重模型,查重率支持降到个位数,目前还有推广赚钱活动,感兴趣的兄弟萌可以戳链接看看:快降重--高端降重,遥遥领先
最新文章
小站资讯
文章数目 :
150
本站总字数 :
108.4w
本站访客数 :
本站总访问量 :
最后更新时间 :
空降评论复制本文地址
随便逛逛昼夜切换关于博客美化设置切换全屏打印页面