Kyle's Blog

发表于 2025-05-27 | 更新于 2025-06-29

背景业务中有一个功能，可以使用优惠券抵扣字数，优惠券面额有 300 字、500 字和 800 字，张数随机。在用户下单的时候需要为其自动推荐最佳优惠券组合，同时为了保证优惠券不浪费，最多只能溢出小于 300 字。例如 900 字的订单，有 2 张 800 字优惠券，若全部使用，则会浪费 700 字，对用户体验不好。对于这种情况，只为用户自动选择 1 张 800 字的优惠券即可。那么这个问题可以抽象为一个有条件限制的多重背包问题。题目描述你有若干张优惠券，每张优惠券可以抵扣一定的字数，规则如下：优惠券面额为300、500、800，每种张数有限每次用户选择一个目标字数target（为100的整数倍）请你从宜有的优惠券中选出若干张，使得总字数sum满足 sum >= target （必须覆盖目标字数） sum - target < 300（溢出必须严格小于300，即最小优惠券面额）如果找不到满足上述条件的组合，退而求其次，返回一个 sum <= target的组合，要求它尽可能接近target。如果仍然无法组成任意组合，则返回null ...

Windows剪切板剖析

发表于 2025-02-16 | 更新于 2025-02-16 | Python • Hook

背景问题发现场景描述：我在复制消息准备粘贴到知乎进行搜索时，手误复制了多余的内容。粘贴到知乎时，内容变成了如下格式：12345　ㅤ: 02-15 19:09:01我才没看ln: 02-15 19:09:26你在知乎每天搜一遍怎么哄女朋友开心进一步观察：将同样的内容粘贴到QQ聊天输入框时，内容却变成了转发消息的格式：剪切板历史：按下 Win + V 打开Windows的剪切板历史，看到的内容与粘贴到知乎时一致：问题思考剪切板中可能存在一些隐藏的数据格式，导致粘贴到不同应用程序时呈现不同的效果。联想到一些博客网站在复制内容时，会自动添加禁止转载的文案，或者在Word中粘贴时带有奇怪的格式和背景，这些现象进一步坚定了我的猜想。技术探索获取剪切板数据为了验证猜想，我编写了一个Python脚本，使用 win32clipboard 模块来获取剪切板中的所有数据格式及其内容。 1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950import win ...

并查集

发表于 2025-01-15 | 更新于 2025-02-16 | 并查集

引言在AB测试中，确保用户的一致性和唯一性是获得准确结果的关键。然而，在非强制登录的Web项目中，用户的唯一标识可能会因退出、登录、切换浏览器等行为而发生变化。这可能导致同一个用户被误认为是多个不同的用户，进而影响实验结果的准确性。本文将探讨如何解决这一问题，以提高AB测试的有效性。问题描述在Web应用中，如果简单地使用后端生成的用户token作为唯一用户标识，可能会遇到以下问题：用户在登录前后或退出登录时，会获取新的token。如果以token作为实验分流的唯一属性，可能会导致实验结果不准确。具体原因用户token变化：用户在登录前后或退出登录时，token会发生变化。如果仅依赖token作为唯一标识，同一个用户在不同状态下会被视为不同的用户。前端尝试策略：前端生成一个唯一的客户端标识（client_id），并将其存储在cookie中。只要用户不清除浏览器缓存，无论登录状态如何变化，都能通过client_id唯一标识用户。但考虑到用户可能后端订单创建：后端在创建订单时，使用token作为用户标识。前端的client_id与订单业务没有直接关联，导致token与cli ...

A/B测试

发表于 2024-12-20 | 更新于 2025-01-22 | A/B测试

GrowthBook -- 一个免费的AB测试框架

MathML转OMML写入Word，插入公式

发表于 2024-12-16 | 更新于 2025-02-16 | .NET

业务背景想在生成的文档中插入公式，丰富文档格式，提高专业度。但大模型输出的公式中，LaTeX 是最稳定的生成格式，但是也不排除生成错误的情况，导致 Word 无法正确渲染。因此，本文需要解决以下两个问题：将 LaTeX 公式转换为 MathML，然后转换为 OMML，并写入 Word。目前，LaTeX 转 MathML 的方案较为成熟，因此本文重点探讨 MathML 转 OMML 的实现。校验最终插入 Word 文档的 OMML 是否可以正常渲染。方案实现经过我的一番搜索，在stackoverflow上找到了一个解决方案，微软提供了 XSLT 样式表，用于使用 XSLT 将 OMML 转换为 MathML. 整体公式处理链路如下大模型生成LaTeX格式的公式，随后转为MathML 调用服务将MathML转为OOML，并写入Word文档使用Open-Xml SDK 校验Word文档格式是否有误。 Program.csstartup.csValidatorController.cs12345678910111213141516171819202122232425 ...

FastAPI

发表于 2024-12-12 | 更新于 2024-12-15 | Python • FastAPI

感觉有必要系统性的学一遍

如何DIY一个QQ智能体

发表于 2024-11-16 | 更新于 2025-02-12 | 随写 | LLM

初衷其实是给楠楠做个每日提醒机器人的，结果越走越偏...

反编译jar包破解ASPOSE

发表于 2024-10-10 | 更新于 2025-02-16 | 随写 | 逆向

破解版本为aspose-html-22.8-jdk11.jar

策略模式 + 函数式编程简化代码

发表于 2024-10-06 | 更新于 2025-02-15 | 设计模式 | 随写 • 设计模式

基于模板方法模式的核心思想，但用策略模式 + 函数式编程进行优化

基于图的任务调度算法

发表于 2024-08-17 | 更新于 2024-10-06 | 随写 | 随写

基于DAG的并发任务调度实现

Win10 解决L2TP连接尝试失败，因为安全层在初始化与远程计算机的协商时遇到一个处理错误

发表于 2024-08-08 | 更新于 2024-08-09 | 随写 | 随写

装机总是会遇到各种各样的问题

局域网文件迁移

发表于 2024-08-08 | 更新于 2024-08-09 | 随写 | 随写

装完新机，需要迁移数据

泰拉瑞亚-坐骑Mod开发

发表于 2024-07-20 | 更新于 2024-11-03 | Mod开发 | Mod开发

持续更新中...

泰拉瑞亚Mod开发指南

发表于 2024-07-06 | 更新于 2024-07-19 | Mod开发 | Mod开发

持续更新中，咕咕咕

浅谈操作系统的虚拟内存

发表于 2024-02-25 | 更新于 2024-02-25 | 随写 | OS

新需求还没出来，刚好可以系统性的学点东西，提升一下自己

实现一个Cache，包括LRU和在X秒后过期的逻辑

发表于 2024-02-25 | 更新于 2024-02-25 | 踩坑日记 | MySQL

最近有些懈怠了，刷刷题，这种底层实现还是挺有意思的

Navicat在结构同步时的注意事项

发表于 2024-02-07 | 更新于 2024-02-24 | 踩坑日记 | MySQL

在修改字段名时，Navicat提供的SQL是先删除这列再新增

LangChain入门指南

发表于 2024-01-26 | 更新于 2024-02-24 | 实用教程 | LangChain

什么是LangChain LangChain是一个强大的框架，旨在帮助开发人员使用语言模型构建端到端的应用程序。它提供了一套工具、组件和接口，可简化创建由大型语言模型 (LLM) 和聊天模型提供支持的应用程序的过程。LangChain 可以轻松管理与语言模型的交互，将多个组件链接在一起，并集成额外的资源，例如 API 和数据库。官方文档：https://python.langchain.com/en/latest/ 如何使用LangChain 要使用 LangChain，开发人员首先要导入必要的组件和工具，例如 LLMs, chat models, agents, chains, 内存功能。这些组件组合起来创建一个可以理解、处理和响应用户输入的应用程序。 LangChain 为特定用例提供了多种组件，例如个人助理、文档问答、聊天机器人、查询表格数据、与 API 交互、提取、评估和汇总。 LangChain的模型 LangChain model 是一种抽象，表示框架中使用的不同类型的模型。LangChain 中的模型主要分为三类： LLM（大型语言模型）：这些模型将文本字符串作为输 ...