yin

word表格理解-llm

https://github.com/VikParuchuri/surya 开源领域对docx表格处理的 在实现类似chatDoc ai应用时候,如果处理word的表格是一大重要业务点。 word表格识别、填充、等是对word理解的重要组成部分。 一般word理解,包含段落理解、图片理解、表格理解。 目前段落、图片理解 算是比较简单. 比较单一输入源。。 我们可以使用ocr理解图片信息、或者多模态大模型理解图片和文本。 但表格的读取理解多了一层输入。 当然我们可以直接将docx的xml所有内容扔给多模态大模型,但是资源和理解范围要求比较高,目前各类大模型均无法实现更好的效果。 我们可以跳过ocr、或者多模态处理方式,主要专注在llm对文本处理的。 我们想办法将docx中的表格,输出为html或者xml表格形式,让大模型进行处理。 我们演示:用java实现docx读取,并合并单元格等,转为同等类型html。 import java.io.FileInputStream; import java.io.IOException; import
yin

dxf-viewer文本高亮方案

我们最近使用ezdxf后端实现复杂dxf图纸。(工业一次系统图) 遇到一个问题,使用各类cad软件打开文字显示正常,但是放入前端dxf-viewer框架中档图缩小时候,文字是完全模糊不见的。 方案1:尝试切换各类字体、包括黑体。(无用) 方案2:切换各类其他前端dxf展示,作用也不大。 方案3:自己查看 dxf-viewer 源码,想通过了解底层实现逻辑来实现文本的高亮。 dxf-viewer: 使用three.js 来实现渲染的。 three.js 是可以通过修改字体、修改渲染效果的。 从这里入手: 1:监听dxf-viewer  渲染事件, 2:重新渲染和文本有关的entity。 首先,我们得自定义three.js 使用的字体,three.js 使用json格式字体,你需要自己在官网通过脚本等,转化为json字体。 this.dxfViewer = new DxfViewer(this.$refs.canvasContainer, this.options)
yin

mrcp-server 版本发布

考虑到unimrcp使用不方便,我们开始寻求自研mrcp协议、sip等。   之前开源了 client版本。https://github.com/laoyin/java-sip-mrcp GitHub - laoyin/java-sip-mrcp: java版本的mrcp服务,实现sip、mrcp等协议,实现实时语音流处理、回调等。java版本的mrcp服务,实现sip、mrcp等协议,实现实时语音流处理、回调等。. Contribute to laoyin/java-sip-mrcp development by creating an account on GitHub.GitHublaoyin 最近我们逐步完善了 mrcp-server版本,做大量代码测试等。 自研java版本mrcp-server_哔哩哔哩_bilibilihttps://github.com/laoyin/java-sip-mrcp, 基于此实现了server,用于和freeswitch进行asr交互。Java SIP
yin

freeswitch-mediabug回调细节

有群友询问如何进行监听和会写媒体。 很多人根据我的文档和文章知道了使用media bug,但是有几个回调有疑虑。 我这边出一个源码的细则,大家便非常清楚了。 类型解释 SWITCH_ABC_TYPE_INIT 初始化 close 关闭这里不再赘述 SWITCH_ABC_TYPE_WRITE_REPLACE: 将读取的进行替换 SWITCH_ABC_TYPE_WRITE_REPLACE: 写出时候,可以进行媒体替换 代码样例 那么你如何进行读取和写出时候进行替换呢? 我们看一部分代码 static switch_bool_t replace_callback(switch_media_bug_t *bug, void *user_data, switch_abc_type_t type) { displace_
yin

如何自定义freeswitch-cdr

关于cdr,只要涉及freeswitch,都关心cdr存储和处理。 如果现有的cdr你自己不满意,如何自定义呢? 我们参考freeswitch mod_json_cdr 来看看源码如何实现的。 源码只有几百行,特别适合初学者学习。 /* * FreeSWITCH Modular Media Switching Software Library / Soft-Switch Application * Copyright (C) 2005-2014, Anthony Minessale II * * Version: MPL 1.1 * * The contents of this file are subject to the Mozilla Public License Version * 1.1 (the "License"); you may not
yin