文本格式化
处理规则 0
暂无处理规则,点击"添加规则"开始配置
格式化结果
正则表达式示例
\d+
匹配数字
[a-zA-Z]+
匹配字母
\s+
匹配空白字符
^\s*
匹配行首空白
\s*$
匹配行尾空白
"[^"]*"
匹配引号内容
\w+@\w+\.\w+
匹配邮箱格式
https?://\S+
匹配网址
\r?\n|\r
匹配回车换行
\b(?:[0-9]{1,3}\.){3}[0-9]{1,3}\b
匹配IP地址
文本格式化工具使用指南
本工具用于批量清洗文本,支持按行和全文本两种处理模式。可对每行的前缀、后缀或整行内容进行删除、替换、提取等操作。典型场景:去掉 JSON/CSV/日志 每行的包裹字符、截取分隔符前后内容、提取特定字段值、修剪固定长度前/后缀等。
核心功能
🔧 简洁的匹配模式
- 行前缀处理:匹配并处理行开头的字符串
- 行后缀处理:匹配并处理行结尾的字符串
- 整行处理:在整行范围内查找并处理匹配内容
- 全文本处理:在分行之前对整个文本进行处理(如换行符替换)
- 正则表达式:支持复杂模式匹配
- 动态规则列表:可添加多个规则按顺序处理
⚙️ 智能处理选项
- 删除操作:移除匹配的字符串
- 替换操作:将匹配的字符串替换为指定内容
- 仅保留操作:只保留匹配的字符串,删除其他内容(用于字段提取)
- 分行操作:将匹配的字符串替换为换行符
- 删除空行:快速移除文本中的所有空白行(全文本模式专用)
- 实时预览:配置规则后立即显示处理结果
- 错误提示:正则表达式语法错误实时检测
使用场景示例
🔑 用户ID提取
从日志文件中提取用户ID信息,用于用户行为分析
输入:
配置:整行正则表达式匹配
输出:
[2024-01-15 10:23:45] INFO User login successful, USERID: 12345, SESSION: abc123
配置:整行正则表达式匹配
USERID: \d+
,处理方式选择"仅保留"输出:
USERID: 12345
🐳 Docker 日志清理
提取容器日志中的关键信息,去除时间戳和容器名称
输入:
配置:正则前缀删除时间戳,整行删除容器名称
输出:
[2024-01-15 10:23:45] INFO container-web-app-1 - Application started
配置:正则前缀删除时间戳,整行删除容器名称
输出:
INFO Application started
📊 Nginx 访问日志处理
从访问日志中提取状态码和响应时间
输入:
配置:正则匹配提取状态码和响应时间
输出:
192.168.1.1 - - [15/Jan/2024:10:24:16] "GET /api/users HTTP/1.1" 200 1024 45ms
配置:正则匹配提取状态码和响应时间
输出:
200 45ms
🔍 Kubernetes Pod 日志聚合
清理 K8s 日志格式,统一输出格式
输入:
配置:正则删除时间戳和流信息,保留日志内容
输出:
2024-01-15T10:23:45.123Z stdout F [ERROR] Database connection failed
配置:正则删除时间戳和流信息,保留日志内容
输出:
[ERROR] Database connection failed
🛠️ 配置文件批量处理
批量修改配置文件中的参数值
输入:
配置:后缀匹配
输出:
database.host=localhost:3306
配置:后缀匹配
=localhost:3306
,替换为 =prod-db:3306
输出:
database.host=prod-db:3306
🔄 CSV 数据清洗
清理 CSV 数据中的引号和特殊字符
输入:
配置:前后缀删除引号,整行替换逗号为制表符
输出:
"user_001","John Doe","john@example.com","Active"
配置:前后缀删除引号,整行替换逗号为制表符
输出:
user_001 John Doe john@example.com Active
📋 API 响应提取
从 JSON 日志中提取特定字段值
输入:
配置:正则匹配提取 userId 字段值
输出:
{"timestamp":"2024-01-15T10:23:45Z","level":"INFO","message":"User login successful","userId":"12345"}
配置:正则匹配提取 userId 字段值
输出:
12345
🧹 文本清理与格式化
快速删除文档中的多余空行,提升文本可读性
输入:
配置:全文本模式,处理方式选择"删除空行"
输出:
用户数据
用户1:张三
用户2:李四
统计完成
配置:全文本模式,处理方式选择"删除空行"
输出:
用户数据
用户1:张三
用户2:李四
统计完成
使用步骤
1
配置处理规则
根据需要选择前缀和后缀的匹配模式,设置相应参数,选择删除或替换操作
2
输入源文本
在左侧编辑器中输入或粘贴需要处理的文本,支持文件导入功能
3
查看结果并导出
在右侧查看实时处理结果,确认无误后可复制或导出为文件