数据采集 2020 V10.2.4.10 build 20190707.213727


en-US zh-CN zh-TW 三合一多国语言 (绿色便携版)

VIP 合作客户 (需实名认证授权)


下载-解压后点击 digital_collect.exe 即可使用,无需单独安装

主要支持编程语言:

Python 2.x 3.x ( 官方安装版     绿色便携版 )

HTML5     Qt5/C++

 

若提示 无法定位程序输入点 ucrtbase.terminate 于动态链接库 api-ms-win-crt-runtime-l1-1-0.dll 上 或提示 *.dll 文件 出错 | 丢失 或无法启动

请安装 Microsoft Visual C++ 2015 Redistributable Package ,并重启计算机

 

此应用适于 数据整理-大数据工作者、AI (人工智能) 研发者、产品营销员、文字-秘书-财务工作者、IT 程序员、Web 开发者、等 用于快速 批量采集各种文档、字符-文本编码信息,网页内容、程序源代码等 用途。


集成 python27.dll 动态链接库,自带 Python 3.6.8 基本模块,基于 Qt5.12 C/C++ 开发。


应用还对常用 PC 操作进行了挖掘、提质增效、拓展集成,使之在相对智能的情况下,实现自动化批处理。

6 万左右文件批量修改-更新版本理想状态下核心耗时不过 1 分钟,全文搜索耗时不过 40 秒,双核 4 线程 CPU 8GB 内存工况 (配置更高会更快)。


存在 win32、win64 位版,推荐使用性能更优的 win64 位版。

默认支持 en-US 美式英语、zh-CN 简体中文、zh-TW 繁体中文 GUI (图形用户界面),其它语言请使用 数字翻译 本地化工具,自行扩展。


点击视图切换按钮可切换 "静态 | 动态" 模式 HTML5 HTML4 网页 "渲染 | 源代码" 表示方式。

点击自动换行按钮可把文本文件切换为 "换行 | 不换行" 表示方式。


支持 HTML5 HTML4 网页文件以 "渲染 | 源代码" 展示方式重复打开。

HTML5 HTML4 网页文件可重复打开。

"文本文件 | 目录" 不可重复打开。


窗口右下角会展示文件 "编码字符集 | Tab 键等效空格数"。

窗口左下角会展示文本文件选定文本 "行-列 | 字符数 | 行数" 等信息。


按下 Ctrl + G 键会打开 WEB 翻译选项卡。

应用会自动保存过往主要操作参数,必要时,亦可还原到初始状态。


所有菜单可撕离,方便随时调用其功能项。

所有选项卡可撕离,方便随时比对其它选项卡内容。


编辑菜单 --> 勾选剪贴板:监视,就能以剪贴板文本创建新文件 (或追加到现有文件),或调用语音助理诵读文本。


配备 "常用 | 收藏夹 | 历史记录" 3 级创新书签-历史记录管理功能。

收藏夹菜单可收藏、快速打开常用文件-目录,历史记录菜单可快速查看、打开过往操作。


可编写-调试 Python Qt/C++ HTML5 Bootstrap CSS JavaScript 等编程语言源代码。

深度集成 CMD.exe 命令控制台、Python Shell 命令交互功能,譬如: Python Cython PyInstaller PyQt PySide wxPython Git Clang 等常用命令。


首选项窗口带 "标准 | CMD 调试" 模式 GUI (图形用户界面) 一键切换功能。

可按规范 "编写 | 加载" 插件、脚本 (编写规范仍在制定中,暂未公布)。

 

小程序

自带基本 HTTP HTTPS 协议下载功能。

自带 定时关机 功能,在需要时可 "计时 | 定时" 关闭计算机电源。


默认集成按内容关键词查找文件的 FTS (全文搜索) 功能。

默认集成可诵读 "网页文字 | 文本" 等的 TTS (文本转语音) 语音助理功能,按下 F10 键终止。


小程序 自带无重要操作 5 分钟倒计时自动退出功能。

在结果选项卡中 Ctrl + 双击鼠标,可回调应用快速处理单元格文本。

文件聚集对话框可将结果选项卡中列出的所有文件,快速汇集到指定目的地目录。


未独立打包发布的小程序 GUI (图形用户界面) 语言从属主程序,单独设置不起作用。

以高速模式执行小程序会根据运行工况智能调用 CPU 线程 (最多调用所有线程 100% CPU 资源)。

文本模糊处理支持 <100_charProxy_marker> 万能通配符、 <relative_path_marker> 相对路径自校验标记,路径模糊处理支持 <02_dirProxy_marker> 万能目录通配符。

 

编辑格式

使用场景 文件格式 使用场景 文件格式
Digitser 文件 .dscf .dscp .dsdc .dser .dsml 文本文件 .log .txt
微软 Office Excel .csv .dcsv 微软 Office Word
Adobe Acrobat 达索 SolidWorks
CG 动画 图片文件
Adobe Photoshop 字体文件
Maxon Cinema 4D 动画 音频文件
视频文件 网页多媒体
虚拟光盘镜像文件 存档压缩文件
HTML 超文本标记语言 .css .htm .html .mht .url Markdown 标记语言 .md .rst
XML 可扩展标记语言 .dxml .xhtm .xhtml .xml 数据库 .db
汇编语言 .asm
C/C++ 编程语言 .c .cpp .cxx .h CMake 跨平台构建源码 .cmake
GO 编程语言 .go Erlang 编程语言 .erl
Qt/C++ 框架 .prf .pri .prl .pro .qml .qrc .qss .ts C# 编程语言 .cs
微软 Visual Studio IDE .sln .suo 微软 Windows 平台编程语言 .rc
微软 Windows 平台 .bat .cmd .conf .inf .ini .reg Java 编程语言 .java
JavaScript 编程语言 .djson .js .json PHP 超文本预处理语言 .php
Ruby 编程语言 .rb .rbw Python 编程语言 .py .pyw .pyi .sip .spec
Cython 编程语言 .pxd .pyx Lua 编程语言 .lua
Perl 编程语言 .pl .pm 活动服务器页面 .asa .asc .asp
Git 版本管理 .git Linux 平台 .list
Oracle VM 虚拟机 VirtualBox .vbox .vbox-prev

 

查看格式

使用场景 文件格式 使用场景 文件格式
Digitser 文件 .dscf .dscp .dsdc .dser .dsml 文本文件 .log .txt
微软 Office Excel .csv .dcsv 微软 Office Word
Adobe Acrobat .pdf 达索 SolidWorks
CG 动画 图片文件 .bmp .gif .ico .jpg .jpeg .png .svg .tif
Adobe Photoshop 字体文件
Maxon Cinema 4D 动画 音频文件 .mp3 .wav
视频文件 网页多媒体 .ogg .webm
虚拟光盘镜像文件 存档压缩文件
HTML 超文本标记语言 .css .htm .html .mht .url Markdown 标记语言 .md .rst
XML 可扩展标记语言 .dxml .xhtm .xhtml .xml 数据库 .db
汇编语言 .asm
C/C++ 编程语言 .c .cpp .cxx .h CMake 跨平台构建源码 .cmake
GO 编程语言 .go Erlang 编程语言 .erl
Qt/C++ 框架 .prf .pri .prl .pro .qml .qrc .qss .ts C# 编程语言 .cs
微软 Visual Studio IDE .sln .suo 微软 Windows 平台编程语言 .rc
微软 Windows 平台 .bat .cmd .conf .inf .ini Java 编程语言 .java
JavaScript 编程语言 .djson .js .json PHP 超文本预处理语言 .php
Ruby 编程语言 .rb .rbw Python 编程语言 .py .pyw pyi .sip .spec
Cython 编程语言 .pxd .pyx Lua 编程语言 .lua
Perl 编程语言 .pl .pm 活动服务器页面 .asa .asc .asp
Git 版本管理 .git Linux 平台 .list
Oracle VM 虚拟机 VirtualBox .vbox .vbox-prev