网易首页 > 网易号 > 正文 申请入驻

有没有Java版类似SQLite的开源库?

0
分享至

  能嵌入JAVA代码被调用,又能进行数据计算的开源库,数据库类的有HSQLDB/Derby/H2等。这几个和SQLite的毛病一样,入库过程非常繁琐,要检查表名是否重复、建表结构、读文件、解析字段、插入记录、建索引等,而且没法处理不规则的文本和特殊数据源;至于近年来计算库逐渐被重视的功能--JSON计算,虽然内嵌数据库也是赶鸭子上架,但这几个还不如内嵌数据库。DataFrame类的计算库有Tablesaw/ Joinery/ Morpheus等,在多层JSON(半结构化数据)的读取和计算上,它们比数据库要方便多了,但二维结构化数据的计算又远不如数据库。

  二维结构化数据和多层JSON的计算都足够强,又支持多种数据源,可处理不规则文本的嵌入式JAVA开源库,集算器SPL是个更好的选择。

  JAVA调用SPL只需JDBC接口,基本看一遍就会。比如把tab分隔的文本文件Orders.txt按Client列顺序排序,按Amount列逆序排序:

  
…Class.forName("com.esproc.jdbc.InternalDriver");Connection connection =DriverManager.getConnection("jdbc:esproc:local://");Statement statement = connection.createStatement();Stringstr="=T(\"D:/Orders.txt\").sort(Client,- Amount)";ResultSet result = statement.executeQuery(str);…

  一个T函数就相当于内嵌数据库入库那一整套过程,比那些内嵌的数据库方案要方便多了。

  为了数据库程序员的方便,SPL也支持SQL语句,比如上面的排序可改写为:

  
str="$select* fromd:/Orders.txt orderbyClient, Amount desc"

  再讲讲刚才的sort函数,这样的基本计算函数SPL有上百个,可以直接完成大多数常规计算。下面试举一些:

  
//条件查询str="=T(\"D:/Orders.txt\").select(Amount>1000 && Amount<=3000 && like(Client,\"*S*\"))";//分组汇总str ="=T(\"D:/Orders.txt\").groups(year(OrderDate);sum(Amount))";//关联str ="=join(T (\"D:/Orders.txt\"):O,SellerId; T(\"D:/data/Employees.txt\"):E,EId).new(O.OrderID,O.Client,O.SellerId,O.Amount,O.OrderDate, E.Name,E.Gender,E.Dept)";

  处理过的数据还可以持久化为btx集文件,不仅计算性能高,而且体积更小。比如将两个同构的文本文件写在一个btx里,并去掉两者重复的行:

  
A B 1 =[T("d:/orders1.csv"), T("d:/orders2.csv")].merge@u() /对记录做并集 2 file("d:/fast.btx").export@b(A1) /写入集文件

  之后就可以像普通文件那样使用:

  
str="=T(\"D:/fast.btx\").sort(Client,- Amount)"str="$select * from d:/fast.btx order by Client, Amount desc"

  btx还可以预先进行有序化处理,从而获得更高计算性能,比如进行二分查找,详情参考官网。

  为了降低耦合性,SPL算法可外置于JAVA代码。比如,找出销售额累计占到一半的前n个大客户,并按销售额从大到小排列。先将SPL脚本存为文件bigCustomer.dfx:

  
AB1 = T("D:/data/sales.csv").sort(amount:-1) 取数并逆序排序 2 =A1.cumulate(amount) 计算累计序列 3 =A2.m(-1)/2 最后的累计值即是总和 4 =A2.pselect(~>=A3) 超过一半的位置 5 =A1(to(A4)) 按位置取值

  再在JAVA代码中以存储过程的方式调用脚本文件:

  
…Class.forName("com.esproc.jdbc.InternalDriver");Connection connection =DriverManager.getConnection("jdbc:esproc:local://");Statement statement = connection.createStatement();ResultSet result = statement.executeQuery("call bigCustomer ()");...

  有些运算较复杂,比如涉及分组后计算、有序计算、集合计算,即使用存储过程也难以解决,更别说连存储过程都不支持的内嵌数据库了。 SPL提供了强大的语法和丰富的库函数,可以大幅简化复杂运算逻辑。 比如: 计算某支股票最长的连续上涨天数,SPL只需两行:

  
A B 1 =T("d:/AAPL.xlsx") 读Excel文件,首行为列名 2 =a=0,A1.max(a=if(price>price[-1],a+1,0)) 求最长连续上涨天数

  有些运算代码较长,或有分支和循环,SPL提供了专用的IDE,可以方便地跟踪调试,观察每一步的计算结果

  对于不规则的文本, SPL同样可以处理。简单的比如以双竖线||为分隔符,可用如下SPL语句读取:

  
= file("D:/Orders.txt").import@t(;,"||")

  复杂些的不规则的文本,参考 《未结构化文本的读写和解析处理》(底部原文中查看链接)

  SPL支持多种数据源,除了文本文件,还有Excel、数据库、各类NoSQL、webService、restful等。比如:restful返回多层JSON,用来描述多个员工和员工的多个订单,需要查询出所有价格在500-2000,且客户名包含bro字样的订单。SPL代码如下:

  
A 1 =json(httpfile("http://127.0.0.1:6868/api/getEmpOrders").read()) 2 =A1.conj(Orders) 3 =A2.select(Amount>500 && Amount<=2000 && like@c(Client,"*bro*"))

  集算器SPL是优秀的JAVA嵌入式开源计算库,在结构化计算方面比数据库更强,在多层数据的计算方面比Dataframe更方便,在多数据源支持方面更是全面超过两者。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
人怎么能这么聪明!辽宁一女子产后出院遇寒风,丈夫灵机一动用大号塑料袋挡风

人怎么能这么聪明!辽宁一女子产后出院遇寒风,丈夫灵机一动用大号塑料袋挡风

小虎新车推荐员
2026-02-03 06:26:42
马斯克批评诺兰新品选择黑人饰演古希腊神话美女,引发舆论争议

马斯克批评诺兰新品选择黑人饰演古希腊神话美女,引发舆论争议

新浪财经
2026-02-05 11:02:09
秦始皇说:吕不韦于我有恩,本可不死,可是我有1000个杀他的理由

秦始皇说:吕不韦于我有恩,本可不死,可是我有1000个杀他的理由

芊芊子吟
2026-02-05 17:25:07
马斯克审美真绝!艾梅柏疯归疯,颜值上没的说,怪不得不用生孩子

马斯克审美真绝!艾梅柏疯归疯,颜值上没的说,怪不得不用生孩子

悦君兮君不知
2026-02-04 17:40:10
太打脸了!日本从海底挖出稀土,还没高兴两天,中方一句话定调

太打脸了!日本从海底挖出稀土,还没高兴两天,中方一句话定调

未来展望
2026-02-05 01:01:05
52岁李冰冰美出新高度,和李雪同框神似双胞胎,冻龄颜值引热议!

52岁李冰冰美出新高度,和李雪同框神似双胞胎,冻龄颜值引热议!

很哥
2026-02-05 19:24:22
Lisa雪地穿比基尼配14万羽绒服,壁炉旁烤火显可爱

Lisa雪地穿比基尼配14万羽绒服,壁炉旁烤火显可爱

枫尘余往逝
2026-02-04 17:32:15
黄征辉曾透露:台湾可以回归,但大陆必须答应2个条件,缺一不可

黄征辉曾透露:台湾可以回归,但大陆必须答应2个条件,缺一不可

花寒弦絮
2026-01-19 01:23:58
不要再随意猜测杨兰兰的身份了,释放的信号很明显了

不要再随意猜测杨兰兰的身份了,释放的信号很明显了

李昕言温度空间
2025-08-20 15:01:53
支奴干和黑鹰,我们为啥就是抄不动?一段被发动机卡脖子的往事

支奴干和黑鹰,我们为啥就是抄不动?一段被发动机卡脖子的往事

形上谓道
2026-01-15 21:28:57
1988年,我军在老山截获越南绝密电报,求救信息令首长大吃一惊

1988年,我军在老山截获越南绝密电报,求救信息令首长大吃一惊

南书房
2026-02-03 15:55:03
美国暗中使计,卢秀燕成最大变数,大陆一锤定音:就这事没得商量

美国暗中使计,卢秀燕成最大变数,大陆一锤定音:就这事没得商量

荷兰豆爱健康
2026-02-05 18:41:07
记者在街头采访年轻人“年薪20万属于什么水平”,得到的回答令人咋舌!

记者在街头采访年轻人“年薪20万属于什么水平”,得到的回答令人咋舌!

张晓磊
2025-10-31 09:44:39
立春:一个人转运,从叫醒自己开始

立春:一个人转运,从叫醒自己开始

洞见
2026-02-03 21:00:33
百回合赢17分,夺冠概率东部第1!骑士有多强?哈登这次真选对了

百回合赢17分,夺冠概率东部第1!骑士有多强?哈登这次真选对了

老梁体育漫谈
2026-02-04 23:10:13
危险信号!美国,惊天阴谋彻底曝光了!

危险信号!美国,惊天阴谋彻底曝光了!

大嘴说天下
2026-02-04 23:55:03
1657亿交易失控!巴拿马接管长和港口不到24小时,中方给出回应

1657亿交易失控!巴拿马接管长和港口不到24小时,中方给出回应

芯火相承
2026-02-04 14:06:49
老婆天天穿破洞丝袜,我不动声色,三天后送她一份大礼

老婆天天穿破洞丝袜,我不动声色,三天后送她一份大礼

民间精选故事汇
2026-02-05 18:03:01
纽约期金突破5030美元/盎司,日内涨1.62%

纽约期金突破5030美元/盎司,日内涨1.62%

每日经济新闻
2026-02-05 07:20:05
寒潮今夜开始袭击浙江!高山区大到暴雪,气温暴跌10℃+!最冷就在...

寒潮今夜开始袭击浙江!高山区大到暴雪,气温暴跌10℃+!最冷就在...

浙江天气
2026-02-05 17:11:24
2026-02-05 20:23:00
IT架构师联盟 incentive-icons
IT架构师联盟
IT架构实战分享
836文章数 7671关注度
往期回顾 全部

科技要闻

美团7.17亿元收购叮咚买菜

头条要闻

普京计划上半年对中国进行访问 外交部回应

头条要闻

普京计划上半年对中国进行访问 外交部回应

体育要闻

奇才:我学生……独行侠:成交!

娱乐要闻

谢娜明年开演唱会:带老歌出来见见人

财经要闻

中美"只会有好消息" 经济冷暖看房价

汽车要闻

李想为全新L9预热 all in AI造更好的车

态度原创

艺术
亲子
健康
本地
公开课

艺术要闻

他热爱绘画,生活中的每一刻都充满激情!

亲子要闻

袋鼠妈妈陷“孕妇过敏”风波,宣称“准孕妇可用”打擦边球?

耳石症分类型,症状大不同

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版