欢马劈雪的技术文章、集册、实例源码

时代Java，与您同行！关注微信公众号，关注前沿技术，微信搜索：nowjava或时代Java，也可点击这里扫码关注

时代Java

登录注册

京东自营 + 国补 iPhone 历史最低价国家补贴享8折

欢马劈雪

浅析数据对大语言模型的影响

由于大语言模型的训练需要巨大的计算资源，通常不可能多次迭代大语言模型预训练。千亿级参数量的大语言模型每次预训练的计算需要花费数百万元人民币。因此，在训练大语言模型之前，构建一个准备充分的预训练语料库尤为重要。

欢马劈雪 2024-01-30 10:21:33 2024-01-30 10:21:33

数据，大语言模型，影响
Java 多线程概念汇总

线程是cpu任务调度的最小执行单位，每个线程拥有自己独立的程序计数器、虚拟机栈、本地方法栈。线程状态：创建、就绪、运行、阻塞、死亡

欢马劈雪 2024-01-24 15:28:28 2024-01-24 03:28:28

Java，多线程，概念，汇总
详解 Mybatis 查询结果返回 Map、List集合

1. 查询返回单个结果 1.1. 返回单个 Map 设置返回值类型 resultType="java.util.Map"

欢马劈雪 2024-01-17 17:55:40 2024-01-17 12:53:26

Mybatis，查询，结果，返回， Map， List，集合
Spring Boot 3.2.0 新特性

Spring Boot 最后一个 2.x 的版本 2.7.x 已经停止维护，3.0.x 也停止维护了，商业支持的版本也只有 2.6.x 了，2.5.x 以下的版本彻底退出历史舞台。。

欢马劈雪 2024-01-02 15:18:35 2024-01-02 03:18:35

Spring， Boot， 3.2.0，新特性
谷歌大语言模型 Gemini 解读和实践

12 月 6 日，谷歌宣布推出咕了很久的全新大语言模型 Gemini，展示了三个版本 Gemini Ultra、Gemini Pro 和 Gemini Nano。并在 Bard 上开放了体验 Gemini Pro。同时，谷歌放出了一段看起来非常酷炫高科技的视频 demo，一度让笔者觉得 Gemini 已经全面超越 GPT-4 了。

欢马劈雪 2024-01-02 13:38:55 2024-01-02 01:38:55

谷歌，大语言，模型， Gemini，解读，实践
详解 Java 接口限流

限流是对某一时间窗口内的请求数进行限制，保持系统的可用性和稳定性，防止因流量暴增而导致的系统运行缓慢或宕机。

欢马劈雪 2024-01-02 13:35:30 2024-01-02 01:35:30

Java，接口，限流
Java进行数据库操作的并发控制的2种方法

在现代应用编码中，从数据库里面find出来，进行一些业务逻辑操作，最后再save回去。

欢马劈雪 2024-01-02 13:33:10 2024-01-02 01:33:10

Java，数据库，并发控制
大语言模型训练数据常见的4种处理方法

大语言模型训练需要数万亿的各类型数据。如何构造海量“高质量”数据对于大语言模型的训练具有至关重要的作用。虽然，截止到2023 年9 月为止，还没有非常好的大模型的理论分析和解释，也缺乏对语言模型训练数据的严格说明和定义。但是，大多数研究人员都普遍认为训练数据是影响大语言模型效果以及样本泛化能力的关键因素之一。从此前的研究来看，预训练数据需要涵盖各种类型，包括网络数据、图书、论文、百科和社交媒体等，还需要覆盖尽可能多的领域、语言、文化和视角，从而提高大语言模型的泛化能力和适应性。本文将介绍当前常见的大语言模型训练数据的来源、处理方法、预训练数据对大语言模型影响的分析以及常见开源数据集合等。

欢马劈雪 2023-12-19 15:00:08 2023-12-19 03:00:08

大语言模型，训练，数据，方法
深入解析LLaMA如何改进Transformer的底层结构

大语言模型结构当前绝大多数大语言模型结构都采用了类似GPT 架构，使用基于Transformer 架构构造的仅由解码器组成的网络结构，采用自回归的方式构建语言模型。但是在位置编码、层归一化位置以及激活函数等细节上各有不同。上篇文章介绍了GPT-3 模型的训练过程，包括模型架构、训练数据组成、训练过程以及评估方法。

欢马劈雪 2023-12-19 13:45:33 2023-12-19 01:45:33

LLaMA，改进， Transformer，底层，结构
谈谈Cookie、Session、Token作用和区别

Cookie、Session、Token 这三者是不同发展阶段的产物，并且各有优缺点，三者也没有明显的对立关系，反而常常结伴出现，这也是容易被混淆的原因。

欢马劈雪 2023-12-19 13:51:08 2023-12-19 01:44:01

Cookie， Session， Token，作用，区别
JS 操作页面选区和光标

在 web 开发中，有时不可避免会和“选区”与“光标”打交道，比如选中高亮、选中出现工具栏、手动控制光标位置等。选区就是用鼠标选中的那一部分，通常是蓝色

欢马劈雪 2023-12-08 11:42:55 2023-12-08 11:42:55

Web， JS，选区，光标
分布式锁实现原理与最佳实践

直接在内存中判断是否有库存，计算扣减之后的值更新数据库，并发的情况下会导致相互覆盖发生：

欢马劈雪 2023-12-07 13:59:04 2023-12-07 01:59:04

分布式锁，实现，原理，最佳实践
浅析大语言模型底层架构之一Transfomer

语言模型目标是建模自然语言的概率分布，在自然语言处理研究中具有重要的作用，是自然语言处理基础任务之一。大量的研究从n 元语言模型（n-gram Language Models）、神经语言模型（Neural Language Models，NLM）以及预训练语言模型（Pre-trained Language Models，PLM）等不同角度开展了系列工作。这些研究在不同阶段都对自然语言处理任务有着重要作用。随着基于Transformer 各类语言模型的发展以及预训练微调范式在自然语言处理各类任务中取得突破性进展，从2020 年OpenAI 发布GPT-3 开始，大语言模型研究也逐渐深入。虽然大语言模型的参数量巨大，通过有监督微调和强化学习能够完成非常多的任务，但是其基础理论也仍然离不开对语言的建模。

欢马劈雪 2023-12-07 13:56:57 2023-12-07 01:56:57

大语言模型，底层架构， Transfomer
JAVA日志的性能实践与原理解释

程序记录日志的过程，就是将需要记录的内容写入到磁盘文件中的过程。与生活的物流场景类似，好比是一车货物通过一套运输体系运送至目的地的过程，然而在这套物流体系中，我们往往不需要自己完成整套打包、上车、运输、卸货等全套流程，只需要将包打好之后交由专业的物流公司即可。对于我们今天所要描述的日志场景而言，日志内容是需要运送的货物，日志框架就是物流公司，而目的地就是磁盘上的文件（或其他日志收集服务器）。

欢马劈雪 2023-12-07 13:52:08 2023-12-07 01:52:08

JAVA，日志，性能，实践，原理，解释
谷歌Gemini发布，为迄今规模最大、能力最强多模态大模型，多方位碾压对手，手机直接可用

丢出一枚“延迟发布”烟雾弹后，谷歌出其不意，在深夜憋了个大的，于当地时间12月6日提前发布了自研大模型Gemini——ChatGPT的最有力竞争对手。

欢马劈雪 2023-12-07 13:48:00 2023-12-07 01:47:46

谷歌， Gemini，多模态，大模型，手机
OpenAI新开放了这些好用的API功能

带有视觉能力的 GPT-4，有时也称为 GPT-4V 或 gpt-4-vision-preview ，在 API 中，允许模型接收图像并回答有关它们的问题。该模型最擅长回答有关图像中存在的内容的一般问题。虽然它确实了解图像中对象之间的关系，但它尚未优化以回答有关图像中某些对象位置的详细问题。例如，你可以问它汽车是什么颜色的，或者根据冰箱里的东西，晚餐的一些想法可能是什么，但如果你给它看一个房间的图像，并问它椅子在哪里，它可能无法正确回答问题。

欢马劈雪 2023-11-28 18:02:45 2023-11-28 06:02:45

OpenAI， API，功能
谈谈代码的可读性

上图代码中，你觉得左边实现更好，还是右边的实现更好？你的代码是更像左边还是更接近右边？首先说下，这个例子不是很好，但是我觉得又挺好，因为这个例子不够极端，但是针对这样的case去阐述观点，可以更加明确；我的观点，也是本文接下去的观点，是倾向于右边，当然在这个例子中，可能大家会觉得右边的代码有点没有必要的复杂化了，左边的代码非常简洁明晰，这里说下观点背后的思考：

欢马劈雪 2023-11-28 18:00:17 2023-11-28 06:00:17

代码，可读性
Java里需要更新几个知识点

在JDK9之前，String内部是通过char数组（char[]）来保存字符数据的。但在JDK9以后，String的实现内部改为使用byte数组（byte[]）。这样做的主要原因是为了节省内存空间，因为对于大量的拉丁文系列字符（如英文、数字、常见的标点符号等），使用byte数组存储比使用char数组可以节省一半的空间。

欢马劈雪 2023-11-28 17:58:53 2023-11-28 05:58:53

Java，更新，知识点
从浏览器原理出发聊聊Chrome插件

单进程浏览器是指浏览器的所有功能模块都是运行在同一个进程里，这些模块包含了网络、插件、JavaScript 运行环境、渲染引擎和页面等。在 2007 年之前，市面上浏览器都是单进程的。

欢马劈雪 2023-11-28 17:43:36 2023-11-28 05:43:36

浏览器，原理， Chrome，插件
详解数据库SQL中的三个语句：DROP、TRUNCATE 、DELETE

在数据库中，SQL作为一种常用的数据库编程语言，扮演着至关重要的角色。SQL不仅可以用于创建、修改和查询数据库，还可以通过DROP、DELETE和TRUNCATE等语句来删除数据。这些语句是SQL语言中的最常用的命令，且它们有着不同的含义和使用场景。本文以GaussDB数据库为平台，将详细介绍SQL中DROP、TRUNCATE和DELETE等语句的含义、使用场景以及注意事项，帮助读者更好地理解和掌握这些常用的数据库操作命令。

欢马劈雪 2023-11-28 17:42:21 2023-11-28 05:42:21

数据库， SQL，删除，语句， DROP， TRUNCATE， DELETE

个人简介

欢马劈雪
纵马驰骋迎雪而行
获得 162032 积分
https://nowjava.com/creator/10001

欢马劈雪

浅析数据对大语言模型的影响

Java 多线程概念汇总

详解 Mybatis 查询结果返回 Map、List集合

Spring Boot 3.2.0 新特性

谷歌大语言模型 Gemini 解读和实践

详解 Java 接口限流

Java进行数据库操作的并发控制的2种方法

大语言模型训练数据常见的4种处理方法

深入解析LLaMA如何改进Transformer的底层结构

谈谈Cookie、Session、Token作用和区别

JS 操作页面选区和光标

分布式锁实现原理与最佳实践

浅析大语言模型底层架构之一Transfomer

JAVA日志的性能实践与原理解释

谷歌Gemini发布，为迄今规模最大、能力最强多模态大模型，多方位碾压对手，手机直接可用

OpenAI新开放了这些好用的API功能

谈谈代码的可读性

Java里需要更新几个知识点

从浏览器原理出发聊聊Chrome插件

详解数据库SQL中的三个语句：DROP、TRUNCATE 、DELETE

个人简介

欢马劈雪

纵马驰骋迎雪而行

获得 162032 积分

https://nowjava.com/creator/10001

热门标签

社区

关于

欢马劈雪

浅析数据对大语言模型的影响

Java 多线程概念汇总

详解 Mybatis 查询结果返回 Map、List集合

Spring Boot 3.2.0 新特性

谷歌大语言模型 Gemini 解读和实践

详解 Java 接口限流

Java进行数据库操作的并发控制的2种方法

大语言模型训练数据常见的4种处理方法

深入解析LLaMA如何改进Transformer的底层结构

谈谈Cookie、Session、Token作用和区别

JS 操作页面选区和光标

分布式锁实现原理与最佳实践

浅析大语言模型底层架构之一Transfomer

JAVA日志的性能实践与原理解释

谷歌Gemini发布，为迄今规模最大、能力最强多模态大模型，多方位碾压对手， 手机直接可用

OpenAI新开放了这些好用的API功能

谈谈代码的可读性

Java里需要更新几个知识点

从浏览器原理出发聊聊Chrome插件

详解数据库SQL中的三个语句：DROP、TRUNCATE 、DELETE

欢马劈雪

纵马驰骋迎雪而行

获得 162032 积分

https://nowjava.com/creator/10001

社区

关于

谷歌Gemini发布，为迄今规模最大、能力最强多模态大模型，多方位碾压对手，手机直接可用