前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Qwen2大模型微调入门实战-命名实体识别(NER)任务

Qwen2大模型微调入门实战-命名实体识别(NER)任务

原创
作者头像
用户9029617
修改于 2024-06-21 07:12:32
修改于 2024-06-21 07:12:32
1.1K00
代码可运行
举报
运行总次数:0
代码可运行

Qwen2微调-命名实体识别

以Qwen2作为基座大模型,通过指令微调的方式做高精度的命名实体识别(NER),是学习入门LLM微调、建立大模型认知的非常好的任务。

使用LoRA方法训练,1.5B模型对显存要求不高,10GB左右就可以跑。

在本文中,我们会使用 Qwen2-1.5b-Instruct 模型在 中文NER 数据集上做指令微调训练,同时使用SwanLab监控训练过程、评估模型效果。

知识点1:什么是指令微调?

大模型指令微调(Instruction Tuning)是一种针对大型预训练语言模型的微调技术,其核心目的是增强模型理解和执行特定指令的能力,使模型能够根据用户提供的自然语言指令准确、恰当地生成相应的输出或执行相关任务。

指令微调特别关注于提升模型在遵循指令方面的一致性和准确性,从而拓宽模型在各种应用场景中的泛化能力和实用性。

在实际应用中,我的理解是,指令微调更多把LLM看作一个更智能、更强大的传统NLP模型(比如Bert),来实现更高精度的NLP任务。所以这类任务的应用场景覆盖了以往NLP模型的场景,甚至很多团队拿它来标注互联网数据

知识点2:什么是命名实体识别?

命名实体识别 (NER) 是一种NLP技术,主要用于识别和分类文本中提到的重要信息(关键词)。这些实体可以是人名、地名、机构名、日期、时间、货币值等等。 NER 的目标是将文本中的非结构化信息转换为结构化信息,以便计算机能够更容易地理解和处理。

NER 也是一项非常实用的技术,包括在互联网数据标注、搜索引擎、推荐系统知识图谱、医疗保健等诸多领域有广泛应用。

1.环境安装

本案例基于Python>=3.8,请在您的计算机上安装好Python,并且有一张英伟达显卡(显存要求并不高,大概10GB左右就可以跑)。

我们需要安装以下这几个Python库,在这之前,请确保你的环境内已安装好了pytorch以及CUDA

代码语言:txt
AI代码解释
复制
swanlab
modelscope
transformers
datasets
peft
accelerate
pandas

一键安装命令:

代码语言:bash
AI代码解释
复制
pip install swanlab modelscope transformers datasets peft pandas accelerate

本案例测试于modelscope==1.14.0、transformers==4.41.2、datasets==2.18.0、peft==0.11.1、accelerate==0.30.1、swanlab==0.3.11

2.准备数据集

本案例使用的是HuggingFace上的chinese_ner_sft数据集,该数据集主要被用于训练命名实体识别模型。

chinese_ner_sft由不同来源、不同类型的几十万条数据组成,应该是我见过收录最齐全的中文NER数据集。

这次训练我们不需要用到它的全部数据,只取其中的CCFBDCI数据集(中文命名实体识别算法鲁棒性评测数据集)进行训练,该数据集包含LOC(地点)、GPE(地理)、ORG(组织)和PER(人名)四种实体类型标注,每条数据的例子如下:

代码语言:json
AI代码解释
复制
{
  "text": "今天亚太经合组织第十二届部长级会议在这里开幕,中国外交部部长唐家璇、外经贸部部长石广生出席了会议。",
  "entities": [
    {
        "start_idx": 23,
        "end_idx": 25,
        "entity_text": "中国",
        "entity_label": "GPE",
        "entity_names": ["地缘政治实体", "政治实体", "地理实体", "社会实体"]},
        {
            "start_idx": 25,
            "end_idx": 28,
            "entity_text": "外交部",
            "entity_label": "ORG",
            "entity_names": ["组织", "团体", "机构"]
        },
        {
            "start_idx": 30,
            "end_idx": 33,
            "entity_text": "唐家璇",
            "entity_label": "PER",
            "entity_names": ["人名", "姓名"]
        }, 
        ...
    ],
"data_source": "CCFBDCI"
}

其中text是输入的文本,entities是文本抽取出的实体。我们的目标是希望微调后的大模型能够根据由text组成的提示词,预测出一个json格式的实体信息:

代码语言:txt
AI代码解释
复制
输入:今天亚太经合组织第十二届部长级会议在这里开幕,中国外交部部长唐家璇、外经贸部部长石广生出席了会议。

大模型输出:{"entity_text":"中国", "entity_label":"组织"}{"entity_text":"唐家璇", "entity_label":"人名"}...

现在我们将数据集下载到本地目录。下载方式是前往chinese_ner_sft - huggingface下载ccfbdci.jsonl到项目根目录下即可:

3. 加载模型

这里我们使用modelscope下载Qwen2-1.5B-Instruct模型(modelscope在国内,所以直接用下面的代码自动下载即可,不用担心速度和稳定性问题),然后把它加载到Transformers中进行训练:

代码语言:python
代码运行次数:0
运行
AI代码解释
复制
from modelscope import snapshot_download, AutoTokenizer
from transformers import AutoModelForCausalLM, TrainingArguments, Trainer, DataCollatorForSeq2Seq

model_id = "qwen/Qwen2-1.5B-Instruct"    
model_dir = "./qwen/Qwen2-1___5B-Instruct"

# 在modelscope上下载Qwen模型到本地目录下
model_dir = snapshot_download(model_id, cache_dir="./", revision="master")

# Transformers加载模型权重
tokenizer = AutoTokenizer.from_pretrained(model_dir, use_fast=False, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(model_dir, device_map="auto", torch_dtype=torch.bfloat16)
model.enable_input_require_grads()  # 开启梯度检查点时,要执行该方法

4. 配置训练可视化工具

我们使用SwanLab来监控整个训练过程,并评估最终的模型效果。

这里直接使用SwanLab和Transformers的集成来实现:

代码语言:python
代码运行次数:0
运行
AI代码解释
复制
from swanlab.integration.huggingface import SwanLabCallback

swanlab_callback = SwanLabCallback(...)

trainer = Trainer(
    ...
    callbacks=[swanlab_callback],
)

如果你是第一次使用SwanLab,那么还需要去https://swanlab.cn上注册一个账号,在用户设置页面复制你的API Key,然后在训练开始时粘贴进去即可:

5. 完整代码

开始训练时的目录结构:

代码语言:txt
AI代码解释
复制
|--- train.py
|--- ccfbdci.jsonl

train.py:

代码语言:python
代码运行次数:0
运行
AI代码解释
复制
import json
import pandas as pd
import torch
from datasets import Dataset
from modelscope import snapshot_download, AutoTokenizer
from swanlab.integration.huggingface import SwanLabCallback
from peft import LoraConfig, TaskType, get_peft_model
from transformers import AutoModelForCausalLM, TrainingArguments, Trainer, DataCollatorForSeq2Seq
import os
import swanlab


def dataset_jsonl_transfer(origin_path, new_path):
    """
    将原始数据集转换为大模型微调所需数据格式的新数据集
    """
    messages = []

    # 读取旧的JSONL文件
    with open(origin_path, "r") as file:
        for line in file:
            # 解析每一行的json数据
            data = json.loads(line)
            input_text = data["text"]
            entities = data["entities"]
            match_names = ["地点", "人名", "地理实体", "组织"]
            
            entity_sentence = ""
            for entity in entities:
                entity_json = dict(entity)
                entity_text = entity_json["entity_text"]
                entity_names = entity_json["entity_names"]
                for name in entity_names:
                    if name in match_names:
                        entity_label = name
                        break
                
                entity_sentence += f"""{{"entity_text": "{entity_text}", "entity_label": "{entity_label}"}}"""
            
            if entity_sentence == "":
                entity_sentence = "没有找到任何实体"
            
            message = {
                "instruction": """你是一个文本实体识别领域的专家,你需要从给定的句子中提取 地点; 人名; 地理实体; 组织 实体. 以 json 格式输出, 如 {"entity_text": "南京", "entity_label": "地理实体"} 注意: 1. 输出的每一行都必须是正确的 json 字符串. 2. 找不到任何实体时, 输出"没有找到任何实体". """,
                "input": f"文本:{input_text}",
                "output": entity_sentence,
            }
            
            messages.append(message)

    # 保存重构后的JSONL文件
    with open(new_path, "w", encoding="utf-8") as file:
        for message in messages:
            file.write(json.dumps(message, ensure_ascii=False) + "\n")
            
            
def process_func(example):
    """
    将数据集进行预处理
    """

    MAX_LENGTH = 384 
    input_ids, attention_mask, labels = [], [], []
    system_prompt = """你是一个文本实体识别领域的专家,你需要从给定的句子中提取 地点; 人名; 地理实体; 组织 实体. 以 json 格式输出, 如 {"entity_text": "南京", "entity_label": "地理实体"} 注意: 1. 输出的每一行都必须是正确的 json 字符串. 2. 找不到任何实体时, 输出"没有找到任何实体"."""
    
    instruction = tokenizer(
        f"<|im_start|>system\n{system_prompt}<|im_end|>\n<|im_start|>user\n{example['input']}<|im_end|>\n<|im_start|>assistant\n",
        add_special_tokens=False,
    )
    response = tokenizer(f"{example['output']}", add_special_tokens=False)
    input_ids = instruction["input_ids"] + response["input_ids"] + [tokenizer.pad_token_id]
    attention_mask = (
        instruction["attention_mask"] + response["attention_mask"] + [1]
    )
    labels = [-100] * len(instruction["input_ids"]) + response["input_ids"] + [tokenizer.pad_token_id]
    if len(input_ids) > MAX_LENGTH:  # 做一个截断
        input_ids = input_ids[:MAX_LENGTH]
        attention_mask = attention_mask[:MAX_LENGTH]
        labels = labels[:MAX_LENGTH]
    return {"input_ids": input_ids, "attention_mask": attention_mask, "labels": labels}   


def predict(messages, model, tokenizer):
    device = "cuda"
    text = tokenizer.apply_chat_template(
        messages,
        tokenize=False,
        add_generation_prompt=True
    )
    model_inputs = tokenizer([text], return_tensors="pt").to(device)

    generated_ids = model.generate(
        model_inputs.input_ids,
        max_new_tokens=512
    )
    generated_ids = [
        output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
    ]
    
    response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
    
    print(response)
     
    return response


model_id = "qwen/Qwen2-1.5B-Instruct"    
model_dir = "./qwen/Qwen2-1___5B-Instruct"

# 在modelscope上下载Qwen模型到本地目录下
model_dir = snapshot_download(model_id, cache_dir="./", revision="master")

# Transformers加载模型权重
tokenizer = AutoTokenizer.from_pretrained(model_dir, use_fast=False, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(model_dir, device_map="auto", torch_dtype=torch.bfloat16)
model.enable_input_require_grads()  # 开启梯度检查点时,要执行该方法

# 加载、处理数据集和测试集
train_dataset_path = "ccfbdci.jsonl"
train_jsonl_new_path = "ccf_train.jsonl"

if not os.path.exists(train_jsonl_new_path):
    dataset_jsonl_transfer(train_dataset_path, train_jsonl_new_path)

# 得到训练集
total_df = pd.read_json(train_jsonl_new_path, lines=True)
train_df = total_df[int(len(total_df) * 0.1):]
train_ds = Dataset.from_pandas(train_df)
train_dataset = train_ds.map(process_func, remove_columns=train_ds.column_names)


config = LoraConfig(
    task_type=TaskType.CAUSAL_LM,
    target_modules=["q_proj", "k_proj", "v_proj", "o_proj", "gate_proj", "up_proj", "down_proj"],
    inference_mode=False,  # 训练模式
    r=8,  # Lora 秩
    lora_alpha=32,  # Lora alaph,具体作用参见 Lora 原理
    lora_dropout=0.1,  # Dropout 比例
)

model = get_peft_model(model, config)

args = TrainingArguments(
    output_dir="./output/Qwen2-NER",
    per_device_train_batch_size=4,
    per_device_eval_batch_size=4,
    gradient_accumulation_steps=4,
    logging_steps=10,
    num_train_epochs=2,
    save_steps=100,
    learning_rate=1e-4,
    save_on_each_node=True,
    gradient_checkpointing=True,
    report_to="none",
)

swanlab_callback = SwanLabCallback(
    project="Qwen2-NER-fintune",
    experiment_name="Qwen2-1.5B-Instruct",
    description="使用通义千问Qwen2-1.5B-Instruct模型在NER数据集上微调,实现关键实体识别任务。",
    config={
        "model": model_id,
        "model_dir": model_dir,
        "dataset": "qgyd2021/chinese_ner_sft",
    },
)

trainer = Trainer(
    model=model,
    args=args,
    train_dataset=train_dataset,
    data_collator=DataCollatorForSeq2Seq(tokenizer=tokenizer, padding=True),
    callbacks=[swanlab_callback],
)

trainer.train()

# 用测试集的随机20条,测试模型
# 得到测试集
test_df = total_df[:int(len(total_df) * 0.1)].sample(n=20)

test_text_list = []
for index, row in test_df.iterrows():
    instruction = row['instruction']
    input_value = row['input']
    
    messages = [
        {"role": "system", "content": f"{instruction}"},
        {"role": "user", "content": f"{input_value}"}
    ]

    response = predict(messages, model, tokenizer)
    messages.append({"role": "assistant", "content": f"{response}"})
    result_text = f"{messages[0]}\n\n{messages[1]}\n\n{messages[2]}"
    test_text_list.append(swanlab.Text(result_text, caption=response))
    
swanlab.log({"Prediction": test_text_list})
swanlab.finish()

看到下面的进度条即代表训练开始:

5.训练结果演示

SwanLab上查看最终的训练结果:

可以看到在2个epoch之后,微调后的qwen2的loss降低到了不错的水平——当然对于大模型来说,真正的效果评估还得看主观效果。

可以看到在一些测试样例上,微调后的qwen2能够给出准确的实体抽取结果:

至此,你已经完成了qwen2指令微调的训练!

6. 推理训练好的模型

训好的模型默认被保存在./output/Qwen2-NER文件夹下。

推理模型的代码如下:

代码语言:python
代码运行次数:0
运行
AI代码解释
复制
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
from peft import PeftModel

def predict(messages, model, tokenizer):
    device = "cuda"

    text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
    model_inputs = tokenizer([text], return_tensors="pt").to(device)

    generated_ids = model.generate(model_inputs.input_ids, max_new_tokens=512)
    generated_ids = [output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)]
    response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

    return response


# 加载原下载路径的tokenizer和model
tokenizer = AutoTokenizer.from_pretrained("./qwen/Qwen2-1___5B-Instruct/", use_fast=False, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("./qwen/Qwen2-1___5B-Instruct/", device_map="auto", torch_dtype=torch.bfloat16)

# 加载训练好的Lora模型,将下面的[checkpoint-XXX]替换为实际的checkpoint文件名名称
model = PeftModel.from_pretrained(model, model_id="./output/Qwen2-NER/checkpoint-1700")

input_text = "西安电子科技大学的陈志明爱上了隔壁西北工业大学苏春红,他们约定好毕业后去中国的苏州定居。"
test_texts = {
    "instruction": """你是一个文本实体识别领域的专家,你需要从给定的句子中提取 地点; 人名; 地理实体; 组织 实体. 以 json 格式输出, 如; {"entity_text": "南京", "entity_label": "地理实体"} 注意: 1. 输出的每一行都必须是正确的 json 字符串. 2. 找不到任何实体时, 输出"没有找到任何实体". """,
    "input": f"文本:{input_text}"
}

instruction = test_texts['instruction']
input_value = test_texts['input']

messages = [
    {"role": "system", "content": f"{instruction}"},
    {"role": "user", "content": f"{input_value}"}
]

response = predict(messages, model, tokenizer)
print(response)

输出结果为:

代码语言:json
AI代码解释
复制
{"entity_text": "西安电子科技大学", "entity_label": "组织"}
{"entity_text": "陈志明", "entity_label": "人名"}
{"entity_text": "西北工业大学", "entity_label": "组织"}
{"entity_text": "苏春红", "entity_label": "人名"}
{"entity_text": "中国", "entity_label": "地理实体"}
{"entity_text": "苏州", "entity_label": "地理实体"}

相关链接

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
有人说:机器学习应用量化投资没啥用,给你看看有用的!
想必很多人还不知道Numerai吧,有志于从事量化方向的同学可以重点关注下。Numerai 是一家初创公司,以举办专业数据锦标赛(类似kaggle)为其对冲基金寻找最佳交易策略而闻名。同时,它能将世界各地数据学家的股市预测模型“众包”出去。同时,Numerai创建了自己的加密货币,名为Numeraire(NMR)。近日,Numerai通过ICO完成了300万美元融资,Placeholder、Union Square等公司参投。
量化投资与机器学习微信公众号
2020/09/26
1.7K0
【技术分享】机器学习在量化交易方向的应用—基于神经网络的多因子选股策略
量化交易策略无非三点:择时、选股、仓控。择时为短期套利交易策略,选股为中长期交易策略,目标是在中长期跑赢指数、获取市场超额收益率alpha。多因子选股的关键是找到寻找因子与股票收益率之间的相关性,即对收益率预测能力强的因子。一般多采用如下步骤:
腾讯云TI平台
2019/11/19
7.1K0
金融科技&大数据产品推荐:量子金服投研管理平台
金融科技&大数据产品推荐:量子金服投研管理平台
数据猿
2018/04/24
1.5K0
金融科技&大数据产品推荐:量子金服投研管理平台
股票、基金买啥啥跌?大数据来给你支招!
说到基金股票,不仅仅是金融小白会一头雾水,就连资深股民都难逃买啥啥就跌的痛苦。近期数据侠实验室,DT君邀请到了Merkle高级数据分析师周秀丽、秦溱,自称金融小白的她们将会从大数据这一独特的角度带你走进股票和基金。
DT数据侠
2018/08/08
6520
股票、基金买啥啥跌?大数据来给你支招!
想当Quant?呵呵~
最近,很多人问我们关于量化求职这件事。公众号觉得有必要把之前的一些总结再给大家看看。QuantNet如期公布了2020全美最佳金融工程(MFE)专业的排名。大家可曾知道,Quantnet的MFE专业排名堪称:
量化投资与机器学习微信公众号
2020/09/26
2.3K0
来!新闻流与股价跳跃、图数据应用综述、机器学习与有效前沿
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。 资产价格的跳跃已经被认为是许多金融和经济决策的重要因素,例如投资组合重新平衡、衍生品定价以及风险度量和管理。股票价格的大幅波动可能与市场上重要的信息流(如超预期收益)有关,这一直观的想法启发了许多与股票收益跳跃建模相关的
量化投资与机器学习微信公众号
2022/09/08
3960
来!新闻流与股价跳跃、图数据应用综述、机器学习与有效前沿
【金猿案例展】某基金管理公司:智能量化投资平台建设
本案例由九章云极投递并参与评选,数据猿独家全网首发;更多关于【金猿榜/奖·2019征集评选】的相关信息,请点击这里了解详情丨征案例、征文章、征产品=评企业、评人物、评产品。
数据猿
2019/12/26
8090
干货分享 | 千人专家朱晓天:大数据与人工智能在金融领域的应用
12月9日,以“数智金融-大数据的创新与应用”为主题的第二届中欧大数据金融论坛在深圳举行,国家千人计划金融领域特聘专家、北京大学汇丰商学院金融实验室主任朱晓天教授,国家千人计划金融领域特聘专家、平安科
小莹莹
2018/04/20
1.8K0
干货分享 | 千人专家朱晓天:大数据与人工智能在金融领域的应用
【全网首发】机器学习该如何应用到量化投资系列(三)
有一些单纯搞计算机、数学或者物理的人会问,究竟怎么样应用 ML 在量化投资。他们能做些什么自己擅长的工作。虽然在很多平台或者自媒体有谈及有关的问题,但是不够全面和完整。从今日起,量化投资与机器学习公众号将推出一个系列【机器学习该如何应用到】。今日的推文,是编辑部人员对国内的所有券商金工团队做的机器学习的研究报告做了一个系统性的整理。希望大家有所收获。 获取本推文所有研报请看文章末端 系列文章(点击即可查看) 机器学习该如何应用到量化投资系列(一) 机器学习该如何应用到量化投资系列(二) 2010年08月1
量化投资与机器学习微信公众号
2018/01/29
2.5K0
A股市场机器学习多因子模型实证
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。 量化投资与机器学习公众号 独家解读 量化投资与机器学公众号  QIML Insight——深度研读系列 是公众号全力打造的一档深度、前沿、高水准栏目。 公众号遴选了各大期刊前沿论文,按照理解和提炼的方式为读者呈
量化投资与机器学习微信公众号
2022/09/08
1.2K0
A股市场机器学习多因子模型实证
曦禾基金 | 量化多岗位招聘(社招+实习)
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者。 公司介绍 曦禾基金(登记编号:P1072528)是一家专注于量化交易领域的私募基金公司,公司量化资管团队组建于2018年,团队成员均毕业于海内外一流名校,成员专业背景涵盖金融、数学、计算机等方向,赋能公司强大数理建模能力和系统开发运维能力。公司团队管理的云开见月系列产品在各类全国性比赛中名列前茅,数次载誉而归,稳健的
量化投资与机器学习微信公众号
2022/05/25
6300
曦禾基金 | 量化多岗位招聘(社招+实习)
白鹭女掌门张晨樱:打造反脆弱的量化多策略盈利武器
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,连续2年被腾讯云+社区评选为“年度最佳作者”。 前言 伴随股票市场的风格切换以及商品市场的极端波动,量化产品会在一定程度出现部分回撤,这也再次提醒我们多资产、多策略配置的重要性。然而,对于管理人来说,想要真正做好多策略并非易事,也远不止将几个策略组合在一起这么简单,在策略研发、人才、IT方面都对管理人提出了更高的要求。
量化投资与机器学习微信公众号
2022/03/03
1.2K0
思晔投资 | 量化多岗位招聘(校招+实习)
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。 公司介绍 上海思晔投资管理有限公司(简称“思晔投资”)成立于2013年5月,总部位于中国上海。作为国内多策略私募证券投资基金的先行者,思晔投资自成立以来坚持投研驱动公司发展的道路,专注于中国市场股票、债券、商品以及前沿衍
量化投资与机器学习微信公众号
2022/03/10
7650
近期因子研究论文推荐
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。 Combining Factors Christoph Reschenhofer (Vienna University of Economics and Business) / July 2022 学术文献主要通过组合收益
量化投资与机器学习微信公众号
2022/08/26
6560
近期因子研究论文推荐
百亿私募,星阔投资 | 量化多岗位招聘
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。 公司介绍 星阔投资(Starvast Quant)是一家专注于国内股票量化投资的资产管理公司,(基金业协会登记编号:P1071681),总部设于北京。目前公司资产管理规模100亿元以上,业绩排名行业前列。公司坚持用数量化、
量化投资与机器学习微信公众号
2022/03/21
5960
编程再好也只能当码农?那你肯定不知道AI量化程序员
量化,一个横跨多个学科领域的工作。已经在不同场合,听了无数次的三座大山:较好的数学功底、编程技能、金融知识。
abs_zero
2019/05/05
1.3K0
编程再好也只能当码农?那你肯定不知道AI量化程序员
AQR:机器学习相关论文推荐
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,连续2年被腾讯云+社区评选为“年度最佳作者”。 今天的推荐来自AQR,是关于机器学习论文的推荐。从“实证资产定价”,到“金融领域如何有效的利用机器学习模型”,再到“如何更有效的进行策略测试”等。 一共五篇论文,每篇都是经典,都值得仔细阅读:文末附下载。 Empirical Asset Pricing via Machin
量化投资与机器学习微信公众号
2022/03/03
1K0
【案例】国信证券——人工智能在量化投资中的应用
数据猿导读 量化金融交易和金融大数据可谓是天作之合——巨量的、多种类相关的、实时高速的、包含丰富显性和隐性价值的数据,给传统意义上纯数字的量化交易带来了深层次的提高。 本篇案例为数据猿推出的大型“金融
数据猿
2018/04/24
2.4K0
【案例】国信证券——人工智能在量化投资中的应用
白鹭资管 | 量化多岗位招聘(社招+实习)
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。 公司介绍 浙江白鹭资产管理股份有限公司(简称:白鹭资管)是一家专注于二级市场、依靠数学和计算机科学进行量化投资与交易的对冲基金。我们致力于打造兼具全球视野和本土智慧的一流投资团队,成为全球顶尖的量化多策略对冲基金。公司于
量化投资与机器学习微信公众号
2022/03/25
1.1K0
QIML Insight | 基于两阶段机器学习模型的因子择时方法
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,曾荣获AMMA优秀品牌力、优秀洞察力大奖,连续4年被腾讯云+社区评选为“年度最佳作者”。 量化投资与机器学习公众号 独家解读 量化投资与机器学公众号 QIML Insight——深度研读系列 是公众号全力打造的一档深度、前沿、高水准栏目。
量化投资与机器学习微信公众号
2024/01/11
6600
QIML Insight | 基于两阶段机器学习模型的因子择时方法
推荐阅读
相关推荐
有人说:机器学习应用量化投资没啥用,给你看看有用的!
更多 >
LV.1
量化类主流自媒体新媒体运营
目录
  • Qwen2微调-命名实体识别
    • 知识点1:什么是指令微调?
    • 知识点2:什么是命名实体识别?
    • 1.环境安装
    • 2.准备数据集
    • 3. 加载模型
    • 4. 配置训练可视化工具
    • 5. 完整代码
    • 5.训练结果演示
    • 6. 推理训练好的模型
    • 相关链接
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档