Name		Name	Last commit message	Last commit date
parent directory ..
templates		templates
utils		utils
README.md		README.md
finetune.py		finetune.py
requirements.txt		requirements.txt
train.sh		train.sh

README.md

Model Training for Reaction Extractor

Local Setup

Install dependencies

pip install -r requirements.txt

Data Preparation

Please download the data from this link and unzip it to the current folder.

Training (`finetune.py`)

We train Llama-2 and LoRA based models for the reaction extractor with the following usage:

export CUDA_VISIBLE_DEVICES=0,1
# export TRANSFORMERS_CACHE=/path/to/cache

WORLD_SIZE=2  torchrun --nproc_per_node=2 --master_port=12345 finetune.py \
    --base_model "meta-llama/Llama-2-7b-hf" \
    --num_epochs 10 \
    --cutoff_len 2048 \
    --data_path "chem_data/train_processed.jsonl" \
    --output_dir "extractor-7b" \
    --lora_target_modules "[q_proj,k_proj,v_proj,o_proj,up_proj,down_proj,gate_proj,embed_tokens,lm_head]" \
    --lora_r 16 \
    --micro_batch_size 16 \
    --batch_size 64 \
    --learning_rate 3e-4 \
    --val_set_size 0 \
    --use_chat_prompt \
    --train_on_inputs False \

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

training

training

README.md

Model Training for Reaction Extractor

Local Setup

Data Preparation

Training (`finetune.py`)

Files

training

Directory actions

More options

Directory actions

More options

Latest commit

History

training

Folders and files

parent directory

README.md

Model Training for Reaction Extractor

Local Setup

Data Preparation

Training (finetune.py)

Training (`finetune.py`)