%%bash
bash Miniconda3-py39_4.11.0-Linux-x86_64.sh


%%bash
conda create --name Snake python=3.6
conda activate Snake


%%bash
conda install -c bioconda snakemake
conda install -c anaconda graphviz # only necessary for generating a workflow diagram


%%bash
git clone https://github.com/taimontgomery/SnakemakeTutorial.git


%%bash
cd SnakemakeTutorial/


%%bash
ls


'''
Anything embedded within ''' ''' is a comment.

Each rule starts with the keyword "rule" followed by a name, which is usually something descriptive.

After the rule comes a series of directives, indented by 4 spaces or a tab.

Within each directive are paremeters for that directive.

Comments can be included after a "#".
'''
rule cat:
    '''
    Each input and output file is specified as follows:
    '''
    input:
        fin1="seq1.txt", # commas are used to separate items
        fin2="seq2.txt"
    output:
        fout="seq_cat.txt"
    '''
    Within the shell directive, specify the command line code for the task.
    '''
    shell:
        "cat {input.fin1} {input.fin2} >{output.fout}" # variables are called with dot notation referencing
                                                       # the directive and enclosed in "{}"


rule cat:
    input:
        fin1="seq1.txt",
        fin2="seq2.txt"
    output:
        fout="seq_cat.txt"
    shell:
        "cat {input.fin1} {input.fin2} >{output.fout}"


%%bash
echo ATCG >seq1.txt
echo GGCG >seq2.txt


snakemake -s Snakefile_cat

or 

snakemake -s Snakefile


%%bash
less seq_cat.txt


rule map_reads:
    input:
        sample="samples/cond1_rep1.fastq"
    output:
        bam="results/cond1_rep1.bam"
    conda:
        "envs/mapping.yml"
    shell:
        "bowtie2 -x resources/ram1 {input.sample} | samtools view -bS - -o {output.bam}"


samples:
  - cond1_rep1
  - cond1_rep2
  - cond1_rep3
  - cond2_rep1
  - cond2_rep2
  - cond2_rep3


rule all:
    input:
        expand("results/{sample}.bam", sample=config["samples"])


rule map_reads:
    input:
        sample="samples/{sample}.fastq"
    output:
        bam="results/{sample}.bam"
    conda:
        "envs/mapping.yml"
    shell:
        "bowtie2 -x resources/ram1 {input.sample} | samtools view -bS - -o {output.bam}"


rule all:
    input:
        expand("results/{sample}.bam", sample=config["samples"])

rule map_reads:
    input:
        sample="samples/{sample}.fastq"
    output:
        bam="results/{sample}.bam"
    conda:
        "envs/mapping.yml"
    shell:
        "bowtie2 -x resources/ram1 {input.sample} | samtools view -bS - -o {output.bam}"


rule sort_reads:
    input:
        bam_fin="results/{sample}.bam"
    output:
        bam_sorted="results/{sample}.sorted.bam"
    conda:
        "envs/mapping.yml"
    shell:
        "samtools sort {input.bam_fin} -o {output.bam_sorted}"


rule all:
    input:
        expand("results/{sample}.sorted.bam", sample=config["samples"])


rule all:
    input:
        expand("results/{sample}.sorted.bam", sample=config["samples"])

rule map_reads:
    input:
        sample="samples/{sample}.fastq"
    output:
        bam="results/{sample}.bam"
    conda:
        "envs/mapping.yml"
    shell:
        "bowtie2 -x resources/ram1 {input.sample} | samtools view -bS - -o {output.bam}"
        
rule sort_reads:
    input:
        bam_fin="results/{sample}.bam"
    output:
        bam_sorted="results/{sample}.sorted.bam"
    conda:
        "envs/mapping.yml"
    shell:
        "samtools sort {input.bam_fin} -o {output.bam_sorted}"


rule bam_index:
    input:
        sorted_fin="results/{sample}.sorted.bam"
    output:
        bai="results/{sample}.sorted.bam.bai"
    conda:
        "envs/mapping.yml"
    shell:
        "samtools index {input.sorted_fin}"


rule all:
    input:
        expand("results/{sample}.sorted.bam.bai", sample=config["samples"])


genome: "resources/ram1"


samples:
  - cond1_rep1
  - cond1_rep2
  - cond1_rep3
  - cond2_rep1
  - cond2_rep2
  - cond2_rep3

genome: "resources/ram1"


params:
    bowtie_index=config["genome"]


shell:
    "bowtie2 -x {params.bowtie_index} {input.sample} | samtools view -bS - -o {output.bam}"


rule all:
    input:
        expand("results/{sample}.sorted.bam.bai", sample=config["samples"])

rule map_reads:
    input:
        sample="samples/{sample}.fastq"
    output:
        bam="results/{sample}.bam"
    conda:
        "envs/mapping.yml"
    params:
        bowtie_index=config["genome"]
    shell:
        "bowtie2 -x {params.bowtie_index} {input.sample} | samtools view -bS - -o {output.bam}"
        
rule sort_reads:
    input:
        bam_fin="results/{sample}.bam"
    output:
        bam_sorted="results/{sample}.sorted.bam"
    conda:
        "envs/mapping.yml"
    shell:
        "samtools sort {input.bam_fin} -o {output.bam_sorted}"

rule bam_index:
    input:
        sorted_fin="results/{sample}.sorted.bam"
    output:
        bai="results/{sample}.sorted.bam.bai"
    conda:
        "envs/mapping.yml"
    shell:
        "samtools index {input.sorted_fin}"


log:
    "results/{sample}.log"


shell:
    "bowtie2 -x {params.bowtie_index} {input.sample} 2> {log} | samtools view -bS - -o {output.bam}"


rule all:
    input:
        expand("results/{sample}.sorted.bam.bai", sample=config["samples"])

rule map_reads:
    input:
        sample="samples/{sample}.fastq"
    output:
        bam="results/{sample}.bam"
    conda:
        "envs/mapping.yml"
    params:
        bowtie_index=config["genome"]
    log:
        "results/{sample}.log"
    shell:
        "bowtie2 -x {params.bowtie_index} {input.sample} 2> {log} | samtools view -bS - -o {output.bam}"
        
rule sort_reads:
    input:
        bam_fin="results/{sample}.bam"
    output:
        bam_sorted="results/{sample}.sorted.bam"
    conda:
        "envs/mapping.yml"
    shell:
        "samtools sort {input.bam_fin} -o {output.bam_sorted}"

rule bam_index:
    input:
        sorted_fin="results/{sample}.sorted.bam"
    output:
        bai="results/{sample}.sorted.bam.bai"
    conda:
        "envs/mapping.yml"
    shell:
        "samtools index {input.sorted_fin}"


snakemake --configfile config.yml --dag | dot -Tpdf > dag.pdf


snakemake -n --use-conda --configfile config.yml


snakemake --use-conda --configfile config.yml

Snakemake¶

Getting Started in Snakemake

Install Snakemake¶

Clone a Snakemake Template from GitHub¶

Writing Snakemake Workflows

Part 1. A basic introduction using cat¶

Workflow Rules¶

Part 2. A read-mapping workflow.¶

Our pipeline will have 3 computational steps that we will write a workflow to accomplish:¶