diff --git a/index.html b/index.html
index 031bd7f..ce064b8 100644
--- a/index.html
+++ b/index.html
@@ -347,27 +347,27 @@
     <ul class="md-nav__list" data-md-component="toc" data-md-scrollfix>
       
         <li class="md-nav__item">
-  <a href="#demo" class="md-nav__link">
+  <a href="#openai-integration" class="md-nav__link">
     <span class="md-ellipsis">
-      Demo
+      OpenAI integration
     </span>
   </a>
   
 </li>
       
         <li class="md-nav__item">
-  <a href="#documentation" class="md-nav__link">
+  <a href="#trying-out-logos" class="md-nav__link">
     <span class="md-ellipsis">
-      Documentation
+      Trying out LOGos
     </span>
   </a>
   
 </li>
       
         <li class="md-nav__item">
-  <a href="#openai-integration" class="md-nav__link">
+  <a href="#reproducing-our-evaluation" class="md-nav__link">
     <span class="md-ellipsis">
-      OpenAI integration
+      Reproducing our evaluation
     </span>
   </a>
   
@@ -1067,27 +1067,27 @@
     <ul class="md-nav__list" data-md-component="toc" data-md-scrollfix>
       
         <li class="md-nav__item">
-  <a href="#demo" class="md-nav__link">
+  <a href="#openai-integration" class="md-nav__link">
     <span class="md-ellipsis">
-      Demo
+      OpenAI integration
     </span>
   </a>
   
 </li>
       
         <li class="md-nav__item">
-  <a href="#documentation" class="md-nav__link">
+  <a href="#trying-out-logos" class="md-nav__link">
     <span class="md-ellipsis">
-      Documentation
+      Trying out LOGos
     </span>
   </a>
   
 </li>
       
         <li class="md-nav__item">
-  <a href="#openai-integration" class="md-nav__link">
+  <a href="#reproducing-our-evaluation" class="md-nav__link">
     <span class="md-ellipsis">
-      OpenAI integration
+      Reproducing our evaluation
     </span>
   </a>
   
@@ -1109,15 +1109,20 @@
 
 
 <h1 id="logos">LOGos</h1>
-<p>Utilizing system logs to perform causal analysis.</p>
-<h3 id="demo">Demo</h3>
-<p>You can find a quick demo of the LOGos API at <a href="demo.ipynb">demo.ipynb</a>. </p>
-<h3 id="documentation">Documentation</h3>
-<p>To view the documentation, run <code>mkdocs serve</code> from the root of this repo and open the corresponding page. </p>
-<p>You might need to install the following packages:
-<code>pip install mkdocs-material mkdocs-gen-files mkdocs-literate-nav markdown_include pymdown-extensions markdown mkdocs-pymdownx Pygments mkdocs-jupyter mkdocstrings-python mkdocstrings mdx_include</code></p>
+<p>Utilizing system logs to perform causal analysis. You can access the documentation <a href="https://mitdbg.github.io/logos">here</a>.</p>
+<p>Please begin by installing the Python packages required for this project by running <code>pip install -r requirements.txt</code>.</p>
 <h3 id="openai-integration">OpenAI integration</h3>
-<p>If you use the LLM-powered capabilites of LOGos, please add a <code>.env</code> file to the root of this repo and define <code>OPENAI_API_KEY</code> appropriately.</p>
+<p>In order to use the LLM-powered capabilites of LOGos, please add a <code>.env</code> file to the root of this repo and define <code>OPENAI_API_KEY</code> appropriately.</p>
+<h3 id="trying-out-logos">Trying out LOGos</h3>
+<p>For an introduction to our Python-based interface at <a href="demo/demo.ipynb"><code>demo/demo.ipynb</code></a>.</p>
+<p>We also offer a UI-based demo, which you can launch by running </p>
+<h3 id="reproducing-our-evaluation">Reproducing our evaluation</h3>
+<p>To reproduce the evaluation from our VLDB paper, please follow the following steps:</p>
+<ol>
+<li>Follow the instructions in <code>dataset_files/README.md</code> to gain access to our datasets.</li>
+<li>Within <code>evaluation/</code>, you will find directories based on each experiment presented in our paper. Based on the experiment you would like to reproduce, switch into the appropriate directory and run the <code>reproduce.sh</code> script (you may need to edit file permissions to make it executable). This will run the experiment and plot the results.</li>
+<li>Find the resulting plots in <code>evaluation/repro_plots/</code>. The raw data for each plot will be saved in <code>evaluation/repro_plots_data/</code>.</li>
+</ol>
 
 
 
diff --git a/objects.inv b/objects.inv
index af9f22b..11ecc42 100644
Binary files a/objects.inv and b/objects.inv differ
diff --git a/reference/logos/drain/index.html b/reference/logos/drain/index.html
index 929e2c2..af8f9e4 100644
--- a/reference/logos/drain/index.html
+++ b/reference/logos/drain/index.html
@@ -1466,9 +1466,7 @@ <h2 id="logos.drain.Cluster" class="doc doc-heading">
 
               <details class="quote">
                 <summary>Source code in <code>src/logos/drain.py</code></summary>
-                <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-16">16</a></span>
-<span class="normal"><a href="#__codelineno-0-17">17</a></span>
-<span class="normal"><a href="#__codelineno-0-18">18</a></span>
+                <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-18">18</a></span>
 <span class="normal"><a href="#__codelineno-0-19">19</a></span>
 <span class="normal"><a href="#__codelineno-0-20">20</a></span>
 <span class="normal"><a href="#__codelineno-0-21">21</a></span>
@@ -1479,20 +1477,22 @@ <h2 id="logos.drain.Cluster" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-26">26</a></span>
 <span class="normal"><a href="#__codelineno-0-27">27</a></span>
 <span class="normal"><a href="#__codelineno-0-28">28</a></span>
-<span class="normal"><a href="#__codelineno-0-29">29</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-16"><a id="__codelineno-0-16" name="__codelineno-0-16"></a><span class="k">class</span> <span class="nc">Cluster</span><span class="p">:</span>
-</span><span id="__span-0-17"><a id="__codelineno-0-17" name="__codelineno-0-17"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-18"><a id="__codelineno-0-18" name="__codelineno-0-18"></a><span class="sd">    A cluster in the Drain parse tree.</span>
-</span><span id="__span-0-19"><a id="__codelineno-0-19" name="__codelineno-0-19"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-20"><a id="__codelineno-0-20" name="__codelineno-0-20"></a>
-</span><span id="__span-0-21"><a id="__codelineno-0-21" name="__codelineno-0-21"></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">template</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span><span class="p">,</span> <span class="n">message_ids</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]):</span>
-</span><span id="__span-0-22"><a id="__codelineno-0-22" name="__codelineno-0-22"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-23"><a id="__codelineno-0-23" name="__codelineno-0-23"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-24"><a id="__codelineno-0-24" name="__codelineno-0-24"></a><span class="sd">            template : the template of log messages in this cluster</span>
-</span><span id="__span-0-25"><a id="__codelineno-0-25" name="__codelineno-0-25"></a><span class="sd">            message_ids : the list of log message IDs in this cluster</span>
-</span><span id="__span-0-26"><a id="__codelineno-0-26" name="__codelineno-0-26"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-27"><a id="__codelineno-0-27" name="__codelineno-0-27"></a>
-</span><span id="__span-0-28"><a id="__codelineno-0-28" name="__codelineno-0-28"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">template</span> <span class="o">=</span> <span class="n">template</span>
-</span><span id="__span-0-29"><a id="__codelineno-0-29" name="__codelineno-0-29"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">message_ids</span> <span class="o">=</span> <span class="n">message_ids</span>
+<span class="normal"><a href="#__codelineno-0-29">29</a></span>
+<span class="normal"><a href="#__codelineno-0-30">30</a></span>
+<span class="normal"><a href="#__codelineno-0-31">31</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-18"><a id="__codelineno-0-18" name="__codelineno-0-18"></a><span class="k">class</span> <span class="nc">Cluster</span><span class="p">:</span>
+</span><span id="__span-0-19"><a id="__codelineno-0-19" name="__codelineno-0-19"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-20"><a id="__codelineno-0-20" name="__codelineno-0-20"></a><span class="sd">    A cluster in the Drain parse tree.</span>
+</span><span id="__span-0-21"><a id="__codelineno-0-21" name="__codelineno-0-21"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-22"><a id="__codelineno-0-22" name="__codelineno-0-22"></a>
+</span><span id="__span-0-23"><a id="__codelineno-0-23" name="__codelineno-0-23"></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">template</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span><span class="p">,</span> <span class="n">message_ids</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]):</span>
+</span><span id="__span-0-24"><a id="__codelineno-0-24" name="__codelineno-0-24"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-25"><a id="__codelineno-0-25" name="__codelineno-0-25"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-26"><a id="__codelineno-0-26" name="__codelineno-0-26"></a><span class="sd">            template : the template of log messages in this cluster</span>
+</span><span id="__span-0-27"><a id="__codelineno-0-27" name="__codelineno-0-27"></a><span class="sd">            message_ids : the list of log message IDs in this cluster</span>
+</span><span id="__span-0-28"><a id="__codelineno-0-28" name="__codelineno-0-28"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-29"><a id="__codelineno-0-29" name="__codelineno-0-29"></a>
+</span><span id="__span-0-30"><a id="__codelineno-0-30" name="__codelineno-0-30"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">template</span> <span class="o">=</span> <span class="n">template</span>
+</span><span id="__span-0-31"><a id="__codelineno-0-31" name="__codelineno-0-31"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">message_ids</span> <span class="o">=</span> <span class="n">message_ids</span>
 </span></code></pre></div></td></tr></table></div>
               </details>
 
@@ -1563,23 +1563,23 @@ <h3 id="logos.drain.Cluster.__init__" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/drain.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-21">21</a></span>
-<span class="normal"><a href="#__codelineno-0-22">22</a></span>
-<span class="normal"><a href="#__codelineno-0-23">23</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-23">23</a></span>
 <span class="normal"><a href="#__codelineno-0-24">24</a></span>
 <span class="normal"><a href="#__codelineno-0-25">25</a></span>
 <span class="normal"><a href="#__codelineno-0-26">26</a></span>
 <span class="normal"><a href="#__codelineno-0-27">27</a></span>
 <span class="normal"><a href="#__codelineno-0-28">28</a></span>
-<span class="normal"><a href="#__codelineno-0-29">29</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-21"><a id="__codelineno-0-21" name="__codelineno-0-21"></a><span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">template</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span><span class="p">,</span> <span class="n">message_ids</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]):</span>
-</span><span id="__span-0-22"><a id="__codelineno-0-22" name="__codelineno-0-22"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-23"><a id="__codelineno-0-23" name="__codelineno-0-23"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-24"><a id="__codelineno-0-24" name="__codelineno-0-24"></a><span class="sd">        template : the template of log messages in this cluster</span>
-</span><span id="__span-0-25"><a id="__codelineno-0-25" name="__codelineno-0-25"></a><span class="sd">        message_ids : the list of log message IDs in this cluster</span>
-</span><span id="__span-0-26"><a id="__codelineno-0-26" name="__codelineno-0-26"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-27"><a id="__codelineno-0-27" name="__codelineno-0-27"></a>
-</span><span id="__span-0-28"><a id="__codelineno-0-28" name="__codelineno-0-28"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">template</span> <span class="o">=</span> <span class="n">template</span>
-</span><span id="__span-0-29"><a id="__codelineno-0-29" name="__codelineno-0-29"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">message_ids</span> <span class="o">=</span> <span class="n">message_ids</span>
+<span class="normal"><a href="#__codelineno-0-29">29</a></span>
+<span class="normal"><a href="#__codelineno-0-30">30</a></span>
+<span class="normal"><a href="#__codelineno-0-31">31</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-23"><a id="__codelineno-0-23" name="__codelineno-0-23"></a><span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">template</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span><span class="p">,</span> <span class="n">message_ids</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]):</span>
+</span><span id="__span-0-24"><a id="__codelineno-0-24" name="__codelineno-0-24"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-25"><a id="__codelineno-0-25" name="__codelineno-0-25"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-26"><a id="__codelineno-0-26" name="__codelineno-0-26"></a><span class="sd">        template : the template of log messages in this cluster</span>
+</span><span id="__span-0-27"><a id="__codelineno-0-27" name="__codelineno-0-27"></a><span class="sd">        message_ids : the list of log message IDs in this cluster</span>
+</span><span id="__span-0-28"><a id="__codelineno-0-28" name="__codelineno-0-28"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-29"><a id="__codelineno-0-29" name="__codelineno-0-29"></a>
+</span><span id="__span-0-30"><a id="__codelineno-0-30" name="__codelineno-0-30"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">template</span> <span class="o">=</span> <span class="n">template</span>
+</span><span id="__span-0-31"><a id="__codelineno-0-31" name="__codelineno-0-31"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">message_ids</span> <span class="o">=</span> <span class="n">message_ids</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -1612,9 +1612,7 @@ <h2 id="logos.drain.Node" class="doc doc-heading">
 
               <details class="quote">
                 <summary>Source code in <code>src/logos/drain.py</code></summary>
-                <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-32">32</a></span>
-<span class="normal"><a href="#__codelineno-0-33">33</a></span>
-<span class="normal"><a href="#__codelineno-0-34">34</a></span>
+                <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-34">34</a></span>
 <span class="normal"><a href="#__codelineno-0-35">35</a></span>
 <span class="normal"><a href="#__codelineno-0-36">36</a></span>
 <span class="normal"><a href="#__codelineno-0-37">37</a></span>
@@ -1628,23 +1626,25 @@ <h2 id="logos.drain.Node" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-45">45</a></span>
 <span class="normal"><a href="#__codelineno-0-46">46</a></span>
 <span class="normal"><a href="#__codelineno-0-47">47</a></span>
-<span class="normal"><a href="#__codelineno-0-48">48</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-32"><a id="__codelineno-0-32" name="__codelineno-0-32"></a><span class="k">class</span> <span class="nc">Node</span><span class="p">:</span>
-</span><span id="__span-0-33"><a id="__codelineno-0-33" name="__codelineno-0-33"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-34"><a id="__codelineno-0-34" name="__codelineno-0-34"></a><span class="sd">    A node in the Drain parse tree.</span>
-</span><span id="__span-0-35"><a id="__codelineno-0-35" name="__codelineno-0-35"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-36"><a id="__codelineno-0-36" name="__codelineno-0-36"></a>
-</span><span id="__span-0-37"><a id="__codelineno-0-37" name="__codelineno-0-37"></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">children</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">depth</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="nb">id</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-</span><span id="__span-0-38"><a id="__codelineno-0-38" name="__codelineno-0-38"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-39"><a id="__codelineno-0-39" name="__codelineno-0-39"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-40"><a id="__codelineno-0-40" name="__codelineno-0-40"></a><span class="sd">            children : the dictionary of children nodes</span>
-</span><span id="__span-0-41"><a id="__codelineno-0-41" name="__codelineno-0-41"></a><span class="sd">            depth : the depth of this node in the tree</span>
-</span><span id="__span-0-42"><a id="__codelineno-0-42" name="__codelineno-0-42"></a><span class="sd">            id : the digit or token that this node represents</span>
-</span><span id="__span-0-43"><a id="__codelineno-0-43" name="__codelineno-0-43"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-44"><a id="__codelineno-0-44" name="__codelineno-0-44"></a>        <span class="k">if</span> <span class="n">children</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-45"><a id="__codelineno-0-45" name="__codelineno-0-45"></a>            <span class="n">children</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">()</span>
-</span><span id="__span-0-46"><a id="__codelineno-0-46" name="__codelineno-0-46"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">children</span> <span class="o">=</span> <span class="n">children</span>
-</span><span id="__span-0-47"><a id="__codelineno-0-47" name="__codelineno-0-47"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">depth</span> <span class="o">=</span> <span class="n">depth</span>
-</span><span id="__span-0-48"><a id="__codelineno-0-48" name="__codelineno-0-48"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">id</span> <span class="o">=</span> <span class="nb">id</span>
+<span class="normal"><a href="#__codelineno-0-48">48</a></span>
+<span class="normal"><a href="#__codelineno-0-49">49</a></span>
+<span class="normal"><a href="#__codelineno-0-50">50</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-34"><a id="__codelineno-0-34" name="__codelineno-0-34"></a><span class="k">class</span> <span class="nc">Node</span><span class="p">:</span>
+</span><span id="__span-0-35"><a id="__codelineno-0-35" name="__codelineno-0-35"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-36"><a id="__codelineno-0-36" name="__codelineno-0-36"></a><span class="sd">    A node in the Drain parse tree.</span>
+</span><span id="__span-0-37"><a id="__codelineno-0-37" name="__codelineno-0-37"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-38"><a id="__codelineno-0-38" name="__codelineno-0-38"></a>
+</span><span id="__span-0-39"><a id="__codelineno-0-39" name="__codelineno-0-39"></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">children</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">depth</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="nb">id</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+</span><span id="__span-0-40"><a id="__codelineno-0-40" name="__codelineno-0-40"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-41"><a id="__codelineno-0-41" name="__codelineno-0-41"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-42"><a id="__codelineno-0-42" name="__codelineno-0-42"></a><span class="sd">            children : the dictionary of children nodes</span>
+</span><span id="__span-0-43"><a id="__codelineno-0-43" name="__codelineno-0-43"></a><span class="sd">            depth : the depth of this node in the tree</span>
+</span><span id="__span-0-44"><a id="__codelineno-0-44" name="__codelineno-0-44"></a><span class="sd">            id : the digit or token that this node represents</span>
+</span><span id="__span-0-45"><a id="__codelineno-0-45" name="__codelineno-0-45"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-46"><a id="__codelineno-0-46" name="__codelineno-0-46"></a>        <span class="k">if</span> <span class="n">children</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-47"><a id="__codelineno-0-47" name="__codelineno-0-47"></a>            <span class="n">children</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">()</span>
+</span><span id="__span-0-48"><a id="__codelineno-0-48" name="__codelineno-0-48"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">children</span> <span class="o">=</span> <span class="n">children</span>
+</span><span id="__span-0-49"><a id="__codelineno-0-49" name="__codelineno-0-49"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">depth</span> <span class="o">=</span> <span class="n">depth</span>
+</span><span id="__span-0-50"><a id="__codelineno-0-50" name="__codelineno-0-50"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">id</span> <span class="o">=</span> <span class="nb">id</span>
 </span></code></pre></div></td></tr></table></div>
               </details>
 
@@ -1728,9 +1728,7 @@ <h3 id="logos.drain.Node.__init__" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/drain.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-37">37</a></span>
-<span class="normal"><a href="#__codelineno-0-38">38</a></span>
-<span class="normal"><a href="#__codelineno-0-39">39</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-39">39</a></span>
 <span class="normal"><a href="#__codelineno-0-40">40</a></span>
 <span class="normal"><a href="#__codelineno-0-41">41</a></span>
 <span class="normal"><a href="#__codelineno-0-42">42</a></span>
@@ -1739,18 +1737,20 @@ <h3 id="logos.drain.Node.__init__" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-45">45</a></span>
 <span class="normal"><a href="#__codelineno-0-46">46</a></span>
 <span class="normal"><a href="#__codelineno-0-47">47</a></span>
-<span class="normal"><a href="#__codelineno-0-48">48</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-37"><a id="__codelineno-0-37" name="__codelineno-0-37"></a><span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">children</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">depth</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="nb">id</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-</span><span id="__span-0-38"><a id="__codelineno-0-38" name="__codelineno-0-38"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-39"><a id="__codelineno-0-39" name="__codelineno-0-39"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-40"><a id="__codelineno-0-40" name="__codelineno-0-40"></a><span class="sd">        children : the dictionary of children nodes</span>
-</span><span id="__span-0-41"><a id="__codelineno-0-41" name="__codelineno-0-41"></a><span class="sd">        depth : the depth of this node in the tree</span>
-</span><span id="__span-0-42"><a id="__codelineno-0-42" name="__codelineno-0-42"></a><span class="sd">        id : the digit or token that this node represents</span>
-</span><span id="__span-0-43"><a id="__codelineno-0-43" name="__codelineno-0-43"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-44"><a id="__codelineno-0-44" name="__codelineno-0-44"></a>    <span class="k">if</span> <span class="n">children</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-45"><a id="__codelineno-0-45" name="__codelineno-0-45"></a>        <span class="n">children</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">()</span>
-</span><span id="__span-0-46"><a id="__codelineno-0-46" name="__codelineno-0-46"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">children</span> <span class="o">=</span> <span class="n">children</span>
-</span><span id="__span-0-47"><a id="__codelineno-0-47" name="__codelineno-0-47"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">depth</span> <span class="o">=</span> <span class="n">depth</span>
-</span><span id="__span-0-48"><a id="__codelineno-0-48" name="__codelineno-0-48"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">id</span> <span class="o">=</span> <span class="nb">id</span>
+<span class="normal"><a href="#__codelineno-0-48">48</a></span>
+<span class="normal"><a href="#__codelineno-0-49">49</a></span>
+<span class="normal"><a href="#__codelineno-0-50">50</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-39"><a id="__codelineno-0-39" name="__codelineno-0-39"></a><span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">children</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">depth</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="nb">id</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+</span><span id="__span-0-40"><a id="__codelineno-0-40" name="__codelineno-0-40"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-41"><a id="__codelineno-0-41" name="__codelineno-0-41"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-42"><a id="__codelineno-0-42" name="__codelineno-0-42"></a><span class="sd">        children : the dictionary of children nodes</span>
+</span><span id="__span-0-43"><a id="__codelineno-0-43" name="__codelineno-0-43"></a><span class="sd">        depth : the depth of this node in the tree</span>
+</span><span id="__span-0-44"><a id="__codelineno-0-44" name="__codelineno-0-44"></a><span class="sd">        id : the digit or token that this node represents</span>
+</span><span id="__span-0-45"><a id="__codelineno-0-45" name="__codelineno-0-45"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-46"><a id="__codelineno-0-46" name="__codelineno-0-46"></a>    <span class="k">if</span> <span class="n">children</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-47"><a id="__codelineno-0-47" name="__codelineno-0-47"></a>        <span class="n">children</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">()</span>
+</span><span id="__span-0-48"><a id="__codelineno-0-48" name="__codelineno-0-48"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">children</span> <span class="o">=</span> <span class="n">children</span>
+</span><span id="__span-0-49"><a id="__codelineno-0-49" name="__codelineno-0-49"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">depth</span> <span class="o">=</span> <span class="n">depth</span>
+</span><span id="__span-0-50"><a id="__codelineno-0-50" name="__codelineno-0-50"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">id</span> <span class="o">=</span> <span class="nb">id</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -1783,9 +1783,7 @@ <h2 id="logos.drain.Drain" class="doc doc-heading">
 
               <details class="quote">
                 <summary>Source code in <code>src/logos/drain.py</code></summary>
-                <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-51"> 51</a></span>
-<span class="normal"><a href="#__codelineno-0-52"> 52</a></span>
-<span class="normal"><a href="#__codelineno-0-53"> 53</a></span>
+                <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-53"> 53</a></span>
 <span class="normal"><a href="#__codelineno-0-54"> 54</a></span>
 <span class="normal"><a href="#__codelineno-0-55"> 55</a></span>
 <span class="normal"><a href="#__codelineno-0-56"> 56</a></span>
@@ -2254,478 +2252,480 @@ <h2 id="logos.drain.Drain" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-519">519</a></span>
 <span class="normal"><a href="#__codelineno-0-520">520</a></span>
 <span class="normal"><a href="#__codelineno-0-521">521</a></span>
-<span class="normal"><a href="#__codelineno-0-522">522</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-51"><a id="__codelineno-0-51" name="__codelineno-0-51"></a><span class="k">class</span> <span class="nc">Drain</span><span class="p">:</span>
-</span><span id="__span-0-52"><a id="__codelineno-0-52" name="__codelineno-0-52"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-53"><a id="__codelineno-0-53" name="__codelineno-0-53"></a><span class="sd">    A class implementing the Drain log parsing algorithm.</span>
-</span><span id="__span-0-54"><a id="__codelineno-0-54" name="__codelineno-0-54"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-55"><a id="__codelineno-0-55" name="__codelineno-0-55"></a>
-</span><span id="__span-0-56"><a id="__codelineno-0-56" name="__codelineno-0-56"></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
-</span><span id="__span-0-57"><a id="__codelineno-0-57" name="__codelineno-0-57"></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-58"><a id="__codelineno-0-58" name="__codelineno-0-58"></a>        <span class="n">indir</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;.&quot;</span><span class="p">,</span>
-</span><span id="__span-0-59"><a id="__codelineno-0-59" name="__codelineno-0-59"></a>        <span class="n">depth</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">4</span><span class="p">,</span>
-</span><span id="__span-0-60"><a id="__codelineno-0-60" name="__codelineno-0-60"></a>        <span class="n">st</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.4</span><span class="p">,</span>
-</span><span id="__span-0-61"><a id="__codelineno-0-61" name="__codelineno-0-61"></a>        <span class="n">max_children</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">100</span><span class="p">,</span>
-</span><span id="__span-0-62"><a id="__codelineno-0-62" name="__codelineno-0-62"></a>        <span class="n">rex</span><span class="p">:</span> <span class="nb">dict</span> <span class="o">=</span> <span class="p">{},</span>
-</span><span id="__span-0-63"><a id="__codelineno-0-63" name="__codelineno-0-63"></a>        <span class="n">skip_writeout</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="__span-0-64"><a id="__codelineno-0-64" name="__codelineno-0-64"></a>        <span class="n">message_prefix</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="sa">r</span><span class="s2">&quot;.*&quot;</span><span class="p">,</span>
-</span><span id="__span-0-65"><a id="__codelineno-0-65" name="__codelineno-0-65"></a>    <span class="p">):</span>
-</span><span id="__span-0-66"><a id="__codelineno-0-66" name="__codelineno-0-66"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-67"><a id="__codelineno-0-67" name="__codelineno-0-67"></a><span class="sd">        Initialize a Drain-based parser.</span>
-</span><span id="__span-0-68"><a id="__codelineno-0-68" name="__codelineno-0-68"></a>
-</span><span id="__span-0-69"><a id="__codelineno-0-69" name="__codelineno-0-69"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-70"><a id="__codelineno-0-70" name="__codelineno-0-70"></a><span class="sd">            indir: the input directory stores the input log file name</span>
-</span><span id="__span-0-71"><a id="__codelineno-0-71" name="__codelineno-0-71"></a><span class="sd">            depth: depth of all leaf nodes</span>
-</span><span id="__span-0-72"><a id="__codelineno-0-72" name="__codelineno-0-72"></a><span class="sd">            st: similarity threshold</span>
-</span><span id="__span-0-73"><a id="__codelineno-0-73" name="__codelineno-0-73"></a><span class="sd">            max_children: max number of children of an internal node</span>
-</span><span id="__span-0-74"><a id="__codelineno-0-74" name="__codelineno-0-74"></a><span class="sd">            rex: regular expressions used in preprocessing, provided as a dictionary from field name to field regex</span>
-</span><span id="__span-0-75"><a id="__codelineno-0-75" name="__codelineno-0-75"></a><span class="sd">            skip_writeout: whether to skip writing out the parsed log file, templates and variables.</span>
-</span><span id="__span-0-76"><a id="__codelineno-0-76" name="__codelineno-0-76"></a><span class="sd">            message_prefix: prefix that starts each message of the log file - lines are merged to their preceding line if they do not start with this prefix.</span>
-</span><span id="__span-0-77"><a id="__codelineno-0-77" name="__codelineno-0-77"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-78"><a id="__codelineno-0-78" name="__codelineno-0-78"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">indir</span> <span class="o">=</span> <span class="n">indir</span>
-</span><span id="__span-0-79"><a id="__codelineno-0-79" name="__codelineno-0-79"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">depth</span> <span class="o">=</span> <span class="n">depth</span> <span class="o">-</span> <span class="mi">2</span>
-</span><span id="__span-0-80"><a id="__codelineno-0-80" name="__codelineno-0-80"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">st</span> <span class="o">=</span> <span class="n">st</span>
-</span><span id="__span-0-81"><a id="__codelineno-0-81" name="__codelineno-0-81"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">max_children</span> <span class="o">=</span> <span class="n">max_children</span>
-</span><span id="__span-0-82"><a id="__codelineno-0-82" name="__codelineno-0-82"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">rex</span> <span class="o">=</span> <span class="n">rex</span>
-</span><span id="__span-0-83"><a id="__codelineno-0-83" name="__codelineno-0-83"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">skip_writeout</span> <span class="o">=</span> <span class="n">skip_writeout</span>
-</span><span id="__span-0-84"><a id="__codelineno-0-84" name="__codelineno-0-84"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">message_prefix</span> <span class="o">=</span> <span class="n">message_prefix</span>
-</span><span id="__span-0-85"><a id="__codelineno-0-85" name="__codelineno-0-85"></a>
-</span><span id="__span-0-86"><a id="__codelineno-0-86" name="__codelineno-0-86"></a>    <span class="k">def</span> <span class="nf">parse</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filename</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">]:</span>
-</span><span id="__span-0-87"><a id="__codelineno-0-87" name="__codelineno-0-87"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-88"><a id="__codelineno-0-88" name="__codelineno-0-88"></a><span class="sd">        Parse a log file.</span>
-</span><span id="__span-0-89"><a id="__codelineno-0-89" name="__codelineno-0-89"></a>
-</span><span id="__span-0-90"><a id="__codelineno-0-90" name="__codelineno-0-90"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-91"><a id="__codelineno-0-91" name="__codelineno-0-91"></a><span class="sd">            filename: The name of the log file to parse (without path).</span>
-</span><span id="__span-0-92"><a id="__codelineno-0-92" name="__codelineno-0-92"></a>
-</span><span id="__span-0-93"><a id="__codelineno-0-93" name="__codelineno-0-93"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-94"><a id="__codelineno-0-94" name="__codelineno-0-94"></a><span class="sd">            A tuple of three dataframes, containing the parsed log file, the parsed log templates,</span>
-</span><span id="__span-0-95"><a id="__codelineno-0-95" name="__codelineno-0-95"></a><span class="sd">            and the parsed variables respectively.</span>
-</span><span id="__span-0-96"><a id="__codelineno-0-96" name="__codelineno-0-96"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-97"><a id="__codelineno-0-97" name="__codelineno-0-97"></a>
-</span><span id="__span-0-98"><a id="__codelineno-0-98" name="__codelineno-0-98"></a>        <span class="n">full_path</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">indir</span><span class="p">,</span> <span class="n">filename</span><span class="p">)</span>
-</span><span id="__span-0-99"><a id="__codelineno-0-99" name="__codelineno-0-99"></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Parsing file: </span><span class="si">{</span><span class="n">full_path</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="__span-0-100"><a id="__codelineno-0-100" name="__codelineno-0-100"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">filename</span> <span class="o">=</span> <span class="n">filename</span>
-</span><span id="__span-0-101"><a id="__codelineno-0-101" name="__codelineno-0-101"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">root</span> <span class="o">=</span> <span class="n">Node</span><span class="p">()</span>
-</span><span id="__span-0-102"><a id="__codelineno-0-102" name="__codelineno-0-102"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">cluster_list</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-103"><a id="__codelineno-0-103" name="__codelineno-0-103"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_to_df</span><span class="p">(</span><span class="n">full_path</span><span class="p">)</span>
-</span><span id="__span-0-104"><a id="__codelineno-0-104" name="__codelineno-0-104"></a>
-</span><span id="__span-0-105"><a id="__codelineno-0-105" name="__codelineno-0-105"></a>        <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Determining template for each line...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-106"><a id="__codelineno-0-106" name="__codelineno-0-106"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parse_message</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="__span-0-107"><a id="__codelineno-0-107" name="__codelineno-0-107"></a>
-</span><span id="__span-0-108"><a id="__codelineno-0-108" name="__codelineno-0-108"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_postprocess</span><span class="p">()</span>
+<span class="normal"><a href="#__codelineno-0-522">522</a></span>
+<span class="normal"><a href="#__codelineno-0-523">523</a></span>
+<span class="normal"><a href="#__codelineno-0-524">524</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-53"><a id="__codelineno-0-53" name="__codelineno-0-53"></a><span class="k">class</span> <span class="nc">Drain</span><span class="p">:</span>
+</span><span id="__span-0-54"><a id="__codelineno-0-54" name="__codelineno-0-54"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-55"><a id="__codelineno-0-55" name="__codelineno-0-55"></a><span class="sd">    A class implementing the Drain log parsing algorithm.</span>
+</span><span id="__span-0-56"><a id="__codelineno-0-56" name="__codelineno-0-56"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-57"><a id="__codelineno-0-57" name="__codelineno-0-57"></a>
+</span><span id="__span-0-58"><a id="__codelineno-0-58" name="__codelineno-0-58"></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="__span-0-59"><a id="__codelineno-0-59" name="__codelineno-0-59"></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-60"><a id="__codelineno-0-60" name="__codelineno-0-60"></a>        <span class="n">indir</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;.&quot;</span><span class="p">,</span>
+</span><span id="__span-0-61"><a id="__codelineno-0-61" name="__codelineno-0-61"></a>        <span class="n">depth</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">4</span><span class="p">,</span>
+</span><span id="__span-0-62"><a id="__codelineno-0-62" name="__codelineno-0-62"></a>        <span class="n">st</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.4</span><span class="p">,</span>
+</span><span id="__span-0-63"><a id="__codelineno-0-63" name="__codelineno-0-63"></a>        <span class="n">max_children</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">100</span><span class="p">,</span>
+</span><span id="__span-0-64"><a id="__codelineno-0-64" name="__codelineno-0-64"></a>        <span class="n">rex</span><span class="p">:</span> <span class="nb">dict</span> <span class="o">=</span> <span class="p">{},</span>
+</span><span id="__span-0-65"><a id="__codelineno-0-65" name="__codelineno-0-65"></a>        <span class="n">skip_writeout</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-66"><a id="__codelineno-0-66" name="__codelineno-0-66"></a>        <span class="n">message_prefix</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="sa">r</span><span class="s2">&quot;.*&quot;</span><span class="p">,</span>
+</span><span id="__span-0-67"><a id="__codelineno-0-67" name="__codelineno-0-67"></a>    <span class="p">):</span>
+</span><span id="__span-0-68"><a id="__codelineno-0-68" name="__codelineno-0-68"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-69"><a id="__codelineno-0-69" name="__codelineno-0-69"></a><span class="sd">        Initialize a Drain-based parser.</span>
+</span><span id="__span-0-70"><a id="__codelineno-0-70" name="__codelineno-0-70"></a>
+</span><span id="__span-0-71"><a id="__codelineno-0-71" name="__codelineno-0-71"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-72"><a id="__codelineno-0-72" name="__codelineno-0-72"></a><span class="sd">            indir: the input directory stores the input log file name</span>
+</span><span id="__span-0-73"><a id="__codelineno-0-73" name="__codelineno-0-73"></a><span class="sd">            depth: depth of all leaf nodes</span>
+</span><span id="__span-0-74"><a id="__codelineno-0-74" name="__codelineno-0-74"></a><span class="sd">            st: similarity threshold</span>
+</span><span id="__span-0-75"><a id="__codelineno-0-75" name="__codelineno-0-75"></a><span class="sd">            max_children: max number of children of an internal node</span>
+</span><span id="__span-0-76"><a id="__codelineno-0-76" name="__codelineno-0-76"></a><span class="sd">            rex: regular expressions used in preprocessing, provided as a dictionary from field name to field regex</span>
+</span><span id="__span-0-77"><a id="__codelineno-0-77" name="__codelineno-0-77"></a><span class="sd">            skip_writeout: whether to skip writing out the parsed log file, templates and variables.</span>
+</span><span id="__span-0-78"><a id="__codelineno-0-78" name="__codelineno-0-78"></a><span class="sd">            message_prefix: prefix that starts each message of the log file - lines are merged to their preceding line if they do not start with this prefix.</span>
+</span><span id="__span-0-79"><a id="__codelineno-0-79" name="__codelineno-0-79"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-80"><a id="__codelineno-0-80" name="__codelineno-0-80"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">indir</span> <span class="o">=</span> <span class="n">indir</span>
+</span><span id="__span-0-81"><a id="__codelineno-0-81" name="__codelineno-0-81"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">depth</span> <span class="o">=</span> <span class="n">depth</span> <span class="o">-</span> <span class="mi">2</span>
+</span><span id="__span-0-82"><a id="__codelineno-0-82" name="__codelineno-0-82"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">st</span> <span class="o">=</span> <span class="n">st</span>
+</span><span id="__span-0-83"><a id="__codelineno-0-83" name="__codelineno-0-83"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">max_children</span> <span class="o">=</span> <span class="n">max_children</span>
+</span><span id="__span-0-84"><a id="__codelineno-0-84" name="__codelineno-0-84"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">rex</span> <span class="o">=</span> <span class="n">rex</span>
+</span><span id="__span-0-85"><a id="__codelineno-0-85" name="__codelineno-0-85"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">skip_writeout</span> <span class="o">=</span> <span class="n">skip_writeout</span>
+</span><span id="__span-0-86"><a id="__codelineno-0-86" name="__codelineno-0-86"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">message_prefix</span> <span class="o">=</span> <span class="n">message_prefix</span>
+</span><span id="__span-0-87"><a id="__codelineno-0-87" name="__codelineno-0-87"></a>
+</span><span id="__span-0-88"><a id="__codelineno-0-88" name="__codelineno-0-88"></a>    <span class="k">def</span> <span class="nf">parse</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filename</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">]:</span>
+</span><span id="__span-0-89"><a id="__codelineno-0-89" name="__codelineno-0-89"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-90"><a id="__codelineno-0-90" name="__codelineno-0-90"></a><span class="sd">        Parse a log file.</span>
+</span><span id="__span-0-91"><a id="__codelineno-0-91" name="__codelineno-0-91"></a>
+</span><span id="__span-0-92"><a id="__codelineno-0-92" name="__codelineno-0-92"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-93"><a id="__codelineno-0-93" name="__codelineno-0-93"></a><span class="sd">            filename: The name of the log file to parse (without path).</span>
+</span><span id="__span-0-94"><a id="__codelineno-0-94" name="__codelineno-0-94"></a>
+</span><span id="__span-0-95"><a id="__codelineno-0-95" name="__codelineno-0-95"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-96"><a id="__codelineno-0-96" name="__codelineno-0-96"></a><span class="sd">            A tuple of three dataframes, containing the parsed log file, the parsed log templates,</span>
+</span><span id="__span-0-97"><a id="__codelineno-0-97" name="__codelineno-0-97"></a><span class="sd">            and the parsed variables respectively.</span>
+</span><span id="__span-0-98"><a id="__codelineno-0-98" name="__codelineno-0-98"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-99"><a id="__codelineno-0-99" name="__codelineno-0-99"></a>
+</span><span id="__span-0-100"><a id="__codelineno-0-100" name="__codelineno-0-100"></a>        <span class="n">full_path</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">indir</span><span class="p">,</span> <span class="n">filename</span><span class="p">)</span>
+</span><span id="__span-0-101"><a id="__codelineno-0-101" name="__codelineno-0-101"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Parsing file: </span><span class="si">{</span><span class="n">full_path</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-102"><a id="__codelineno-0-102" name="__codelineno-0-102"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">filename</span> <span class="o">=</span> <span class="n">filename</span>
+</span><span id="__span-0-103"><a id="__codelineno-0-103" name="__codelineno-0-103"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">root</span> <span class="o">=</span> <span class="n">Node</span><span class="p">()</span>
+</span><span id="__span-0-104"><a id="__codelineno-0-104" name="__codelineno-0-104"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">cluster_list</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-105"><a id="__codelineno-0-105" name="__codelineno-0-105"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_to_df</span><span class="p">(</span><span class="n">full_path</span><span class="p">)</span>
+</span><span id="__span-0-106"><a id="__codelineno-0-106" name="__codelineno-0-106"></a>
+</span><span id="__span-0-107"><a id="__codelineno-0-107" name="__codelineno-0-107"></a>        <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Determining template for each line...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-108"><a id="__codelineno-0-108" name="__codelineno-0-108"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parse_message</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
 </span><span id="__span-0-109"><a id="__codelineno-0-109" name="__codelineno-0-109"></a>
-</span><span id="__span-0-110"><a id="__codelineno-0-110" name="__codelineno-0-110"></a>    <span class="k">def</span> <span class="nf">_to_df</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">log_file</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
-</span><span id="__span-0-111"><a id="__codelineno-0-111" name="__codelineno-0-111"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-112"><a id="__codelineno-0-112" name="__codelineno-0-112"></a><span class="sd">        Transform a log file into a dataframe.</span>
-</span><span id="__span-0-113"><a id="__codelineno-0-113" name="__codelineno-0-113"></a>
-</span><span id="__span-0-114"><a id="__codelineno-0-114" name="__codelineno-0-114"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-115"><a id="__codelineno-0-115" name="__codelineno-0-115"></a><span class="sd">            log_file: The path to the log file.</span>
-</span><span id="__span-0-116"><a id="__codelineno-0-116" name="__codelineno-0-116"></a>
-</span><span id="__span-0-117"><a id="__codelineno-0-117" name="__codelineno-0-117"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-118"><a id="__codelineno-0-118" name="__codelineno-0-118"></a><span class="sd">            A dataframe containing the log file&#39;s lines, tokenized and with regexes replaced.</span>
-</span><span id="__span-0-119"><a id="__codelineno-0-119" name="__codelineno-0-119"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-120"><a id="__codelineno-0-120" name="__codelineno-0-120"></a>
-</span><span id="__span-0-121"><a id="__codelineno-0-121" name="__codelineno-0-121"></a>        <span class="n">log_messages</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-122"><a id="__codelineno-0-122" name="__codelineno-0-122"></a>        <span class="n">linecount</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="__span-0-123"><a id="__codelineno-0-123" name="__codelineno-0-123"></a>
-</span><span id="__span-0-124"><a id="__codelineno-0-124" name="__codelineno-0-124"></a>        <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="n">log_file</span><span class="p">,</span> <span class="s2">&quot;r&quot;</span><span class="p">)</span> <span class="k">as</span> <span class="n">f</span><span class="p">:</span>
-</span><span id="__span-0-125"><a id="__codelineno-0-125" name="__codelineno-0-125"></a>            <span class="n">log_message</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-126"><a id="__codelineno-0-126" name="__codelineno-0-126"></a>
-</span><span id="__span-0-127"><a id="__codelineno-0-127" name="__codelineno-0-127"></a>            <span class="k">for</span> <span class="n">line</span> <span class="ow">in</span> <span class="n">tqdm</span><span class="p">(</span><span class="n">f</span><span class="o">.</span><span class="n">readlines</span><span class="p">(),</span> <span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Reading and tokenizing log lines...&quot;</span><span class="p">):</span>
-</span><span id="__span-0-128"><a id="__codelineno-0-128" name="__codelineno-0-128"></a>                <span class="n">line</span> <span class="o">=</span> <span class="n">line</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
-</span><span id="__span-0-129"><a id="__codelineno-0-129" name="__codelineno-0-129"></a>
-</span><span id="__span-0-130"><a id="__codelineno-0-130" name="__codelineno-0-130"></a>                <span class="k">if</span> <span class="n">re</span><span class="o">.</span><span class="n">match</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">message_prefix</span><span class="p">,</span> <span class="n">line</span><span class="p">):</span>
-</span><span id="__span-0-131"><a id="__codelineno-0-131" name="__codelineno-0-131"></a>                    <span class="k">if</span> <span class="n">log_message</span><span class="p">:</span>
-</span><span id="__span-0-132"><a id="__codelineno-0-132" name="__codelineno-0-132"></a>                        <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-133"><a id="__codelineno-0-133" name="__codelineno-0-133"></a>                            <span class="n">log_messages</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_preprocess</span><span class="p">(</span><span class="n">log_message</span><span class="p">))</span>
-</span><span id="__span-0-134"><a id="__codelineno-0-134" name="__codelineno-0-134"></a>                            <span class="n">linecount</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="__span-0-135"><a id="__codelineno-0-135" name="__codelineno-0-135"></a>                        <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
-</span><span id="__span-0-136"><a id="__codelineno-0-136" name="__codelineno-0-136"></a>                            <span class="k">raise</span> <span class="ne">ValueError</span>
-</span><span id="__span-0-137"><a id="__codelineno-0-137" name="__codelineno-0-137"></a>                    <span class="n">log_message</span> <span class="o">=</span> <span class="n">line</span>
-</span><span id="__span-0-138"><a id="__codelineno-0-138" name="__codelineno-0-138"></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-139"><a id="__codelineno-0-139" name="__codelineno-0-139"></a>                    <span class="n">log_message</span> <span class="o">+=</span> <span class="s2">&quot; &quot;</span> <span class="o">+</span> <span class="n">line</span>
-</span><span id="__span-0-140"><a id="__codelineno-0-140" name="__codelineno-0-140"></a>
-</span><span id="__span-0-141"><a id="__codelineno-0-141" name="__codelineno-0-141"></a>            <span class="k">if</span> <span class="n">log_message</span><span class="p">:</span>
-</span><span id="__span-0-142"><a id="__codelineno-0-142" name="__codelineno-0-142"></a>                <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-143"><a id="__codelineno-0-143" name="__codelineno-0-143"></a>                    <span class="n">log_messages</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_preprocess</span><span class="p">(</span><span class="n">log_message</span><span class="p">))</span>
-</span><span id="__span-0-144"><a id="__codelineno-0-144" name="__codelineno-0-144"></a>                    <span class="n">linecount</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="__span-0-145"><a id="__codelineno-0-145" name="__codelineno-0-145"></a>                <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
-</span><span id="__span-0-146"><a id="__codelineno-0-146" name="__codelineno-0-146"></a>                    <span class="k">raise</span> <span class="ne">ValueError</span>
-</span><span id="__span-0-147"><a id="__codelineno-0-147" name="__codelineno-0-147"></a>
-</span><span id="__span-0-148"><a id="__codelineno-0-148" name="__codelineno-0-148"></a>        <span class="n">logdf</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span>
-</span><span id="__span-0-149"><a id="__codelineno-0-149" name="__codelineno-0-149"></a>            <span class="n">log_messages</span><span class="p">,</span> <span class="n">columns</span><span class="o">=</span><span class="p">[</span><span class="s2">&quot;Message&quot;</span><span class="p">,</span> <span class="s2">&quot;Tokenized&quot;</span><span class="p">,</span> <span class="s2">&quot;Replaced by regex&quot;</span><span class="p">]</span>
-</span><span id="__span-0-150"><a id="__codelineno-0-150" name="__codelineno-0-150"></a>        <span class="p">)</span>
-</span><span id="__span-0-151"><a id="__codelineno-0-151" name="__codelineno-0-151"></a>        <span class="n">logdf</span><span class="p">[</span><span class="s2">&quot;MsgId&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">logdf</span><span class="p">))</span>
-</span><span id="__span-0-152"><a id="__codelineno-0-152" name="__codelineno-0-152"></a>        <span class="k">return</span> <span class="n">logdf</span>
-</span><span id="__span-0-153"><a id="__codelineno-0-153" name="__codelineno-0-153"></a>
-</span><span id="__span-0-154"><a id="__codelineno-0-154" name="__codelineno-0-154"></a>    <span class="k">def</span> <span class="nf">_preprocess</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">msg</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
-</span><span id="__span-0-155"><a id="__codelineno-0-155" name="__codelineno-0-155"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-156"><a id="__codelineno-0-156" name="__codelineno-0-156"></a><span class="sd">        Preprocess a message of a log file.</span>
-</span><span id="__span-0-157"><a id="__codelineno-0-157" name="__codelineno-0-157"></a>
-</span><span id="__span-0-158"><a id="__codelineno-0-158" name="__codelineno-0-158"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-159"><a id="__codelineno-0-159" name="__codelineno-0-159"></a><span class="sd">            msg: The message to preprocess.</span>
-</span><span id="__span-0-160"><a id="__codelineno-0-160" name="__codelineno-0-160"></a>
-</span><span id="__span-0-161"><a id="__codelineno-0-161" name="__codelineno-0-161"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-162"><a id="__codelineno-0-162" name="__codelineno-0-162"></a><span class="sd">            A tuple containing the original message, the tokenized message, and a list of the values replaced by regexes.</span>
-</span><span id="__span-0-163"><a id="__codelineno-0-163" name="__codelineno-0-163"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-164"><a id="__codelineno-0-164" name="__codelineno-0-164"></a>
-</span><span id="__span-0-165"><a id="__codelineno-0-165" name="__codelineno-0-165"></a>        <span class="n">msg</span> <span class="o">=</span> <span class="n">msg</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
+</span><span id="__span-0-110"><a id="__codelineno-0-110" name="__codelineno-0-110"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_postprocess</span><span class="p">()</span>
+</span><span id="__span-0-111"><a id="__codelineno-0-111" name="__codelineno-0-111"></a>
+</span><span id="__span-0-112"><a id="__codelineno-0-112" name="__codelineno-0-112"></a>    <span class="k">def</span> <span class="nf">_to_df</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">log_file</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
+</span><span id="__span-0-113"><a id="__codelineno-0-113" name="__codelineno-0-113"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-114"><a id="__codelineno-0-114" name="__codelineno-0-114"></a><span class="sd">        Transform a log file into a dataframe.</span>
+</span><span id="__span-0-115"><a id="__codelineno-0-115" name="__codelineno-0-115"></a>
+</span><span id="__span-0-116"><a id="__codelineno-0-116" name="__codelineno-0-116"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-117"><a id="__codelineno-0-117" name="__codelineno-0-117"></a><span class="sd">            log_file: The path to the log file.</span>
+</span><span id="__span-0-118"><a id="__codelineno-0-118" name="__codelineno-0-118"></a>
+</span><span id="__span-0-119"><a id="__codelineno-0-119" name="__codelineno-0-119"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-120"><a id="__codelineno-0-120" name="__codelineno-0-120"></a><span class="sd">            A dataframe containing the log file&#39;s lines, tokenized and with regexes replaced.</span>
+</span><span id="__span-0-121"><a id="__codelineno-0-121" name="__codelineno-0-121"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-122"><a id="__codelineno-0-122" name="__codelineno-0-122"></a>
+</span><span id="__span-0-123"><a id="__codelineno-0-123" name="__codelineno-0-123"></a>        <span class="n">log_messages</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-124"><a id="__codelineno-0-124" name="__codelineno-0-124"></a>        <span class="n">linecount</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="__span-0-125"><a id="__codelineno-0-125" name="__codelineno-0-125"></a>
+</span><span id="__span-0-126"><a id="__codelineno-0-126" name="__codelineno-0-126"></a>        <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="n">log_file</span><span class="p">,</span> <span class="s2">&quot;r&quot;</span><span class="p">)</span> <span class="k">as</span> <span class="n">f</span><span class="p">:</span>
+</span><span id="__span-0-127"><a id="__codelineno-0-127" name="__codelineno-0-127"></a>            <span class="n">log_message</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-128"><a id="__codelineno-0-128" name="__codelineno-0-128"></a>
+</span><span id="__span-0-129"><a id="__codelineno-0-129" name="__codelineno-0-129"></a>            <span class="k">for</span> <span class="n">line</span> <span class="ow">in</span> <span class="n">tqdm</span><span class="p">(</span><span class="n">f</span><span class="o">.</span><span class="n">readlines</span><span class="p">(),</span> <span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Reading and tokenizing log lines...&quot;</span><span class="p">):</span>
+</span><span id="__span-0-130"><a id="__codelineno-0-130" name="__codelineno-0-130"></a>                <span class="n">line</span> <span class="o">=</span> <span class="n">line</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
+</span><span id="__span-0-131"><a id="__codelineno-0-131" name="__codelineno-0-131"></a>
+</span><span id="__span-0-132"><a id="__codelineno-0-132" name="__codelineno-0-132"></a>                <span class="k">if</span> <span class="n">re</span><span class="o">.</span><span class="n">match</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">message_prefix</span><span class="p">,</span> <span class="n">line</span><span class="p">):</span>
+</span><span id="__span-0-133"><a id="__codelineno-0-133" name="__codelineno-0-133"></a>                    <span class="k">if</span> <span class="n">log_message</span><span class="p">:</span>
+</span><span id="__span-0-134"><a id="__codelineno-0-134" name="__codelineno-0-134"></a>                        <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-135"><a id="__codelineno-0-135" name="__codelineno-0-135"></a>                            <span class="n">log_messages</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_preprocess</span><span class="p">(</span><span class="n">log_message</span><span class="p">))</span>
+</span><span id="__span-0-136"><a id="__codelineno-0-136" name="__codelineno-0-136"></a>                            <span class="n">linecount</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="__span-0-137"><a id="__codelineno-0-137" name="__codelineno-0-137"></a>                        <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-138"><a id="__codelineno-0-138" name="__codelineno-0-138"></a>                            <span class="k">raise</span> <span class="ne">ValueError</span>
+</span><span id="__span-0-139"><a id="__codelineno-0-139" name="__codelineno-0-139"></a>                    <span class="n">log_message</span> <span class="o">=</span> <span class="n">line</span>
+</span><span id="__span-0-140"><a id="__codelineno-0-140" name="__codelineno-0-140"></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-141"><a id="__codelineno-0-141" name="__codelineno-0-141"></a>                    <span class="n">log_message</span> <span class="o">+=</span> <span class="s2">&quot; &quot;</span> <span class="o">+</span> <span class="n">line</span>
+</span><span id="__span-0-142"><a id="__codelineno-0-142" name="__codelineno-0-142"></a>
+</span><span id="__span-0-143"><a id="__codelineno-0-143" name="__codelineno-0-143"></a>            <span class="k">if</span> <span class="n">log_message</span><span class="p">:</span>
+</span><span id="__span-0-144"><a id="__codelineno-0-144" name="__codelineno-0-144"></a>                <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-145"><a id="__codelineno-0-145" name="__codelineno-0-145"></a>                    <span class="n">log_messages</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_preprocess</span><span class="p">(</span><span class="n">log_message</span><span class="p">))</span>
+</span><span id="__span-0-146"><a id="__codelineno-0-146" name="__codelineno-0-146"></a>                    <span class="n">linecount</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="__span-0-147"><a id="__codelineno-0-147" name="__codelineno-0-147"></a>                <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-148"><a id="__codelineno-0-148" name="__codelineno-0-148"></a>                    <span class="k">raise</span> <span class="ne">ValueError</span>
+</span><span id="__span-0-149"><a id="__codelineno-0-149" name="__codelineno-0-149"></a>
+</span><span id="__span-0-150"><a id="__codelineno-0-150" name="__codelineno-0-150"></a>        <span class="n">logdf</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span>
+</span><span id="__span-0-151"><a id="__codelineno-0-151" name="__codelineno-0-151"></a>            <span class="n">log_messages</span><span class="p">,</span> <span class="n">columns</span><span class="o">=</span><span class="p">[</span><span class="s2">&quot;Message&quot;</span><span class="p">,</span> <span class="s2">&quot;Tokenized&quot;</span><span class="p">,</span> <span class="s2">&quot;Replaced by regex&quot;</span><span class="p">]</span>
+</span><span id="__span-0-152"><a id="__codelineno-0-152" name="__codelineno-0-152"></a>        <span class="p">)</span>
+</span><span id="__span-0-153"><a id="__codelineno-0-153" name="__codelineno-0-153"></a>        <span class="n">logdf</span><span class="p">[</span><span class="s2">&quot;MsgId&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">logdf</span><span class="p">))</span>
+</span><span id="__span-0-154"><a id="__codelineno-0-154" name="__codelineno-0-154"></a>        <span class="k">return</span> <span class="n">logdf</span>
+</span><span id="__span-0-155"><a id="__codelineno-0-155" name="__codelineno-0-155"></a>
+</span><span id="__span-0-156"><a id="__codelineno-0-156" name="__codelineno-0-156"></a>    <span class="k">def</span> <span class="nf">_preprocess</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">msg</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
+</span><span id="__span-0-157"><a id="__codelineno-0-157" name="__codelineno-0-157"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-158"><a id="__codelineno-0-158" name="__codelineno-0-158"></a><span class="sd">        Preprocess a message of a log file.</span>
+</span><span id="__span-0-159"><a id="__codelineno-0-159" name="__codelineno-0-159"></a>
+</span><span id="__span-0-160"><a id="__codelineno-0-160" name="__codelineno-0-160"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-161"><a id="__codelineno-0-161" name="__codelineno-0-161"></a><span class="sd">            msg: The message to preprocess.</span>
+</span><span id="__span-0-162"><a id="__codelineno-0-162" name="__codelineno-0-162"></a>
+</span><span id="__span-0-163"><a id="__codelineno-0-163" name="__codelineno-0-163"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-164"><a id="__codelineno-0-164" name="__codelineno-0-164"></a><span class="sd">            A tuple containing the original message, the tokenized message, and a list of the values replaced by regexes.</span>
+</span><span id="__span-0-165"><a id="__codelineno-0-165" name="__codelineno-0-165"></a><span class="sd">        &quot;&quot;&quot;</span>
 </span><span id="__span-0-166"><a id="__codelineno-0-166" name="__codelineno-0-166"></a>
-</span><span id="__span-0-167"><a id="__codelineno-0-167" name="__codelineno-0-167"></a>        <span class="n">regex_matches</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-168"><a id="__codelineno-0-168" name="__codelineno-0-168"></a>        <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">rex</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">rex</span><span class="o">.</span><span class="n">values</span><span class="p">()):</span>
-</span><span id="__span-0-169"><a id="__codelineno-0-169" name="__codelineno-0-169"></a>            <span class="n">matches</span> <span class="o">=</span> <span class="n">re</span><span class="o">.</span><span class="n">findall</span><span class="p">(</span><span class="n">rex</span><span class="p">,</span> <span class="n">msg</span><span class="p">)</span>  <span class="c1">##### ASSUMPTION: only 1 match of interest</span>
-</span><span id="__span-0-170"><a id="__codelineno-0-170" name="__codelineno-0-170"></a>            <span class="n">regex_matches</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">matches</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="k">if</span> <span class="n">matches</span> <span class="k">else</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
-</span><span id="__span-0-171"><a id="__codelineno-0-171" name="__codelineno-0-171"></a>            <span class="n">msg</span> <span class="o">=</span> <span class="n">re</span><span class="o">.</span><span class="n">sub</span><span class="p">(</span><span class="n">rex</span><span class="p">,</span> <span class="s2">&quot;&lt;*&quot;</span> <span class="o">+</span> <span class="nb">str</span><span class="p">(</span><span class="n">i</span><span class="p">)</span> <span class="o">+</span> <span class="s2">&quot;&gt;&quot;</span><span class="p">,</span> <span class="n">msg</span><span class="p">,</span> <span class="n">count</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="__span-0-172"><a id="__codelineno-0-172" name="__codelineno-0-172"></a>
-</span><span id="__span-0-173"><a id="__codelineno-0-173" name="__codelineno-0-173"></a>        <span class="n">pattern</span> <span class="o">=</span> <span class="sa">r</span><span class="s1">&#39;([=,\{\}\[\]\(\);&quot;</span><span class="se">\&#39;</span><span class="s1">])&#39;</span>  <span class="c1"># Add spaces around punctuation</span>
-</span><span id="__span-0-174"><a id="__codelineno-0-174" name="__codelineno-0-174"></a>        <span class="n">msg</span> <span class="o">=</span> <span class="n">re</span><span class="o">.</span><span class="n">sub</span><span class="p">(</span><span class="n">pattern</span><span class="p">,</span> <span class="sa">r</span><span class="s2">&quot; \1 &quot;</span><span class="p">,</span> <span class="n">msg</span><span class="p">)</span>
-</span><span id="__span-0-175"><a id="__codelineno-0-175" name="__codelineno-0-175"></a>        <span class="n">pattern</span> <span class="o">=</span> <span class="sa">r</span><span class="s2">&quot;(?&lt;=\D):|:(?=\D)&quot;</span>  <span class="c1"># Colons not in timestamps</span>
-</span><span id="__span-0-176"><a id="__codelineno-0-176" name="__codelineno-0-176"></a>        <span class="n">msg</span> <span class="o">=</span> <span class="n">re</span><span class="o">.</span><span class="n">sub</span><span class="p">(</span><span class="n">pattern</span><span class="p">,</span> <span class="s2">&quot; : &quot;</span><span class="p">,</span> <span class="n">msg</span><span class="p">)</span>
-</span><span id="__span-0-177"><a id="__codelineno-0-177" name="__codelineno-0-177"></a>
-</span><span id="__span-0-178"><a id="__codelineno-0-178" name="__codelineno-0-178"></a>        <span class="k">return</span> <span class="p">(</span><span class="n">msg</span><span class="p">,</span> <span class="n">msg</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span><span class="o">.</span><span class="n">split</span><span class="p">(),</span> <span class="n">regex_matches</span><span class="p">)</span>
+</span><span id="__span-0-167"><a id="__codelineno-0-167" name="__codelineno-0-167"></a>        <span class="n">msg</span> <span class="o">=</span> <span class="n">msg</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
+</span><span id="__span-0-168"><a id="__codelineno-0-168" name="__codelineno-0-168"></a>
+</span><span id="__span-0-169"><a id="__codelineno-0-169" name="__codelineno-0-169"></a>        <span class="n">regex_matches</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-170"><a id="__codelineno-0-170" name="__codelineno-0-170"></a>        <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">rex</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">rex</span><span class="o">.</span><span class="n">values</span><span class="p">()):</span>
+</span><span id="__span-0-171"><a id="__codelineno-0-171" name="__codelineno-0-171"></a>            <span class="n">matches</span> <span class="o">=</span> <span class="n">re</span><span class="o">.</span><span class="n">findall</span><span class="p">(</span><span class="n">rex</span><span class="p">,</span> <span class="n">msg</span><span class="p">)</span>  <span class="c1">##### ASSUMPTION: only 1 match of interest</span>
+</span><span id="__span-0-172"><a id="__codelineno-0-172" name="__codelineno-0-172"></a>            <span class="n">regex_matches</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">matches</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="k">if</span> <span class="n">matches</span> <span class="k">else</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-173"><a id="__codelineno-0-173" name="__codelineno-0-173"></a>            <span class="n">msg</span> <span class="o">=</span> <span class="n">re</span><span class="o">.</span><span class="n">sub</span><span class="p">(</span><span class="n">rex</span><span class="p">,</span> <span class="s2">&quot;&lt;*&quot;</span> <span class="o">+</span> <span class="nb">str</span><span class="p">(</span><span class="n">i</span><span class="p">)</span> <span class="o">+</span> <span class="s2">&quot;&gt;&quot;</span><span class="p">,</span> <span class="n">msg</span><span class="p">,</span> <span class="n">count</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="__span-0-174"><a id="__codelineno-0-174" name="__codelineno-0-174"></a>
+</span><span id="__span-0-175"><a id="__codelineno-0-175" name="__codelineno-0-175"></a>        <span class="n">pattern</span> <span class="o">=</span> <span class="sa">r</span><span class="s1">&#39;([=,\{\}\[\]\(\);&quot;</span><span class="se">\&#39;</span><span class="s1">])&#39;</span>  <span class="c1"># Add spaces around punctuation</span>
+</span><span id="__span-0-176"><a id="__codelineno-0-176" name="__codelineno-0-176"></a>        <span class="n">msg</span> <span class="o">=</span> <span class="n">re</span><span class="o">.</span><span class="n">sub</span><span class="p">(</span><span class="n">pattern</span><span class="p">,</span> <span class="sa">r</span><span class="s2">&quot; \1 &quot;</span><span class="p">,</span> <span class="n">msg</span><span class="p">)</span>
+</span><span id="__span-0-177"><a id="__codelineno-0-177" name="__codelineno-0-177"></a>        <span class="n">pattern</span> <span class="o">=</span> <span class="sa">r</span><span class="s2">&quot;(?&lt;=\D):|:(?=\D)&quot;</span>  <span class="c1"># Colons not in timestamps</span>
+</span><span id="__span-0-178"><a id="__codelineno-0-178" name="__codelineno-0-178"></a>        <span class="n">msg</span> <span class="o">=</span> <span class="n">re</span><span class="o">.</span><span class="n">sub</span><span class="p">(</span><span class="n">pattern</span><span class="p">,</span> <span class="s2">&quot; : &quot;</span><span class="p">,</span> <span class="n">msg</span><span class="p">)</span>
 </span><span id="__span-0-179"><a id="__codelineno-0-179" name="__codelineno-0-179"></a>
-</span><span id="__span-0-180"><a id="__codelineno-0-180" name="__codelineno-0-180"></a>    <span class="k">def</span> <span class="nf">_parse_message</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">msg</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-181"><a id="__codelineno-0-181" name="__codelineno-0-181"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-182"><a id="__codelineno-0-182" name="__codelineno-0-182"></a><span class="sd">        Parse a single log message and add it to the Drain parse tree in the appropriate cluster.</span>
-</span><span id="__span-0-183"><a id="__codelineno-0-183" name="__codelineno-0-183"></a>
-</span><span id="__span-0-184"><a id="__codelineno-0-184" name="__codelineno-0-184"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-185"><a id="__codelineno-0-185" name="__codelineno-0-185"></a><span class="sd">            msg: The log message to parse.</span>
-</span><span id="__span-0-186"><a id="__codelineno-0-186" name="__codelineno-0-186"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-187"><a id="__codelineno-0-187" name="__codelineno-0-187"></a>
-</span><span id="__span-0-188"><a id="__codelineno-0-188" name="__codelineno-0-188"></a>        <span class="n">line_id</span> <span class="o">=</span> <span class="n">msg</span><span class="p">[</span><span class="s2">&quot;MsgId&quot;</span><span class="p">]</span>
-</span><span id="__span-0-189"><a id="__codelineno-0-189" name="__codelineno-0-189"></a>        <span class="n">tokenized</span> <span class="o">=</span> <span class="n">msg</span><span class="p">[</span><span class="s2">&quot;Tokenized&quot;</span><span class="p">]</span>
-</span><span id="__span-0-190"><a id="__codelineno-0-190" name="__codelineno-0-190"></a>        <span class="n">cluster</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_tree_search</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">root</span><span class="p">,</span> <span class="n">tokenized</span><span class="p">)</span>
-</span><span id="__span-0-191"><a id="__codelineno-0-191" name="__codelineno-0-191"></a>
-</span><span id="__span-0-192"><a id="__codelineno-0-192" name="__codelineno-0-192"></a>        <span class="k">if</span> <span class="n">cluster</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-193"><a id="__codelineno-0-193" name="__codelineno-0-193"></a>            <span class="n">new_cluster</span> <span class="o">=</span> <span class="n">Cluster</span><span class="p">(</span><span class="n">template</span><span class="o">=</span><span class="n">tokenized</span><span class="p">,</span> <span class="n">message_ids</span><span class="o">=</span><span class="p">[</span><span class="n">line_id</span><span class="p">])</span>
-</span><span id="__span-0-194"><a id="__codelineno-0-194" name="__codelineno-0-194"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">cluster_list</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">new_cluster</span><span class="p">)</span>
-</span><span id="__span-0-195"><a id="__codelineno-0-195" name="__codelineno-0-195"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_add_cluster_to_tree</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">root</span><span class="p">,</span> <span class="n">new_cluster</span><span class="p">)</span>
-</span><span id="__span-0-196"><a id="__codelineno-0-196" name="__codelineno-0-196"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-197"><a id="__codelineno-0-197" name="__codelineno-0-197"></a>            <span class="n">new_template</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_updated_template</span><span class="p">(</span><span class="n">tokenized</span><span class="p">,</span> <span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="p">)</span>
-</span><span id="__span-0-198"><a id="__codelineno-0-198" name="__codelineno-0-198"></a>            <span class="n">cluster</span><span class="o">.</span><span class="n">message_ids</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">line_id</span><span class="p">)</span>
-</span><span id="__span-0-199"><a id="__codelineno-0-199" name="__codelineno-0-199"></a>            <span class="k">if</span> <span class="s2">&quot; &quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">new_template</span><span class="p">)</span> <span class="o">!=</span> <span class="s2">&quot; &quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="p">):</span>
-</span><span id="__span-0-200"><a id="__codelineno-0-200" name="__codelineno-0-200"></a>                <span class="n">cluster</span><span class="o">.</span><span class="n">template</span> <span class="o">=</span> <span class="n">new_template</span>
-</span><span id="__span-0-201"><a id="__codelineno-0-201" name="__codelineno-0-201"></a>
-</span><span id="__span-0-202"><a id="__codelineno-0-202" name="__codelineno-0-202"></a>    <span class="k">def</span> <span class="nf">_tree_search</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">root</span><span class="p">:</span> <span class="n">Node</span><span class="p">,</span> <span class="n">tokenized</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="n">Cluster</span><span class="p">]:</span>
-</span><span id="__span-0-203"><a id="__codelineno-0-203" name="__codelineno-0-203"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-204"><a id="__codelineno-0-204" name="__codelineno-0-204"></a><span class="sd">        Search the Drain parse tree for a cluster matching `tokenized`.</span>
-</span><span id="__span-0-205"><a id="__codelineno-0-205" name="__codelineno-0-205"></a>
-</span><span id="__span-0-206"><a id="__codelineno-0-206" name="__codelineno-0-206"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-207"><a id="__codelineno-0-207" name="__codelineno-0-207"></a><span class="sd">            root: The root of the Drain parse tree.</span>
-</span><span id="__span-0-208"><a id="__codelineno-0-208" name="__codelineno-0-208"></a><span class="sd">            tokenized: The tokenized log message to search for.</span>
-</span><span id="__span-0-209"><a id="__codelineno-0-209" name="__codelineno-0-209"></a>
-</span><span id="__span-0-210"><a id="__codelineno-0-210" name="__codelineno-0-210"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-211"><a id="__codelineno-0-211" name="__codelineno-0-211"></a><span class="sd">            The cluster in the Drain parse tree that matches `tokenized`,</span>
-</span><span id="__span-0-212"><a id="__codelineno-0-212" name="__codelineno-0-212"></a><span class="sd">            or None if no such cluster exists.</span>
-</span><span id="__span-0-213"><a id="__codelineno-0-213" name="__codelineno-0-213"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-214"><a id="__codelineno-0-214" name="__codelineno-0-214"></a>
-</span><span id="__span-0-215"><a id="__codelineno-0-215" name="__codelineno-0-215"></a>        <span class="n">num_toks</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">tokenized</span><span class="p">)</span>
-</span><span id="__span-0-216"><a id="__codelineno-0-216" name="__codelineno-0-216"></a>        <span class="k">if</span> <span class="n">num_toks</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">root</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
-</span><span id="__span-0-217"><a id="__codelineno-0-217" name="__codelineno-0-217"></a>            <span class="k">return</span> <span class="kc">None</span>
-</span><span id="__span-0-218"><a id="__codelineno-0-218" name="__codelineno-0-218"></a>
-</span><span id="__span-0-219"><a id="__codelineno-0-219" name="__codelineno-0-219"></a>        <span class="n">node</span> <span class="o">=</span> <span class="n">root</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">num_toks</span><span class="p">]</span>
+</span><span id="__span-0-180"><a id="__codelineno-0-180" name="__codelineno-0-180"></a>        <span class="k">return</span> <span class="p">(</span><span class="n">msg</span><span class="p">,</span> <span class="n">msg</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span><span class="o">.</span><span class="n">split</span><span class="p">(),</span> <span class="n">regex_matches</span><span class="p">)</span>
+</span><span id="__span-0-181"><a id="__codelineno-0-181" name="__codelineno-0-181"></a>
+</span><span id="__span-0-182"><a id="__codelineno-0-182" name="__codelineno-0-182"></a>    <span class="k">def</span> <span class="nf">_parse_message</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">msg</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-183"><a id="__codelineno-0-183" name="__codelineno-0-183"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-184"><a id="__codelineno-0-184" name="__codelineno-0-184"></a><span class="sd">        Parse a single log message and add it to the Drain parse tree in the appropriate cluster.</span>
+</span><span id="__span-0-185"><a id="__codelineno-0-185" name="__codelineno-0-185"></a>
+</span><span id="__span-0-186"><a id="__codelineno-0-186" name="__codelineno-0-186"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-187"><a id="__codelineno-0-187" name="__codelineno-0-187"></a><span class="sd">            msg: The log message to parse.</span>
+</span><span id="__span-0-188"><a id="__codelineno-0-188" name="__codelineno-0-188"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-189"><a id="__codelineno-0-189" name="__codelineno-0-189"></a>
+</span><span id="__span-0-190"><a id="__codelineno-0-190" name="__codelineno-0-190"></a>        <span class="n">line_id</span> <span class="o">=</span> <span class="n">msg</span><span class="p">[</span><span class="s2">&quot;MsgId&quot;</span><span class="p">]</span>
+</span><span id="__span-0-191"><a id="__codelineno-0-191" name="__codelineno-0-191"></a>        <span class="n">tokenized</span> <span class="o">=</span> <span class="n">msg</span><span class="p">[</span><span class="s2">&quot;Tokenized&quot;</span><span class="p">]</span>
+</span><span id="__span-0-192"><a id="__codelineno-0-192" name="__codelineno-0-192"></a>        <span class="n">cluster</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_tree_search</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">root</span><span class="p">,</span> <span class="n">tokenized</span><span class="p">)</span>
+</span><span id="__span-0-193"><a id="__codelineno-0-193" name="__codelineno-0-193"></a>
+</span><span id="__span-0-194"><a id="__codelineno-0-194" name="__codelineno-0-194"></a>        <span class="k">if</span> <span class="n">cluster</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-195"><a id="__codelineno-0-195" name="__codelineno-0-195"></a>            <span class="n">new_cluster</span> <span class="o">=</span> <span class="n">Cluster</span><span class="p">(</span><span class="n">template</span><span class="o">=</span><span class="n">tokenized</span><span class="p">,</span> <span class="n">message_ids</span><span class="o">=</span><span class="p">[</span><span class="n">line_id</span><span class="p">])</span>
+</span><span id="__span-0-196"><a id="__codelineno-0-196" name="__codelineno-0-196"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">cluster_list</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">new_cluster</span><span class="p">)</span>
+</span><span id="__span-0-197"><a id="__codelineno-0-197" name="__codelineno-0-197"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_add_cluster_to_tree</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">root</span><span class="p">,</span> <span class="n">new_cluster</span><span class="p">)</span>
+</span><span id="__span-0-198"><a id="__codelineno-0-198" name="__codelineno-0-198"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-199"><a id="__codelineno-0-199" name="__codelineno-0-199"></a>            <span class="n">new_template</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_updated_template</span><span class="p">(</span><span class="n">tokenized</span><span class="p">,</span> <span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="p">)</span>
+</span><span id="__span-0-200"><a id="__codelineno-0-200" name="__codelineno-0-200"></a>            <span class="n">cluster</span><span class="o">.</span><span class="n">message_ids</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">line_id</span><span class="p">)</span>
+</span><span id="__span-0-201"><a id="__codelineno-0-201" name="__codelineno-0-201"></a>            <span class="k">if</span> <span class="s2">&quot; &quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">new_template</span><span class="p">)</span> <span class="o">!=</span> <span class="s2">&quot; &quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="p">):</span>
+</span><span id="__span-0-202"><a id="__codelineno-0-202" name="__codelineno-0-202"></a>                <span class="n">cluster</span><span class="o">.</span><span class="n">template</span> <span class="o">=</span> <span class="n">new_template</span>
+</span><span id="__span-0-203"><a id="__codelineno-0-203" name="__codelineno-0-203"></a>
+</span><span id="__span-0-204"><a id="__codelineno-0-204" name="__codelineno-0-204"></a>    <span class="k">def</span> <span class="nf">_tree_search</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">root</span><span class="p">:</span> <span class="n">Node</span><span class="p">,</span> <span class="n">tokenized</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="n">Cluster</span><span class="p">]:</span>
+</span><span id="__span-0-205"><a id="__codelineno-0-205" name="__codelineno-0-205"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-206"><a id="__codelineno-0-206" name="__codelineno-0-206"></a><span class="sd">        Search the Drain parse tree for a cluster matching `tokenized`.</span>
+</span><span id="__span-0-207"><a id="__codelineno-0-207" name="__codelineno-0-207"></a>
+</span><span id="__span-0-208"><a id="__codelineno-0-208" name="__codelineno-0-208"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-209"><a id="__codelineno-0-209" name="__codelineno-0-209"></a><span class="sd">            root: The root of the Drain parse tree.</span>
+</span><span id="__span-0-210"><a id="__codelineno-0-210" name="__codelineno-0-210"></a><span class="sd">            tokenized: The tokenized log message to search for.</span>
+</span><span id="__span-0-211"><a id="__codelineno-0-211" name="__codelineno-0-211"></a>
+</span><span id="__span-0-212"><a id="__codelineno-0-212" name="__codelineno-0-212"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-213"><a id="__codelineno-0-213" name="__codelineno-0-213"></a><span class="sd">            The cluster in the Drain parse tree that matches `tokenized`,</span>
+</span><span id="__span-0-214"><a id="__codelineno-0-214" name="__codelineno-0-214"></a><span class="sd">            or None if no such cluster exists.</span>
+</span><span id="__span-0-215"><a id="__codelineno-0-215" name="__codelineno-0-215"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-216"><a id="__codelineno-0-216" name="__codelineno-0-216"></a>
+</span><span id="__span-0-217"><a id="__codelineno-0-217" name="__codelineno-0-217"></a>        <span class="n">num_toks</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">tokenized</span><span class="p">)</span>
+</span><span id="__span-0-218"><a id="__codelineno-0-218" name="__codelineno-0-218"></a>        <span class="k">if</span> <span class="n">num_toks</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">root</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
+</span><span id="__span-0-219"><a id="__codelineno-0-219" name="__codelineno-0-219"></a>            <span class="k">return</span> <span class="kc">None</span>
 </span><span id="__span-0-220"><a id="__codelineno-0-220" name="__codelineno-0-220"></a>
-</span><span id="__span-0-221"><a id="__codelineno-0-221" name="__codelineno-0-221"></a>        <span class="n">depth</span> <span class="o">=</span> <span class="mi">1</span>
-</span><span id="__span-0-222"><a id="__codelineno-0-222" name="__codelineno-0-222"></a>        <span class="k">for</span> <span class="n">token</span> <span class="ow">in</span> <span class="n">tokenized</span><span class="p">:</span>
-</span><span id="__span-0-223"><a id="__codelineno-0-223" name="__codelineno-0-223"></a>            <span class="k">if</span> <span class="n">depth</span> <span class="o">&gt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">depth</span> <span class="ow">or</span> <span class="n">depth</span> <span class="o">&gt;</span> <span class="n">num_toks</span><span class="p">:</span>
-</span><span id="__span-0-224"><a id="__codelineno-0-224" name="__codelineno-0-224"></a>                <span class="k">break</span>
-</span><span id="__span-0-225"><a id="__codelineno-0-225" name="__codelineno-0-225"></a>            <span class="k">if</span> <span class="n">token</span> <span class="ow">in</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
-</span><span id="__span-0-226"><a id="__codelineno-0-226" name="__codelineno-0-226"></a>                <span class="n">node</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">token</span><span class="p">]</span>
-</span><span id="__span-0-227"><a id="__codelineno-0-227" name="__codelineno-0-227"></a>            <span class="k">elif</span> <span class="s2">&quot;&lt;*&gt;&quot;</span> <span class="ow">in</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
-</span><span id="__span-0-228"><a id="__codelineno-0-228" name="__codelineno-0-228"></a>                <span class="n">node</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">]</span>
-</span><span id="__span-0-229"><a id="__codelineno-0-229" name="__codelineno-0-229"></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-230"><a id="__codelineno-0-230" name="__codelineno-0-230"></a>                <span class="k">return</span> <span class="kc">None</span>
-</span><span id="__span-0-231"><a id="__codelineno-0-231" name="__codelineno-0-231"></a>            <span class="n">depth</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="__span-0-232"><a id="__codelineno-0-232" name="__codelineno-0-232"></a>
-</span><span id="__span-0-233"><a id="__codelineno-0-233" name="__codelineno-0-233"></a>        <span class="n">cluster_list</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span>
-</span><span id="__span-0-234"><a id="__codelineno-0-234" name="__codelineno-0-234"></a>        <span class="n">returned_cluster</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_find_cluster</span><span class="p">(</span><span class="n">cluster_list</span><span class="p">,</span> <span class="n">tokenized</span><span class="p">)</span>
-</span><span id="__span-0-235"><a id="__codelineno-0-235" name="__codelineno-0-235"></a>
-</span><span id="__span-0-236"><a id="__codelineno-0-236" name="__codelineno-0-236"></a>        <span class="k">return</span> <span class="n">returned_cluster</span>
+</span><span id="__span-0-221"><a id="__codelineno-0-221" name="__codelineno-0-221"></a>        <span class="n">node</span> <span class="o">=</span> <span class="n">root</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">num_toks</span><span class="p">]</span>
+</span><span id="__span-0-222"><a id="__codelineno-0-222" name="__codelineno-0-222"></a>
+</span><span id="__span-0-223"><a id="__codelineno-0-223" name="__codelineno-0-223"></a>        <span class="n">depth</span> <span class="o">=</span> <span class="mi">1</span>
+</span><span id="__span-0-224"><a id="__codelineno-0-224" name="__codelineno-0-224"></a>        <span class="k">for</span> <span class="n">token</span> <span class="ow">in</span> <span class="n">tokenized</span><span class="p">:</span>
+</span><span id="__span-0-225"><a id="__codelineno-0-225" name="__codelineno-0-225"></a>            <span class="k">if</span> <span class="n">depth</span> <span class="o">&gt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">depth</span> <span class="ow">or</span> <span class="n">depth</span> <span class="o">&gt;</span> <span class="n">num_toks</span><span class="p">:</span>
+</span><span id="__span-0-226"><a id="__codelineno-0-226" name="__codelineno-0-226"></a>                <span class="k">break</span>
+</span><span id="__span-0-227"><a id="__codelineno-0-227" name="__codelineno-0-227"></a>            <span class="k">if</span> <span class="n">token</span> <span class="ow">in</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
+</span><span id="__span-0-228"><a id="__codelineno-0-228" name="__codelineno-0-228"></a>                <span class="n">node</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">token</span><span class="p">]</span>
+</span><span id="__span-0-229"><a id="__codelineno-0-229" name="__codelineno-0-229"></a>            <span class="k">elif</span> <span class="s2">&quot;&lt;*&gt;&quot;</span> <span class="ow">in</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
+</span><span id="__span-0-230"><a id="__codelineno-0-230" name="__codelineno-0-230"></a>                <span class="n">node</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">]</span>
+</span><span id="__span-0-231"><a id="__codelineno-0-231" name="__codelineno-0-231"></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-232"><a id="__codelineno-0-232" name="__codelineno-0-232"></a>                <span class="k">return</span> <span class="kc">None</span>
+</span><span id="__span-0-233"><a id="__codelineno-0-233" name="__codelineno-0-233"></a>            <span class="n">depth</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="__span-0-234"><a id="__codelineno-0-234" name="__codelineno-0-234"></a>
+</span><span id="__span-0-235"><a id="__codelineno-0-235" name="__codelineno-0-235"></a>        <span class="n">cluster_list</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span>
+</span><span id="__span-0-236"><a id="__codelineno-0-236" name="__codelineno-0-236"></a>        <span class="n">returned_cluster</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_find_cluster</span><span class="p">(</span><span class="n">cluster_list</span><span class="p">,</span> <span class="n">tokenized</span><span class="p">)</span>
 </span><span id="__span-0-237"><a id="__codelineno-0-237" name="__codelineno-0-237"></a>
-</span><span id="__span-0-238"><a id="__codelineno-0-238" name="__codelineno-0-238"></a>    <span class="k">def</span> <span class="nf">_add_cluster_to_tree</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">root</span><span class="p">:</span> <span class="n">Node</span><span class="p">,</span> <span class="n">cluster</span><span class="p">:</span> <span class="n">Cluster</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-239"><a id="__codelineno-0-239" name="__codelineno-0-239"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-240"><a id="__codelineno-0-240" name="__codelineno-0-240"></a><span class="sd">        Add a cluster to the Drain parse tree.</span>
-</span><span id="__span-0-241"><a id="__codelineno-0-241" name="__codelineno-0-241"></a>
-</span><span id="__span-0-242"><a id="__codelineno-0-242" name="__codelineno-0-242"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-243"><a id="__codelineno-0-243" name="__codelineno-0-243"></a><span class="sd">            root: The root of the Drain parse tree.</span>
-</span><span id="__span-0-244"><a id="__codelineno-0-244" name="__codelineno-0-244"></a><span class="sd">            cluster: The cluster to add.</span>
-</span><span id="__span-0-245"><a id="__codelineno-0-245" name="__codelineno-0-245"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-246"><a id="__codelineno-0-246" name="__codelineno-0-246"></a>
-</span><span id="__span-0-247"><a id="__codelineno-0-247" name="__codelineno-0-247"></a>        <span class="c1"># Add a node to the first layer of the tree representing the length of the log message.</span>
-</span><span id="__span-0-248"><a id="__codelineno-0-248" name="__codelineno-0-248"></a>        <span class="n">length</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="p">)</span>
-</span><span id="__span-0-249"><a id="__codelineno-0-249" name="__codelineno-0-249"></a>        <span class="n">first_layer_node</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-250"><a id="__codelineno-0-250" name="__codelineno-0-250"></a>        <span class="k">if</span> <span class="n">length</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">root</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
-</span><span id="__span-0-251"><a id="__codelineno-0-251" name="__codelineno-0-251"></a>            <span class="n">first_layer_node</span> <span class="o">=</span> <span class="n">Node</span><span class="p">(</span><span class="n">depth</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="nb">id</span><span class="o">=</span><span class="n">length</span><span class="p">)</span>
-</span><span id="__span-0-252"><a id="__codelineno-0-252" name="__codelineno-0-252"></a>            <span class="n">root</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">length</span><span class="p">]</span> <span class="o">=</span> <span class="n">first_layer_node</span>
-</span><span id="__span-0-253"><a id="__codelineno-0-253" name="__codelineno-0-253"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-254"><a id="__codelineno-0-254" name="__codelineno-0-254"></a>            <span class="n">first_layer_node</span> <span class="o">=</span> <span class="n">root</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">length</span><span class="p">]</span>
-</span><span id="__span-0-255"><a id="__codelineno-0-255" name="__codelineno-0-255"></a>
-</span><span id="__span-0-256"><a id="__codelineno-0-256" name="__codelineno-0-256"></a>        <span class="c1"># Traverse the tree to add the new cluster.</span>
-</span><span id="__span-0-257"><a id="__codelineno-0-257" name="__codelineno-0-257"></a>        <span class="n">node</span> <span class="o">=</span> <span class="n">first_layer_node</span>
-</span><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a>        <span class="n">depth</span> <span class="o">=</span> <span class="mi">1</span>
-</span><span id="__span-0-259"><a id="__codelineno-0-259" name="__codelineno-0-259"></a>        <span class="k">for</span> <span class="n">token</span> <span class="ow">in</span> <span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="p">:</span>
-</span><span id="__span-0-260"><a id="__codelineno-0-260" name="__codelineno-0-260"></a>            <span class="c1"># If out of depth, add current log cluster to the leaf node</span>
-</span><span id="__span-0-261"><a id="__codelineno-0-261" name="__codelineno-0-261"></a>            <span class="k">if</span> <span class="n">depth</span> <span class="o">&gt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">depth</span> <span class="ow">or</span> <span class="n">depth</span> <span class="o">&gt;</span> <span class="n">length</span><span class="p">:</span>
-</span><span id="__span-0-262"><a id="__codelineno-0-262" name="__codelineno-0-262"></a>                <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-263"><a id="__codelineno-0-263" name="__codelineno-0-263"></a>                    <span class="n">node</span><span class="o">.</span><span class="n">children</span> <span class="o">=</span> <span class="p">[</span><span class="n">cluster</span><span class="p">]</span>
-</span><span id="__span-0-264"><a id="__codelineno-0-264" name="__codelineno-0-264"></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-265"><a id="__codelineno-0-265" name="__codelineno-0-265"></a>                    <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">cluster</span><span class="p">)</span>
-</span><span id="__span-0-266"><a id="__codelineno-0-266" name="__codelineno-0-266"></a>                <span class="k">break</span>
-</span><span id="__span-0-267"><a id="__codelineno-0-267" name="__codelineno-0-267"></a>
-</span><span id="__span-0-268"><a id="__codelineno-0-268" name="__codelineno-0-268"></a>            <span class="c1"># If token not matched in this layer of existing tree.</span>
-</span><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a>            <span class="k">if</span> <span class="n">token</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
-</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a>                <span class="k">if</span> <span class="ow">not</span> <span class="nb">any</span><span class="p">(</span><span class="n">char</span><span class="o">.</span><span class="n">isdigit</span><span class="p">()</span> <span class="k">for</span> <span class="n">char</span> <span class="ow">in</span> <span class="n">token</span><span class="p">):</span>
-</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a>                    <span class="k">if</span> <span class="s2">&quot;&lt;*&gt;&quot;</span> <span class="ow">in</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
-</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a>                        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">)</span> <span class="o">&lt;</span> <span class="bp">self</span><span class="o">.</span><span class="n">max_children</span><span class="p">:</span>
-</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a>                            <span class="n">new_node</span> <span class="o">=</span> <span class="n">Node</span><span class="p">(</span><span class="n">depth</span><span class="o">=</span><span class="n">depth</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">id</span><span class="o">=</span><span class="n">token</span><span class="p">)</span>
-</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a>                            <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">token</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_node</span>
-</span><span id="__span-0-275"><a id="__codelineno-0-275" name="__codelineno-0-275"></a>                            <span class="n">node</span> <span class="o">=</span> <span class="n">new_node</span>
-</span><span id="__span-0-276"><a id="__codelineno-0-276" name="__codelineno-0-276"></a>                        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-277"><a id="__codelineno-0-277" name="__codelineno-0-277"></a>                            <span class="n">node</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">]</span>
-</span><span id="__span-0-278"><a id="__codelineno-0-278" name="__codelineno-0-278"></a>                    <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-279"><a id="__codelineno-0-279" name="__codelineno-0-279"></a>                        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">&lt;</span> <span class="bp">self</span><span class="o">.</span><span class="n">max_children</span><span class="p">:</span>
-</span><span id="__span-0-280"><a id="__codelineno-0-280" name="__codelineno-0-280"></a>                            <span class="n">new_node</span> <span class="o">=</span> <span class="n">Node</span><span class="p">(</span><span class="n">depth</span><span class="o">=</span><span class="n">depth</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">id</span><span class="o">=</span><span class="n">token</span><span class="p">)</span>
-</span><span id="__span-0-281"><a id="__codelineno-0-281" name="__codelineno-0-281"></a>                            <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">token</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_node</span>
-</span><span id="__span-0-282"><a id="__codelineno-0-282" name="__codelineno-0-282"></a>                            <span class="n">node</span> <span class="o">=</span> <span class="n">new_node</span>
-</span><span id="__span-0-283"><a id="__codelineno-0-283" name="__codelineno-0-283"></a>                        <span class="k">elif</span> <span class="nb">len</span><span class="p">(</span><span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">max_children</span><span class="p">:</span>
-</span><span id="__span-0-284"><a id="__codelineno-0-284" name="__codelineno-0-284"></a>                            <span class="n">new_node</span> <span class="o">=</span> <span class="n">Node</span><span class="p">(</span><span class="n">depth</span><span class="o">=</span><span class="n">depth</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">id</span><span class="o">=</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">)</span>
-</span><span id="__span-0-285"><a id="__codelineno-0-285" name="__codelineno-0-285"></a>                            <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_node</span>
-</span><span id="__span-0-286"><a id="__codelineno-0-286" name="__codelineno-0-286"></a>                            <span class="n">node</span> <span class="o">=</span> <span class="n">new_node</span>
-</span><span id="__span-0-287"><a id="__codelineno-0-287" name="__codelineno-0-287"></a>                        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-288"><a id="__codelineno-0-288" name="__codelineno-0-288"></a>                            <span class="n">node</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">]</span>
-</span><span id="__span-0-289"><a id="__codelineno-0-289" name="__codelineno-0-289"></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-290"><a id="__codelineno-0-290" name="__codelineno-0-290"></a>                    <span class="k">if</span> <span class="s2">&quot;&lt;*&gt;&quot;</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
-</span><span id="__span-0-291"><a id="__codelineno-0-291" name="__codelineno-0-291"></a>                        <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">Node</span><span class="p">(</span><span class="n">depth</span><span class="o">=</span><span class="n">depth</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">id</span><span class="o">=</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">)</span>
-</span><span id="__span-0-292"><a id="__codelineno-0-292" name="__codelineno-0-292"></a>                    <span class="n">node</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">]</span>
-</span><span id="__span-0-293"><a id="__codelineno-0-293" name="__codelineno-0-293"></a>
-</span><span id="__span-0-294"><a id="__codelineno-0-294" name="__codelineno-0-294"></a>            <span class="c1"># If the token is matched</span>
-</span><span id="__span-0-295"><a id="__codelineno-0-295" name="__codelineno-0-295"></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-296"><a id="__codelineno-0-296" name="__codelineno-0-296"></a>                <span class="n">node</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">token</span><span class="p">]</span>
-</span><span id="__span-0-297"><a id="__codelineno-0-297" name="__codelineno-0-297"></a>
-</span><span id="__span-0-298"><a id="__codelineno-0-298" name="__codelineno-0-298"></a>            <span class="n">depth</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="__span-0-238"><a id="__codelineno-0-238" name="__codelineno-0-238"></a>        <span class="k">return</span> <span class="n">returned_cluster</span>
+</span><span id="__span-0-239"><a id="__codelineno-0-239" name="__codelineno-0-239"></a>
+</span><span id="__span-0-240"><a id="__codelineno-0-240" name="__codelineno-0-240"></a>    <span class="k">def</span> <span class="nf">_add_cluster_to_tree</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">root</span><span class="p">:</span> <span class="n">Node</span><span class="p">,</span> <span class="n">cluster</span><span class="p">:</span> <span class="n">Cluster</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-241"><a id="__codelineno-0-241" name="__codelineno-0-241"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-242"><a id="__codelineno-0-242" name="__codelineno-0-242"></a><span class="sd">        Add a cluster to the Drain parse tree.</span>
+</span><span id="__span-0-243"><a id="__codelineno-0-243" name="__codelineno-0-243"></a>
+</span><span id="__span-0-244"><a id="__codelineno-0-244" name="__codelineno-0-244"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-245"><a id="__codelineno-0-245" name="__codelineno-0-245"></a><span class="sd">            root: The root of the Drain parse tree.</span>
+</span><span id="__span-0-246"><a id="__codelineno-0-246" name="__codelineno-0-246"></a><span class="sd">            cluster: The cluster to add.</span>
+</span><span id="__span-0-247"><a id="__codelineno-0-247" name="__codelineno-0-247"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-248"><a id="__codelineno-0-248" name="__codelineno-0-248"></a>
+</span><span id="__span-0-249"><a id="__codelineno-0-249" name="__codelineno-0-249"></a>        <span class="c1"># Add a node to the first layer of the tree representing the length of the log message.</span>
+</span><span id="__span-0-250"><a id="__codelineno-0-250" name="__codelineno-0-250"></a>        <span class="n">length</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="p">)</span>
+</span><span id="__span-0-251"><a id="__codelineno-0-251" name="__codelineno-0-251"></a>        <span class="n">first_layer_node</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-252"><a id="__codelineno-0-252" name="__codelineno-0-252"></a>        <span class="k">if</span> <span class="n">length</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">root</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
+</span><span id="__span-0-253"><a id="__codelineno-0-253" name="__codelineno-0-253"></a>            <span class="n">first_layer_node</span> <span class="o">=</span> <span class="n">Node</span><span class="p">(</span><span class="n">depth</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="nb">id</span><span class="o">=</span><span class="n">length</span><span class="p">)</span>
+</span><span id="__span-0-254"><a id="__codelineno-0-254" name="__codelineno-0-254"></a>            <span class="n">root</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">length</span><span class="p">]</span> <span class="o">=</span> <span class="n">first_layer_node</span>
+</span><span id="__span-0-255"><a id="__codelineno-0-255" name="__codelineno-0-255"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-256"><a id="__codelineno-0-256" name="__codelineno-0-256"></a>            <span class="n">first_layer_node</span> <span class="o">=</span> <span class="n">root</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">length</span><span class="p">]</span>
+</span><span id="__span-0-257"><a id="__codelineno-0-257" name="__codelineno-0-257"></a>
+</span><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a>        <span class="c1"># Traverse the tree to add the new cluster.</span>
+</span><span id="__span-0-259"><a id="__codelineno-0-259" name="__codelineno-0-259"></a>        <span class="n">node</span> <span class="o">=</span> <span class="n">first_layer_node</span>
+</span><span id="__span-0-260"><a id="__codelineno-0-260" name="__codelineno-0-260"></a>        <span class="n">depth</span> <span class="o">=</span> <span class="mi">1</span>
+</span><span id="__span-0-261"><a id="__codelineno-0-261" name="__codelineno-0-261"></a>        <span class="k">for</span> <span class="n">token</span> <span class="ow">in</span> <span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="p">:</span>
+</span><span id="__span-0-262"><a id="__codelineno-0-262" name="__codelineno-0-262"></a>            <span class="c1"># If out of depth, add current log cluster to the leaf node</span>
+</span><span id="__span-0-263"><a id="__codelineno-0-263" name="__codelineno-0-263"></a>            <span class="k">if</span> <span class="n">depth</span> <span class="o">&gt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">depth</span> <span class="ow">or</span> <span class="n">depth</span> <span class="o">&gt;</span> <span class="n">length</span><span class="p">:</span>
+</span><span id="__span-0-264"><a id="__codelineno-0-264" name="__codelineno-0-264"></a>                <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-265"><a id="__codelineno-0-265" name="__codelineno-0-265"></a>                    <span class="n">node</span><span class="o">.</span><span class="n">children</span> <span class="o">=</span> <span class="p">[</span><span class="n">cluster</span><span class="p">]</span>
+</span><span id="__span-0-266"><a id="__codelineno-0-266" name="__codelineno-0-266"></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-267"><a id="__codelineno-0-267" name="__codelineno-0-267"></a>                    <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">cluster</span><span class="p">)</span>
+</span><span id="__span-0-268"><a id="__codelineno-0-268" name="__codelineno-0-268"></a>                <span class="k">break</span>
+</span><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a>
+</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a>            <span class="c1"># If token not matched in this layer of existing tree.</span>
+</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a>            <span class="k">if</span> <span class="n">token</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
+</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a>                <span class="k">if</span> <span class="ow">not</span> <span class="nb">any</span><span class="p">(</span><span class="n">char</span><span class="o">.</span><span class="n">isdigit</span><span class="p">()</span> <span class="k">for</span> <span class="n">char</span> <span class="ow">in</span> <span class="n">token</span><span class="p">):</span>
+</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a>                    <span class="k">if</span> <span class="s2">&quot;&lt;*&gt;&quot;</span> <span class="ow">in</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
+</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a>                        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">)</span> <span class="o">&lt;</span> <span class="bp">self</span><span class="o">.</span><span class="n">max_children</span><span class="p">:</span>
+</span><span id="__span-0-275"><a id="__codelineno-0-275" name="__codelineno-0-275"></a>                            <span class="n">new_node</span> <span class="o">=</span> <span class="n">Node</span><span class="p">(</span><span class="n">depth</span><span class="o">=</span><span class="n">depth</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">id</span><span class="o">=</span><span class="n">token</span><span class="p">)</span>
+</span><span id="__span-0-276"><a id="__codelineno-0-276" name="__codelineno-0-276"></a>                            <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">token</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_node</span>
+</span><span id="__span-0-277"><a id="__codelineno-0-277" name="__codelineno-0-277"></a>                            <span class="n">node</span> <span class="o">=</span> <span class="n">new_node</span>
+</span><span id="__span-0-278"><a id="__codelineno-0-278" name="__codelineno-0-278"></a>                        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-279"><a id="__codelineno-0-279" name="__codelineno-0-279"></a>                            <span class="n">node</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">]</span>
+</span><span id="__span-0-280"><a id="__codelineno-0-280" name="__codelineno-0-280"></a>                    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-281"><a id="__codelineno-0-281" name="__codelineno-0-281"></a>                        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">&lt;</span> <span class="bp">self</span><span class="o">.</span><span class="n">max_children</span><span class="p">:</span>
+</span><span id="__span-0-282"><a id="__codelineno-0-282" name="__codelineno-0-282"></a>                            <span class="n">new_node</span> <span class="o">=</span> <span class="n">Node</span><span class="p">(</span><span class="n">depth</span><span class="o">=</span><span class="n">depth</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">id</span><span class="o">=</span><span class="n">token</span><span class="p">)</span>
+</span><span id="__span-0-283"><a id="__codelineno-0-283" name="__codelineno-0-283"></a>                            <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">token</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_node</span>
+</span><span id="__span-0-284"><a id="__codelineno-0-284" name="__codelineno-0-284"></a>                            <span class="n">node</span> <span class="o">=</span> <span class="n">new_node</span>
+</span><span id="__span-0-285"><a id="__codelineno-0-285" name="__codelineno-0-285"></a>                        <span class="k">elif</span> <span class="nb">len</span><span class="p">(</span><span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">max_children</span><span class="p">:</span>
+</span><span id="__span-0-286"><a id="__codelineno-0-286" name="__codelineno-0-286"></a>                            <span class="n">new_node</span> <span class="o">=</span> <span class="n">Node</span><span class="p">(</span><span class="n">depth</span><span class="o">=</span><span class="n">depth</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">id</span><span class="o">=</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-287"><a id="__codelineno-0-287" name="__codelineno-0-287"></a>                            <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_node</span>
+</span><span id="__span-0-288"><a id="__codelineno-0-288" name="__codelineno-0-288"></a>                            <span class="n">node</span> <span class="o">=</span> <span class="n">new_node</span>
+</span><span id="__span-0-289"><a id="__codelineno-0-289" name="__codelineno-0-289"></a>                        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-290"><a id="__codelineno-0-290" name="__codelineno-0-290"></a>                            <span class="n">node</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">]</span>
+</span><span id="__span-0-291"><a id="__codelineno-0-291" name="__codelineno-0-291"></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-292"><a id="__codelineno-0-292" name="__codelineno-0-292"></a>                    <span class="k">if</span> <span class="s2">&quot;&lt;*&gt;&quot;</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
+</span><span id="__span-0-293"><a id="__codelineno-0-293" name="__codelineno-0-293"></a>                        <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">Node</span><span class="p">(</span><span class="n">depth</span><span class="o">=</span><span class="n">depth</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">id</span><span class="o">=</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-294"><a id="__codelineno-0-294" name="__codelineno-0-294"></a>                    <span class="n">node</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">]</span>
+</span><span id="__span-0-295"><a id="__codelineno-0-295" name="__codelineno-0-295"></a>
+</span><span id="__span-0-296"><a id="__codelineno-0-296" name="__codelineno-0-296"></a>            <span class="c1"># If the token is matched</span>
+</span><span id="__span-0-297"><a id="__codelineno-0-297" name="__codelineno-0-297"></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-298"><a id="__codelineno-0-298" name="__codelineno-0-298"></a>                <span class="n">node</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">token</span><span class="p">]</span>
 </span><span id="__span-0-299"><a id="__codelineno-0-299" name="__codelineno-0-299"></a>
-</span><span id="__span-0-300"><a id="__codelineno-0-300" name="__codelineno-0-300"></a>    <span class="k">def</span> <span class="nf">_similarity</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">seq1</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">seq2</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="nb">int</span><span class="p">]:</span>
-</span><span id="__span-0-301"><a id="__codelineno-0-301" name="__codelineno-0-301"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-302"><a id="__codelineno-0-302" name="__codelineno-0-302"></a><span class="sd">        Determine the fraction of tokens in `seq1` that are identical to the corresponding token in `seq2`.</span>
-</span><span id="__span-0-303"><a id="__codelineno-0-303" name="__codelineno-0-303"></a><span class="sd">        Also return the number of parameters in `seq1`.</span>
-</span><span id="__span-0-304"><a id="__codelineno-0-304" name="__codelineno-0-304"></a>
-</span><span id="__span-0-305"><a id="__codelineno-0-305" name="__codelineno-0-305"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-306"><a id="__codelineno-0-306" name="__codelineno-0-306"></a><span class="sd">            seq1: The first sequence.</span>
-</span><span id="__span-0-307"><a id="__codelineno-0-307" name="__codelineno-0-307"></a><span class="sd">            seq2: The second sequence.</span>
-</span><span id="__span-0-308"><a id="__codelineno-0-308" name="__codelineno-0-308"></a>
-</span><span id="__span-0-309"><a id="__codelineno-0-309" name="__codelineno-0-309"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-310"><a id="__codelineno-0-310" name="__codelineno-0-310"></a><span class="sd">            A tuple containing the fraction of identical tokens and the number of parameters in `seq1`.</span>
-</span><span id="__span-0-311"><a id="__codelineno-0-311" name="__codelineno-0-311"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-312"><a id="__codelineno-0-312" name="__codelineno-0-312"></a>        <span class="k">assert</span> <span class="nb">len</span><span class="p">(</span><span class="n">seq1</span><span class="p">)</span> <span class="o">==</span> <span class="nb">len</span><span class="p">(</span><span class="n">seq2</span><span class="p">)</span>
-</span><span id="__span-0-313"><a id="__codelineno-0-313" name="__codelineno-0-313"></a>        <span class="n">matches</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="__span-0-314"><a id="__codelineno-0-314" name="__codelineno-0-314"></a>        <span class="n">num_params</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="__span-0-315"><a id="__codelineno-0-315" name="__codelineno-0-315"></a>
-</span><span id="__span-0-316"><a id="__codelineno-0-316" name="__codelineno-0-316"></a>        <span class="k">for</span> <span class="n">token1</span><span class="p">,</span> <span class="n">token2</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">seq1</span><span class="p">,</span> <span class="n">seq2</span><span class="p">):</span>
-</span><span id="__span-0-317"><a id="__codelineno-0-317" name="__codelineno-0-317"></a>            <span class="k">if</span> <span class="n">token1</span> <span class="o">==</span> <span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">:</span>
-</span><span id="__span-0-318"><a id="__codelineno-0-318" name="__codelineno-0-318"></a>                <span class="n">num_params</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="__span-0-319"><a id="__codelineno-0-319" name="__codelineno-0-319"></a>            <span class="k">if</span> <span class="n">token1</span> <span class="o">==</span> <span class="n">token2</span><span class="p">:</span>
-</span><span id="__span-0-320"><a id="__codelineno-0-320" name="__codelineno-0-320"></a>                <span class="n">matches</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="__span-0-321"><a id="__codelineno-0-321" name="__codelineno-0-321"></a>
-</span><span id="__span-0-322"><a id="__codelineno-0-322" name="__codelineno-0-322"></a>        <span class="n">similarity</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">matches</span><span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">seq1</span><span class="p">)</span>
+</span><span id="__span-0-300"><a id="__codelineno-0-300" name="__codelineno-0-300"></a>            <span class="n">depth</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="__span-0-301"><a id="__codelineno-0-301" name="__codelineno-0-301"></a>
+</span><span id="__span-0-302"><a id="__codelineno-0-302" name="__codelineno-0-302"></a>    <span class="k">def</span> <span class="nf">_similarity</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">seq1</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">seq2</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="nb">int</span><span class="p">]:</span>
+</span><span id="__span-0-303"><a id="__codelineno-0-303" name="__codelineno-0-303"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-304"><a id="__codelineno-0-304" name="__codelineno-0-304"></a><span class="sd">        Determine the fraction of tokens in `seq1` that are identical to the corresponding token in `seq2`.</span>
+</span><span id="__span-0-305"><a id="__codelineno-0-305" name="__codelineno-0-305"></a><span class="sd">        Also return the number of parameters in `seq1`.</span>
+</span><span id="__span-0-306"><a id="__codelineno-0-306" name="__codelineno-0-306"></a>
+</span><span id="__span-0-307"><a id="__codelineno-0-307" name="__codelineno-0-307"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-308"><a id="__codelineno-0-308" name="__codelineno-0-308"></a><span class="sd">            seq1: The first sequence.</span>
+</span><span id="__span-0-309"><a id="__codelineno-0-309" name="__codelineno-0-309"></a><span class="sd">            seq2: The second sequence.</span>
+</span><span id="__span-0-310"><a id="__codelineno-0-310" name="__codelineno-0-310"></a>
+</span><span id="__span-0-311"><a id="__codelineno-0-311" name="__codelineno-0-311"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-312"><a id="__codelineno-0-312" name="__codelineno-0-312"></a><span class="sd">            A tuple containing the fraction of identical tokens and the number of parameters in `seq1`.</span>
+</span><span id="__span-0-313"><a id="__codelineno-0-313" name="__codelineno-0-313"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-314"><a id="__codelineno-0-314" name="__codelineno-0-314"></a>        <span class="k">assert</span> <span class="nb">len</span><span class="p">(</span><span class="n">seq1</span><span class="p">)</span> <span class="o">==</span> <span class="nb">len</span><span class="p">(</span><span class="n">seq2</span><span class="p">)</span>
+</span><span id="__span-0-315"><a id="__codelineno-0-315" name="__codelineno-0-315"></a>        <span class="n">matches</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="__span-0-316"><a id="__codelineno-0-316" name="__codelineno-0-316"></a>        <span class="n">num_params</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="__span-0-317"><a id="__codelineno-0-317" name="__codelineno-0-317"></a>
+</span><span id="__span-0-318"><a id="__codelineno-0-318" name="__codelineno-0-318"></a>        <span class="k">for</span> <span class="n">token1</span><span class="p">,</span> <span class="n">token2</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">seq1</span><span class="p">,</span> <span class="n">seq2</span><span class="p">):</span>
+</span><span id="__span-0-319"><a id="__codelineno-0-319" name="__codelineno-0-319"></a>            <span class="k">if</span> <span class="n">token1</span> <span class="o">==</span> <span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">:</span>
+</span><span id="__span-0-320"><a id="__codelineno-0-320" name="__codelineno-0-320"></a>                <span class="n">num_params</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="__span-0-321"><a id="__codelineno-0-321" name="__codelineno-0-321"></a>            <span class="k">if</span> <span class="n">token1</span> <span class="o">==</span> <span class="n">token2</span><span class="p">:</span>
+</span><span id="__span-0-322"><a id="__codelineno-0-322" name="__codelineno-0-322"></a>                <span class="n">matches</span> <span class="o">+=</span> <span class="mi">1</span>
 </span><span id="__span-0-323"><a id="__codelineno-0-323" name="__codelineno-0-323"></a>
-</span><span id="__span-0-324"><a id="__codelineno-0-324" name="__codelineno-0-324"></a>        <span class="k">return</span> <span class="n">similarity</span><span class="p">,</span> <span class="n">num_params</span>
+</span><span id="__span-0-324"><a id="__codelineno-0-324" name="__codelineno-0-324"></a>        <span class="n">similarity</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">matches</span><span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">seq1</span><span class="p">)</span>
 </span><span id="__span-0-325"><a id="__codelineno-0-325" name="__codelineno-0-325"></a>
-</span><span id="__span-0-326"><a id="__codelineno-0-326" name="__codelineno-0-326"></a>    <span class="k">def</span> <span class="nf">_find_cluster</span><span class="p">(</span>
-</span><span id="__span-0-327"><a id="__codelineno-0-327" name="__codelineno-0-327"></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">cluster_list</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="n">Cluster</span><span class="p">],</span> <span class="n">seq</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span>
-</span><span id="__span-0-328"><a id="__codelineno-0-328" name="__codelineno-0-328"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="n">Cluster</span><span class="p">]:</span>
-</span><span id="__span-0-329"><a id="__codelineno-0-329" name="__codelineno-0-329"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-330"><a id="__codelineno-0-330" name="__codelineno-0-330"></a><span class="sd">        Find the cluster in `cluster_list` that is most similar to `seq`.</span>
-</span><span id="__span-0-331"><a id="__codelineno-0-331" name="__codelineno-0-331"></a>
-</span><span id="__span-0-332"><a id="__codelineno-0-332" name="__codelineno-0-332"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-333"><a id="__codelineno-0-333" name="__codelineno-0-333"></a><span class="sd">            cluster_list: The list of clusters to search.</span>
-</span><span id="__span-0-334"><a id="__codelineno-0-334" name="__codelineno-0-334"></a><span class="sd">            seq: The sequence of tokens to compare to.</span>
-</span><span id="__span-0-335"><a id="__codelineno-0-335" name="__codelineno-0-335"></a>
-</span><span id="__span-0-336"><a id="__codelineno-0-336" name="__codelineno-0-336"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-337"><a id="__codelineno-0-337" name="__codelineno-0-337"></a><span class="sd">            The cluster in `cluster_list` that is most similar to `seq`,</span>
-</span><span id="__span-0-338"><a id="__codelineno-0-338" name="__codelineno-0-338"></a><span class="sd">            or None if no cluster is sufficiently similar.</span>
-</span><span id="__span-0-339"><a id="__codelineno-0-339" name="__codelineno-0-339"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-340"><a id="__codelineno-0-340" name="__codelineno-0-340"></a>
-</span><span id="__span-0-341"><a id="__codelineno-0-341" name="__codelineno-0-341"></a>        <span class="n">max_similarity</span> <span class="o">=</span> <span class="o">-</span><span class="mi">1</span>
-</span><span id="__span-0-342"><a id="__codelineno-0-342" name="__codelineno-0-342"></a>        <span class="n">max_num_params</span> <span class="o">=</span> <span class="o">-</span><span class="mi">1</span>
-</span><span id="__span-0-343"><a id="__codelineno-0-343" name="__codelineno-0-343"></a>        <span class="n">max_cluster</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-344"><a id="__codelineno-0-344" name="__codelineno-0-344"></a>
-</span><span id="__span-0-345"><a id="__codelineno-0-345" name="__codelineno-0-345"></a>        <span class="k">for</span> <span class="n">cluster</span> <span class="ow">in</span> <span class="n">cluster_list</span><span class="p">:</span>
-</span><span id="__span-0-346"><a id="__codelineno-0-346" name="__codelineno-0-346"></a>            <span class="n">similarity</span><span class="p">,</span> <span class="n">num_params</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_similarity</span><span class="p">(</span><span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="p">,</span> <span class="n">seq</span><span class="p">)</span>
-</span><span id="__span-0-347"><a id="__codelineno-0-347" name="__codelineno-0-347"></a>            <span class="k">if</span> <span class="n">similarity</span> <span class="o">&gt;</span> <span class="n">max_similarity</span> <span class="ow">or</span> <span class="p">(</span>
-</span><span id="__span-0-348"><a id="__codelineno-0-348" name="__codelineno-0-348"></a>                <span class="n">similarity</span> <span class="o">==</span> <span class="n">max_similarity</span> <span class="ow">and</span> <span class="n">num_params</span> <span class="o">&gt;</span> <span class="n">max_num_params</span>
-</span><span id="__span-0-349"><a id="__codelineno-0-349" name="__codelineno-0-349"></a>            <span class="p">):</span>
-</span><span id="__span-0-350"><a id="__codelineno-0-350" name="__codelineno-0-350"></a>                <span class="n">max_similarity</span> <span class="o">=</span> <span class="n">similarity</span>
-</span><span id="__span-0-351"><a id="__codelineno-0-351" name="__codelineno-0-351"></a>                <span class="n">max_num_params</span> <span class="o">=</span> <span class="n">num_params</span>
-</span><span id="__span-0-352"><a id="__codelineno-0-352" name="__codelineno-0-352"></a>                <span class="n">max_cluster</span> <span class="o">=</span> <span class="n">cluster</span>
-</span><span id="__span-0-353"><a id="__codelineno-0-353" name="__codelineno-0-353"></a>
-</span><span id="__span-0-354"><a id="__codelineno-0-354" name="__codelineno-0-354"></a>        <span class="k">if</span> <span class="n">max_similarity</span> <span class="o">&gt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">st</span><span class="p">:</span>
-</span><span id="__span-0-355"><a id="__codelineno-0-355" name="__codelineno-0-355"></a>            <span class="k">return</span> <span class="n">max_cluster</span>
-</span><span id="__span-0-356"><a id="__codelineno-0-356" name="__codelineno-0-356"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-357"><a id="__codelineno-0-357" name="__codelineno-0-357"></a>            <span class="k">return</span> <span class="kc">None</span>
-</span><span id="__span-0-358"><a id="__codelineno-0-358" name="__codelineno-0-358"></a>
-</span><span id="__span-0-359"><a id="__codelineno-0-359" name="__codelineno-0-359"></a>    <span class="k">def</span> <span class="nf">_get_updated_template</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">template</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">msg</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]:</span>
-</span><span id="__span-0-360"><a id="__codelineno-0-360" name="__codelineno-0-360"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-361"><a id="__codelineno-0-361" name="__codelineno-0-361"></a><span class="sd">        Get the updated template from matching `msg` to `template`.</span>
-</span><span id="__span-0-362"><a id="__codelineno-0-362" name="__codelineno-0-362"></a>
-</span><span id="__span-0-363"><a id="__codelineno-0-363" name="__codelineno-0-363"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-364"><a id="__codelineno-0-364" name="__codelineno-0-364"></a><span class="sd">            template: The template to match to.</span>
-</span><span id="__span-0-365"><a id="__codelineno-0-365" name="__codelineno-0-365"></a><span class="sd">            msg: The message to match.</span>
-</span><span id="__span-0-366"><a id="__codelineno-0-366" name="__codelineno-0-366"></a>
-</span><span id="__span-0-367"><a id="__codelineno-0-367" name="__codelineno-0-367"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-368"><a id="__codelineno-0-368" name="__codelineno-0-368"></a><span class="sd">            The updated template.</span>
-</span><span id="__span-0-369"><a id="__codelineno-0-369" name="__codelineno-0-369"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-370"><a id="__codelineno-0-370" name="__codelineno-0-370"></a>
-</span><span id="__span-0-371"><a id="__codelineno-0-371" name="__codelineno-0-371"></a>        <span class="k">assert</span> <span class="nb">len</span><span class="p">(</span><span class="n">template</span><span class="p">)</span> <span class="o">==</span> <span class="nb">len</span><span class="p">(</span><span class="n">msg</span><span class="p">)</span>
-</span><span id="__span-0-372"><a id="__codelineno-0-372" name="__codelineno-0-372"></a>        <span class="n">updated_template</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-373"><a id="__codelineno-0-373" name="__codelineno-0-373"></a>
-</span><span id="__span-0-374"><a id="__codelineno-0-374" name="__codelineno-0-374"></a>        <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">word</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">template</span><span class="p">):</span>
-</span><span id="__span-0-375"><a id="__codelineno-0-375" name="__codelineno-0-375"></a>            <span class="k">if</span> <span class="n">word</span> <span class="o">==</span> <span class="n">msg</span><span class="p">[</span><span class="n">i</span><span class="p">]:</span>
-</span><span id="__span-0-376"><a id="__codelineno-0-376" name="__codelineno-0-376"></a>                <span class="n">updated_template</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">word</span><span class="p">)</span>
-</span><span id="__span-0-377"><a id="__codelineno-0-377" name="__codelineno-0-377"></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-378"><a id="__codelineno-0-378" name="__codelineno-0-378"></a>                <span class="n">updated_template</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">)</span>
-</span><span id="__span-0-379"><a id="__codelineno-0-379" name="__codelineno-0-379"></a>
-</span><span id="__span-0-380"><a id="__codelineno-0-380" name="__codelineno-0-380"></a>        <span class="k">return</span> <span class="n">updated_template</span>
+</span><span id="__span-0-326"><a id="__codelineno-0-326" name="__codelineno-0-326"></a>        <span class="k">return</span> <span class="n">similarity</span><span class="p">,</span> <span class="n">num_params</span>
+</span><span id="__span-0-327"><a id="__codelineno-0-327" name="__codelineno-0-327"></a>
+</span><span id="__span-0-328"><a id="__codelineno-0-328" name="__codelineno-0-328"></a>    <span class="k">def</span> <span class="nf">_find_cluster</span><span class="p">(</span>
+</span><span id="__span-0-329"><a id="__codelineno-0-329" name="__codelineno-0-329"></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">cluster_list</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="n">Cluster</span><span class="p">],</span> <span class="n">seq</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span>
+</span><span id="__span-0-330"><a id="__codelineno-0-330" name="__codelineno-0-330"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="n">Cluster</span><span class="p">]:</span>
+</span><span id="__span-0-331"><a id="__codelineno-0-331" name="__codelineno-0-331"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-332"><a id="__codelineno-0-332" name="__codelineno-0-332"></a><span class="sd">        Find the cluster in `cluster_list` that is most similar to `seq`.</span>
+</span><span id="__span-0-333"><a id="__codelineno-0-333" name="__codelineno-0-333"></a>
+</span><span id="__span-0-334"><a id="__codelineno-0-334" name="__codelineno-0-334"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-335"><a id="__codelineno-0-335" name="__codelineno-0-335"></a><span class="sd">            cluster_list: The list of clusters to search.</span>
+</span><span id="__span-0-336"><a id="__codelineno-0-336" name="__codelineno-0-336"></a><span class="sd">            seq: The sequence of tokens to compare to.</span>
+</span><span id="__span-0-337"><a id="__codelineno-0-337" name="__codelineno-0-337"></a>
+</span><span id="__span-0-338"><a id="__codelineno-0-338" name="__codelineno-0-338"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-339"><a id="__codelineno-0-339" name="__codelineno-0-339"></a><span class="sd">            The cluster in `cluster_list` that is most similar to `seq`,</span>
+</span><span id="__span-0-340"><a id="__codelineno-0-340" name="__codelineno-0-340"></a><span class="sd">            or None if no cluster is sufficiently similar.</span>
+</span><span id="__span-0-341"><a id="__codelineno-0-341" name="__codelineno-0-341"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-342"><a id="__codelineno-0-342" name="__codelineno-0-342"></a>
+</span><span id="__span-0-343"><a id="__codelineno-0-343" name="__codelineno-0-343"></a>        <span class="n">max_similarity</span> <span class="o">=</span> <span class="o">-</span><span class="mi">1</span>
+</span><span id="__span-0-344"><a id="__codelineno-0-344" name="__codelineno-0-344"></a>        <span class="n">max_num_params</span> <span class="o">=</span> <span class="o">-</span><span class="mi">1</span>
+</span><span id="__span-0-345"><a id="__codelineno-0-345" name="__codelineno-0-345"></a>        <span class="n">max_cluster</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-346"><a id="__codelineno-0-346" name="__codelineno-0-346"></a>
+</span><span id="__span-0-347"><a id="__codelineno-0-347" name="__codelineno-0-347"></a>        <span class="k">for</span> <span class="n">cluster</span> <span class="ow">in</span> <span class="n">cluster_list</span><span class="p">:</span>
+</span><span id="__span-0-348"><a id="__codelineno-0-348" name="__codelineno-0-348"></a>            <span class="n">similarity</span><span class="p">,</span> <span class="n">num_params</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_similarity</span><span class="p">(</span><span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="p">,</span> <span class="n">seq</span><span class="p">)</span>
+</span><span id="__span-0-349"><a id="__codelineno-0-349" name="__codelineno-0-349"></a>            <span class="k">if</span> <span class="n">similarity</span> <span class="o">&gt;</span> <span class="n">max_similarity</span> <span class="ow">or</span> <span class="p">(</span>
+</span><span id="__span-0-350"><a id="__codelineno-0-350" name="__codelineno-0-350"></a>                <span class="n">similarity</span> <span class="o">==</span> <span class="n">max_similarity</span> <span class="ow">and</span> <span class="n">num_params</span> <span class="o">&gt;</span> <span class="n">max_num_params</span>
+</span><span id="__span-0-351"><a id="__codelineno-0-351" name="__codelineno-0-351"></a>            <span class="p">):</span>
+</span><span id="__span-0-352"><a id="__codelineno-0-352" name="__codelineno-0-352"></a>                <span class="n">max_similarity</span> <span class="o">=</span> <span class="n">similarity</span>
+</span><span id="__span-0-353"><a id="__codelineno-0-353" name="__codelineno-0-353"></a>                <span class="n">max_num_params</span> <span class="o">=</span> <span class="n">num_params</span>
+</span><span id="__span-0-354"><a id="__codelineno-0-354" name="__codelineno-0-354"></a>                <span class="n">max_cluster</span> <span class="o">=</span> <span class="n">cluster</span>
+</span><span id="__span-0-355"><a id="__codelineno-0-355" name="__codelineno-0-355"></a>
+</span><span id="__span-0-356"><a id="__codelineno-0-356" name="__codelineno-0-356"></a>        <span class="k">if</span> <span class="n">max_similarity</span> <span class="o">&gt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">st</span><span class="p">:</span>
+</span><span id="__span-0-357"><a id="__codelineno-0-357" name="__codelineno-0-357"></a>            <span class="k">return</span> <span class="n">max_cluster</span>
+</span><span id="__span-0-358"><a id="__codelineno-0-358" name="__codelineno-0-358"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-359"><a id="__codelineno-0-359" name="__codelineno-0-359"></a>            <span class="k">return</span> <span class="kc">None</span>
+</span><span id="__span-0-360"><a id="__codelineno-0-360" name="__codelineno-0-360"></a>
+</span><span id="__span-0-361"><a id="__codelineno-0-361" name="__codelineno-0-361"></a>    <span class="k">def</span> <span class="nf">_get_updated_template</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">template</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">msg</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]:</span>
+</span><span id="__span-0-362"><a id="__codelineno-0-362" name="__codelineno-0-362"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-363"><a id="__codelineno-0-363" name="__codelineno-0-363"></a><span class="sd">        Get the updated template from matching `msg` to `template`.</span>
+</span><span id="__span-0-364"><a id="__codelineno-0-364" name="__codelineno-0-364"></a>
+</span><span id="__span-0-365"><a id="__codelineno-0-365" name="__codelineno-0-365"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-366"><a id="__codelineno-0-366" name="__codelineno-0-366"></a><span class="sd">            template: The template to match to.</span>
+</span><span id="__span-0-367"><a id="__codelineno-0-367" name="__codelineno-0-367"></a><span class="sd">            msg: The message to match.</span>
+</span><span id="__span-0-368"><a id="__codelineno-0-368" name="__codelineno-0-368"></a>
+</span><span id="__span-0-369"><a id="__codelineno-0-369" name="__codelineno-0-369"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-370"><a id="__codelineno-0-370" name="__codelineno-0-370"></a><span class="sd">            The updated template.</span>
+</span><span id="__span-0-371"><a id="__codelineno-0-371" name="__codelineno-0-371"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-372"><a id="__codelineno-0-372" name="__codelineno-0-372"></a>
+</span><span id="__span-0-373"><a id="__codelineno-0-373" name="__codelineno-0-373"></a>        <span class="k">assert</span> <span class="nb">len</span><span class="p">(</span><span class="n">template</span><span class="p">)</span> <span class="o">==</span> <span class="nb">len</span><span class="p">(</span><span class="n">msg</span><span class="p">)</span>
+</span><span id="__span-0-374"><a id="__codelineno-0-374" name="__codelineno-0-374"></a>        <span class="n">updated_template</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-375"><a id="__codelineno-0-375" name="__codelineno-0-375"></a>
+</span><span id="__span-0-376"><a id="__codelineno-0-376" name="__codelineno-0-376"></a>        <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">word</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">template</span><span class="p">):</span>
+</span><span id="__span-0-377"><a id="__codelineno-0-377" name="__codelineno-0-377"></a>            <span class="k">if</span> <span class="n">word</span> <span class="o">==</span> <span class="n">msg</span><span class="p">[</span><span class="n">i</span><span class="p">]:</span>
+</span><span id="__span-0-378"><a id="__codelineno-0-378" name="__codelineno-0-378"></a>                <span class="n">updated_template</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">word</span><span class="p">)</span>
+</span><span id="__span-0-379"><a id="__codelineno-0-379" name="__codelineno-0-379"></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-380"><a id="__codelineno-0-380" name="__codelineno-0-380"></a>                <span class="n">updated_template</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">)</span>
 </span><span id="__span-0-381"><a id="__codelineno-0-381" name="__codelineno-0-381"></a>
-</span><span id="__span-0-382"><a id="__codelineno-0-382" name="__codelineno-0-382"></a>    <span class="nd">@staticmethod</span>
-</span><span id="__span-0-383"><a id="__codelineno-0-383" name="__codelineno-0-383"></a>    <span class="k">def</span> <span class="nf">_preceding_3</span><span class="p">(</span><span class="n">parsed_templates</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]:</span>
-</span><span id="__span-0-384"><a id="__codelineno-0-384" name="__codelineno-0-384"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-385"><a id="__codelineno-0-385" name="__codelineno-0-385"></a><span class="sd">        Get the 3 tokens preceding the variable `x` in the template.</span>
-</span><span id="__span-0-386"><a id="__codelineno-0-386" name="__codelineno-0-386"></a>
-</span><span id="__span-0-387"><a id="__codelineno-0-387" name="__codelineno-0-387"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-388"><a id="__codelineno-0-388" name="__codelineno-0-388"></a><span class="sd">            parsed_templates: The dataframe containing information about the parsed templates.</span>
-</span><span id="__span-0-389"><a id="__codelineno-0-389" name="__codelineno-0-389"></a><span class="sd">            x: The name of the variable.</span>
-</span><span id="__span-0-390"><a id="__codelineno-0-390" name="__codelineno-0-390"></a>
-</span><span id="__span-0-391"><a id="__codelineno-0-391" name="__codelineno-0-391"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-392"><a id="__codelineno-0-392" name="__codelineno-0-392"></a><span class="sd">            The 3 tokens preceding the variable `x` in the template.</span>
-</span><span id="__span-0-393"><a id="__codelineno-0-393" name="__codelineno-0-393"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-394"><a id="__codelineno-0-394" name="__codelineno-0-394"></a>
-</span><span id="__span-0-395"><a id="__codelineno-0-395" name="__codelineno-0-395"></a>        <span class="n">splitx</span> <span class="o">=</span> <span class="n">x</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;_&quot;</span><span class="p">)</span>
-</span><span id="__span-0-396"><a id="__codelineno-0-396" name="__codelineno-0-396"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">splitx</span><span class="p">)</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="__span-0-397"><a id="__codelineno-0-397" name="__codelineno-0-397"></a>            <span class="k">return</span> <span class="p">[]</span>
-</span><span id="__span-0-398"><a id="__codelineno-0-398" name="__codelineno-0-398"></a>        <span class="nb">id</span> <span class="o">=</span> <span class="n">splitx</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-399"><a id="__codelineno-0-399" name="__codelineno-0-399"></a>        <span class="n">position</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">splitx</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
-</span><span id="__span-0-400"><a id="__codelineno-0-400" name="__codelineno-0-400"></a>        <span class="n">start_position</span> <span class="o">=</span> <span class="nb">max</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">position</span> <span class="o">-</span> <span class="mi">3</span><span class="p">)</span>
-</span><span id="__span-0-401"><a id="__codelineno-0-401" name="__codelineno-0-401"></a>        <span class="k">return</span> <span class="p">(</span>
-</span><span id="__span-0-402"><a id="__codelineno-0-402" name="__codelineno-0-402"></a>            <span class="n">parsed_templates</span><span class="p">[</span><span class="n">parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="nb">id</span><span class="p">][</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span>
-</span><span id="__span-0-403"><a id="__codelineno-0-403" name="__codelineno-0-403"></a>            <span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-404"><a id="__codelineno-0-404" name="__codelineno-0-404"></a>            <span class="o">.</span><span class="n">split</span><span class="p">()[</span><span class="n">start_position</span><span class="p">:</span><span class="n">position</span><span class="p">]</span>
-</span><span id="__span-0-405"><a id="__codelineno-0-405" name="__codelineno-0-405"></a>        <span class="p">)</span>
-</span><span id="__span-0-406"><a id="__codelineno-0-406" name="__codelineno-0-406"></a>
-</span><span id="__span-0-407"><a id="__codelineno-0-407" name="__codelineno-0-407"></a>    <span class="k">def</span> <span class="nf">_postprocess</span><span class="p">(</span>
-</span><span id="__span-0-408"><a id="__codelineno-0-408" name="__codelineno-0-408"></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-409"><a id="__codelineno-0-409" name="__codelineno-0-409"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">]:</span>
-</span><span id="__span-0-410"><a id="__codelineno-0-410" name="__codelineno-0-410"></a>        <span class="n">template_id_per_msg</span> <span class="o">=</span> <span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-411"><a id="__codelineno-0-411" name="__codelineno-0-411"></a>        <span class="n">parsed_templates_list</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-412"><a id="__codelineno-0-412" name="__codelineno-0-412"></a>
-</span><span id="__span-0-413"><a id="__codelineno-0-413" name="__codelineno-0-413"></a>        <span class="n">regex_tokens</span> <span class="o">=</span> <span class="p">[</span><span class="s2">&quot;&lt;*&quot;</span> <span class="o">+</span> <span class="nb">str</span><span class="p">(</span><span class="n">i</span><span class="p">)</span> <span class="o">+</span> <span class="s2">&quot;&gt;&quot;</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">rex</span><span class="p">))]</span>
+</span><span id="__span-0-382"><a id="__codelineno-0-382" name="__codelineno-0-382"></a>        <span class="k">return</span> <span class="n">updated_template</span>
+</span><span id="__span-0-383"><a id="__codelineno-0-383" name="__codelineno-0-383"></a>
+</span><span id="__span-0-384"><a id="__codelineno-0-384" name="__codelineno-0-384"></a>    <span class="nd">@staticmethod</span>
+</span><span id="__span-0-385"><a id="__codelineno-0-385" name="__codelineno-0-385"></a>    <span class="k">def</span> <span class="nf">_preceding_3</span><span class="p">(</span><span class="n">parsed_templates</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]:</span>
+</span><span id="__span-0-386"><a id="__codelineno-0-386" name="__codelineno-0-386"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-387"><a id="__codelineno-0-387" name="__codelineno-0-387"></a><span class="sd">        Get the 3 tokens preceding the variable `x` in the template.</span>
+</span><span id="__span-0-388"><a id="__codelineno-0-388" name="__codelineno-0-388"></a>
+</span><span id="__span-0-389"><a id="__codelineno-0-389" name="__codelineno-0-389"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-390"><a id="__codelineno-0-390" name="__codelineno-0-390"></a><span class="sd">            parsed_templates: The dataframe containing information about the parsed templates.</span>
+</span><span id="__span-0-391"><a id="__codelineno-0-391" name="__codelineno-0-391"></a><span class="sd">            x: The name of the variable.</span>
+</span><span id="__span-0-392"><a id="__codelineno-0-392" name="__codelineno-0-392"></a>
+</span><span id="__span-0-393"><a id="__codelineno-0-393" name="__codelineno-0-393"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-394"><a id="__codelineno-0-394" name="__codelineno-0-394"></a><span class="sd">            The 3 tokens preceding the variable `x` in the template.</span>
+</span><span id="__span-0-395"><a id="__codelineno-0-395" name="__codelineno-0-395"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-396"><a id="__codelineno-0-396" name="__codelineno-0-396"></a>
+</span><span id="__span-0-397"><a id="__codelineno-0-397" name="__codelineno-0-397"></a>        <span class="n">splitx</span> <span class="o">=</span> <span class="n">x</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;_&quot;</span><span class="p">)</span>
+</span><span id="__span-0-398"><a id="__codelineno-0-398" name="__codelineno-0-398"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">splitx</span><span class="p">)</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="__span-0-399"><a id="__codelineno-0-399" name="__codelineno-0-399"></a>            <span class="k">return</span> <span class="p">[]</span>
+</span><span id="__span-0-400"><a id="__codelineno-0-400" name="__codelineno-0-400"></a>        <span class="nb">id</span> <span class="o">=</span> <span class="n">splitx</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-401"><a id="__codelineno-0-401" name="__codelineno-0-401"></a>        <span class="n">position</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">splitx</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+</span><span id="__span-0-402"><a id="__codelineno-0-402" name="__codelineno-0-402"></a>        <span class="n">start_position</span> <span class="o">=</span> <span class="nb">max</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">position</span> <span class="o">-</span> <span class="mi">3</span><span class="p">)</span>
+</span><span id="__span-0-403"><a id="__codelineno-0-403" name="__codelineno-0-403"></a>        <span class="k">return</span> <span class="p">(</span>
+</span><span id="__span-0-404"><a id="__codelineno-0-404" name="__codelineno-0-404"></a>            <span class="n">parsed_templates</span><span class="p">[</span><span class="n">parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="nb">id</span><span class="p">][</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span>
+</span><span id="__span-0-405"><a id="__codelineno-0-405" name="__codelineno-0-405"></a>            <span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-406"><a id="__codelineno-0-406" name="__codelineno-0-406"></a>            <span class="o">.</span><span class="n">split</span><span class="p">()[</span><span class="n">start_position</span><span class="p">:</span><span class="n">position</span><span class="p">]</span>
+</span><span id="__span-0-407"><a id="__codelineno-0-407" name="__codelineno-0-407"></a>        <span class="p">)</span>
+</span><span id="__span-0-408"><a id="__codelineno-0-408" name="__codelineno-0-408"></a>
+</span><span id="__span-0-409"><a id="__codelineno-0-409" name="__codelineno-0-409"></a>    <span class="k">def</span> <span class="nf">_postprocess</span><span class="p">(</span>
+</span><span id="__span-0-410"><a id="__codelineno-0-410" name="__codelineno-0-410"></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-411"><a id="__codelineno-0-411" name="__codelineno-0-411"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">]:</span>
+</span><span id="__span-0-412"><a id="__codelineno-0-412" name="__codelineno-0-412"></a>        <span class="n">template_id_per_msg</span> <span class="o">=</span> <span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-413"><a id="__codelineno-0-413" name="__codelineno-0-413"></a>        <span class="n">parsed_templates_list</span> <span class="o">=</span> <span class="p">[]</span>
 </span><span id="__span-0-414"><a id="__codelineno-0-414" name="__codelineno-0-414"></a>
-</span><span id="__span-0-415"><a id="__codelineno-0-415" name="__codelineno-0-415"></a>        <span class="c1"># Process each cluster to determine template information.</span>
-</span><span id="__span-0-416"><a id="__codelineno-0-416" name="__codelineno-0-416"></a>        <span class="k">for</span> <span class="n">cluster</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">cluster_list</span><span class="p">:</span>
-</span><span id="__span-0-417"><a id="__codelineno-0-417" name="__codelineno-0-417"></a>            <span class="n">d</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-418"><a id="__codelineno-0-418" name="__codelineno-0-418"></a>
-</span><span id="__span-0-419"><a id="__codelineno-0-419" name="__codelineno-0-419"></a>            <span class="c1"># Determine the template ID</span>
-</span><span id="__span-0-420"><a id="__codelineno-0-420" name="__codelineno-0-420"></a>            <span class="n">d</span><span class="p">[</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot; &quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="p">)</span>
-</span><span id="__span-0-421"><a id="__codelineno-0-421" name="__codelineno-0-421"></a>            <span class="n">d</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">hashlib</span><span class="o">.</span><span class="n">md5</span><span class="p">(</span>
-</span><span id="__span-0-422"><a id="__codelineno-0-422" name="__codelineno-0-422"></a>                <span class="n">d</span><span class="p">[</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">encode</span><span class="p">(</span><span class="s2">&quot;utf-8&quot;</span><span class="p">)</span>
-</span><span id="__span-0-423"><a id="__codelineno-0-423" name="__codelineno-0-423"></a>            <span class="p">)</span><span class="o">.</span><span class="n">hexdigest</span><span class="p">()[</span><span class="mi">0</span><span class="p">:</span><span class="mi">8</span><span class="p">]</span>
-</span><span id="__span-0-424"><a id="__codelineno-0-424" name="__codelineno-0-424"></a>
-</span><span id="__span-0-425"><a id="__codelineno-0-425" name="__codelineno-0-425"></a>            <span class="c1"># Determine the indices of the variables and regexes in the template.</span>
-</span><span id="__span-0-426"><a id="__codelineno-0-426" name="__codelineno-0-426"></a>            <span class="n">d</span><span class="p">[</span><span class="s2">&quot;VariableIndices&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="__span-0-427"><a id="__codelineno-0-427" name="__codelineno-0-427"></a>                <span class="n">i</span> <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">x</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="p">)</span> <span class="k">if</span> <span class="n">x</span> <span class="o">==</span> <span class="s2">&quot;&lt;*&gt;&quot;</span>
-</span><span id="__span-0-428"><a id="__codelineno-0-428" name="__codelineno-0-428"></a>            <span class="p">]</span>
-</span><span id="__span-0-429"><a id="__codelineno-0-429" name="__codelineno-0-429"></a>            <span class="n">d</span><span class="p">[</span><span class="s2">&quot;RegexIndices&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-430"><a id="__codelineno-0-430" name="__codelineno-0-430"></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">regex_tokens</span><span class="p">:</span>
-</span><span id="__span-0-431"><a id="__codelineno-0-431" name="__codelineno-0-431"></a>                <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-432"><a id="__codelineno-0-432" name="__codelineno-0-432"></a>                    <span class="n">d</span><span class="p">[</span><span class="s2">&quot;RegexIndices&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="o">.</span><span class="n">index</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="n">i</span><span class="p">)))</span>
-</span><span id="__span-0-433"><a id="__codelineno-0-433" name="__codelineno-0-433"></a>                <span class="k">except</span><span class="p">:</span>
-</span><span id="__span-0-434"><a id="__codelineno-0-434" name="__codelineno-0-434"></a>                    <span class="k">pass</span>
-</span><span id="__span-0-435"><a id="__codelineno-0-435" name="__codelineno-0-435"></a>
-</span><span id="__span-0-436"><a id="__codelineno-0-436" name="__codelineno-0-436"></a>            <span class="c1"># Update the template ID for each log message in the cluster.</span>
-</span><span id="__span-0-437"><a id="__codelineno-0-437" name="__codelineno-0-437"></a>            <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">line_id</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">cluster</span><span class="o">.</span><span class="n">message_ids</span><span class="p">):</span>
-</span><span id="__span-0-438"><a id="__codelineno-0-438" name="__codelineno-0-438"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">line_id</span><span class="p">,</span> <span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">d</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span>
-</span><span id="__span-0-439"><a id="__codelineno-0-439" name="__codelineno-0-439"></a>
-</span><span id="__span-0-440"><a id="__codelineno-0-440" name="__codelineno-0-440"></a>                <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-441"><a id="__codelineno-0-441" name="__codelineno-0-441"></a>                    <span class="n">d</span><span class="p">[</span><span class="s2">&quot;TemplateExample&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">line_id</span><span class="p">,</span> <span class="s2">&quot;Message&quot;</span><span class="p">]</span>
-</span><span id="__span-0-442"><a id="__codelineno-0-442" name="__codelineno-0-442"></a>
-</span><span id="__span-0-443"><a id="__codelineno-0-443" name="__codelineno-0-443"></a>            <span class="n">parsed_templates_list</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">d</span><span class="o">.</span><span class="n">copy</span><span class="p">())</span>
+</span><span id="__span-0-415"><a id="__codelineno-0-415" name="__codelineno-0-415"></a>        <span class="n">regex_tokens</span> <span class="o">=</span> <span class="p">[</span><span class="s2">&quot;&lt;*&quot;</span> <span class="o">+</span> <span class="nb">str</span><span class="p">(</span><span class="n">i</span><span class="p">)</span> <span class="o">+</span> <span class="s2">&quot;&gt;&quot;</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">rex</span><span class="p">))]</span>
+</span><span id="__span-0-416"><a id="__codelineno-0-416" name="__codelineno-0-416"></a>
+</span><span id="__span-0-417"><a id="__codelineno-0-417" name="__codelineno-0-417"></a>        <span class="c1"># Process each cluster to determine template information.</span>
+</span><span id="__span-0-418"><a id="__codelineno-0-418" name="__codelineno-0-418"></a>        <span class="k">for</span> <span class="n">cluster</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">cluster_list</span><span class="p">:</span>
+</span><span id="__span-0-419"><a id="__codelineno-0-419" name="__codelineno-0-419"></a>            <span class="n">d</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-420"><a id="__codelineno-0-420" name="__codelineno-0-420"></a>
+</span><span id="__span-0-421"><a id="__codelineno-0-421" name="__codelineno-0-421"></a>            <span class="c1"># Determine the template ID</span>
+</span><span id="__span-0-422"><a id="__codelineno-0-422" name="__codelineno-0-422"></a>            <span class="n">d</span><span class="p">[</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot; &quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="p">)</span>
+</span><span id="__span-0-423"><a id="__codelineno-0-423" name="__codelineno-0-423"></a>            <span class="n">d</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">hashlib</span><span class="o">.</span><span class="n">md5</span><span class="p">(</span>
+</span><span id="__span-0-424"><a id="__codelineno-0-424" name="__codelineno-0-424"></a>                <span class="n">d</span><span class="p">[</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">encode</span><span class="p">(</span><span class="s2">&quot;utf-8&quot;</span><span class="p">)</span>
+</span><span id="__span-0-425"><a id="__codelineno-0-425" name="__codelineno-0-425"></a>            <span class="p">)</span><span class="o">.</span><span class="n">hexdigest</span><span class="p">()[</span><span class="mi">0</span><span class="p">:</span><span class="mi">8</span><span class="p">]</span>
+</span><span id="__span-0-426"><a id="__codelineno-0-426" name="__codelineno-0-426"></a>
+</span><span id="__span-0-427"><a id="__codelineno-0-427" name="__codelineno-0-427"></a>            <span class="c1"># Determine the indices of the variables and regexes in the template.</span>
+</span><span id="__span-0-428"><a id="__codelineno-0-428" name="__codelineno-0-428"></a>            <span class="n">d</span><span class="p">[</span><span class="s2">&quot;VariableIndices&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="__span-0-429"><a id="__codelineno-0-429" name="__codelineno-0-429"></a>                <span class="n">i</span> <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">x</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="p">)</span> <span class="k">if</span> <span class="n">x</span> <span class="o">==</span> <span class="s2">&quot;&lt;*&gt;&quot;</span>
+</span><span id="__span-0-430"><a id="__codelineno-0-430" name="__codelineno-0-430"></a>            <span class="p">]</span>
+</span><span id="__span-0-431"><a id="__codelineno-0-431" name="__codelineno-0-431"></a>            <span class="n">d</span><span class="p">[</span><span class="s2">&quot;RegexIndices&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-432"><a id="__codelineno-0-432" name="__codelineno-0-432"></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">regex_tokens</span><span class="p">:</span>
+</span><span id="__span-0-433"><a id="__codelineno-0-433" name="__codelineno-0-433"></a>                <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-434"><a id="__codelineno-0-434" name="__codelineno-0-434"></a>                    <span class="n">d</span><span class="p">[</span><span class="s2">&quot;RegexIndices&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="o">.</span><span class="n">index</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="n">i</span><span class="p">)))</span>
+</span><span id="__span-0-435"><a id="__codelineno-0-435" name="__codelineno-0-435"></a>                <span class="k">except</span><span class="p">:</span>
+</span><span id="__span-0-436"><a id="__codelineno-0-436" name="__codelineno-0-436"></a>                    <span class="k">pass</span>
+</span><span id="__span-0-437"><a id="__codelineno-0-437" name="__codelineno-0-437"></a>
+</span><span id="__span-0-438"><a id="__codelineno-0-438" name="__codelineno-0-438"></a>            <span class="c1"># Update the template ID for each log message in the cluster.</span>
+</span><span id="__span-0-439"><a id="__codelineno-0-439" name="__codelineno-0-439"></a>            <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">line_id</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">cluster</span><span class="o">.</span><span class="n">message_ids</span><span class="p">):</span>
+</span><span id="__span-0-440"><a id="__codelineno-0-440" name="__codelineno-0-440"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">line_id</span><span class="p">,</span> <span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">d</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span>
+</span><span id="__span-0-441"><a id="__codelineno-0-441" name="__codelineno-0-441"></a>
+</span><span id="__span-0-442"><a id="__codelineno-0-442" name="__codelineno-0-442"></a>                <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-443"><a id="__codelineno-0-443" name="__codelineno-0-443"></a>                    <span class="n">d</span><span class="p">[</span><span class="s2">&quot;TemplateExample&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">line_id</span><span class="p">,</span> <span class="s2">&quot;Message&quot;</span><span class="p">]</span>
 </span><span id="__span-0-444"><a id="__codelineno-0-444" name="__codelineno-0-444"></a>
-</span><span id="__span-0-445"><a id="__codelineno-0-445" name="__codelineno-0-445"></a>        <span class="c1"># Create a dataframe of the parsed templates.</span>
-</span><span id="__span-0-446"><a id="__codelineno-0-446" name="__codelineno-0-446"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">parsed_templates_list</span><span class="p">)</span>
-</span><span id="__span-0-447"><a id="__codelineno-0-447" name="__codelineno-0-447"></a>        <span class="n">template_occurences</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">value_counts</span><span class="p">())</span>
-</span><span id="__span-0-448"><a id="__codelineno-0-448" name="__codelineno-0-448"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="p">[</span><span class="s2">&quot;Occurrences&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
-</span><span id="__span-0-449"><a id="__codelineno-0-449" name="__codelineno-0-449"></a>            <span class="n">template_occurences</span>
-</span><span id="__span-0-450"><a id="__codelineno-0-450" name="__codelineno-0-450"></a>        <span class="p">)</span>
-</span><span id="__span-0-451"><a id="__codelineno-0-451" name="__codelineno-0-451"></a>
-</span><span id="__span-0-452"><a id="__codelineno-0-452" name="__codelineno-0-452"></a>        <span class="c1"># Create columns for each variable (parsed or regex-derived) and extract them from each log message.</span>
-</span><span id="__span-0-453"><a id="__codelineno-0-453" name="__codelineno-0-453"></a>        <span class="n">variable_columns</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">rex</span><span class="o">.</span><span class="n">keys</span><span class="p">())</span>
-</span><span id="__span-0-454"><a id="__codelineno-0-454" name="__codelineno-0-454"></a>        <span class="n">variable_columns</span><span class="o">.</span><span class="n">extend</span><span class="p">(</span>
-</span><span id="__span-0-455"><a id="__codelineno-0-455" name="__codelineno-0-455"></a>            <span class="p">[</span>
-</span><span id="__span-0-456"><a id="__codelineno-0-456" name="__codelineno-0-456"></a>                <span class="nb">str</span><span class="p">(</span><span class="n">i</span><span class="p">)</span> <span class="o">+</span> <span class="s2">&quot;_&quot;</span> <span class="o">+</span> <span class="nb">str</span><span class="p">(</span><span class="n">j</span><span class="p">)</span>
-</span><span id="__span-0-457"><a id="__codelineno-0-457" name="__codelineno-0-457"></a>                <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span>
-</span><span id="__span-0-458"><a id="__codelineno-0-458" name="__codelineno-0-458"></a>                <span class="k">for</span> <span class="n">j</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-459"><a id="__codelineno-0-459" name="__codelineno-0-459"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">i</span><span class="p">,</span> <span class="s2">&quot;VariableIndices&quot;</span>
-</span><span id="__span-0-460"><a id="__codelineno-0-460" name="__codelineno-0-460"></a>                <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-461"><a id="__codelineno-0-461" name="__codelineno-0-461"></a>            <span class="p">]</span>
-</span><span id="__span-0-462"><a id="__codelineno-0-462" name="__codelineno-0-462"></a>        <span class="p">)</span>
-</span><span id="__span-0-463"><a id="__codelineno-0-463" name="__codelineno-0-463"></a>        <span class="n">par_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span>
-</span><span id="__span-0-464"><a id="__codelineno-0-464" name="__codelineno-0-464"></a>            <span class="n">columns</span><span class="o">=</span><span class="n">variable_columns</span><span class="p">,</span> <span class="n">index</span><span class="o">=</span><span class="nb">range</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
-</span><span id="__span-0-465"><a id="__codelineno-0-465" name="__codelineno-0-465"></a>        <span class="p">)</span>
-</span><span id="__span-0-466"><a id="__codelineno-0-466" name="__codelineno-0-466"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">concat</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="p">,</span> <span class="n">par_df</span><span class="p">),</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="__span-0-467"><a id="__codelineno-0-467" name="__codelineno-0-467"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_extract_variables</span><span class="p">()</span>
-</span><span id="__span-0-468"><a id="__codelineno-0-468" name="__codelineno-0-468"></a>
-</span><span id="__span-0-469"><a id="__codelineno-0-469" name="__codelineno-0-469"></a>        <span class="c1"># Create a dataframe of the parsed variables.</span>
-</span><span id="__span-0-470"><a id="__codelineno-0-470" name="__codelineno-0-470"></a>        <span class="n">parsed_variables</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">()</span>
-</span><span id="__span-0-471"><a id="__codelineno-0-471" name="__codelineno-0-471"></a>        <span class="n">parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">variable_columns</span>
-</span><span id="__span-0-472"><a id="__codelineno-0-472" name="__codelineno-0-472"></a>        <span class="n">parsed_variables</span><span class="p">[</span><span class="s2">&quot;Occurrences&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
-</span><span id="__span-0-473"><a id="__codelineno-0-473" name="__codelineno-0-473"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="p">[</span><span class="n">x</span><span class="p">]</span><span class="o">.</span><span class="n">notna</span><span class="p">()</span><span class="o">.</span><span class="n">sum</span><span class="p">()</span>
-</span><span id="__span-0-474"><a id="__codelineno-0-474" name="__codelineno-0-474"></a>        <span class="p">)</span>
-</span><span id="__span-0-475"><a id="__codelineno-0-475" name="__codelineno-0-475"></a>        <span class="n">parsed_variables</span><span class="p">[</span><span class="s2">&quot;Preceding 3 tokens&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
-</span><span id="__span-0-476"><a id="__codelineno-0-476" name="__codelineno-0-476"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">Drain</span><span class="o">.</span><span class="n">_preceding_3</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="p">,</span> <span class="n">x</span><span class="p">)</span>
-</span><span id="__span-0-477"><a id="__codelineno-0-477" name="__codelineno-0-477"></a>        <span class="p">)</span>
-</span><span id="__span-0-478"><a id="__codelineno-0-478" name="__codelineno-0-478"></a>        <span class="n">parsed_variables</span><span class="p">[</span><span class="s2">&quot;Examples&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
-</span><span id="__span-0-479"><a id="__codelineno-0-479" name="__codelineno-0-479"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="p">[</span><span class="n">x</span><span class="p">]</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="p">[</span><span class="n">x</span><span class="p">]</span><span class="o">.</span><span class="n">notna</span><span class="p">()]</span><span class="o">.</span><span class="n">unique</span><span class="p">()[:</span><span class="mi">5</span><span class="p">]</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
-</span><span id="__span-0-480"><a id="__codelineno-0-480" name="__codelineno-0-480"></a>        <span class="p">)</span>
-</span><span id="__span-0-481"><a id="__codelineno-0-481" name="__codelineno-0-481"></a>        <span class="n">parsed_variables</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
-</span><span id="__span-0-482"><a id="__codelineno-0-482" name="__codelineno-0-482"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="kc">True</span> <span class="k">if</span> <span class="n">x</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">rex</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span> <span class="k">else</span> <span class="kc">False</span>
-</span><span id="__span-0-483"><a id="__codelineno-0-483" name="__codelineno-0-483"></a>        <span class="p">)</span>
-</span><span id="__span-0-484"><a id="__codelineno-0-484" name="__codelineno-0-484"></a>
-</span><span id="__span-0-485"><a id="__codelineno-0-485" name="__codelineno-0-485"></a>        <span class="c1"># Drop unnecessary columns from the parsed log.</span>
-</span><span id="__span-0-486"><a id="__codelineno-0-486" name="__codelineno-0-486"></a>        <span class="n">to_drop</span> <span class="o">=</span> <span class="p">[</span><span class="s2">&quot;MsgId&quot;</span><span class="p">,</span> <span class="s2">&quot;Message&quot;</span><span class="p">,</span> <span class="s2">&quot;Tokenized&quot;</span><span class="p">,</span> <span class="s2">&quot;Replaced by regex&quot;</span><span class="p">]</span>
-</span><span id="__span-0-487"><a id="__codelineno-0-487" name="__codelineno-0-487"></a>        <span class="n">to_drop</span><span class="o">.</span><span class="n">extend</span><span class="p">(</span>
-</span><span id="__span-0-488"><a id="__codelineno-0-488" name="__codelineno-0-488"></a>            <span class="n">parsed_variables</span><span class="p">[</span><span class="n">parsed_variables</span><span class="p">[</span><span class="s2">&quot;Occurrences&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="mi">0</span><span class="p">][</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
-</span><span id="__span-0-489"><a id="__codelineno-0-489" name="__codelineno-0-489"></a>        <span class="p">)</span>
-</span><span id="__span-0-490"><a id="__codelineno-0-490" name="__codelineno-0-490"></a>        <span class="n">parsed_log</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">columns</span><span class="o">=</span><span class="n">to_drop</span><span class="p">)</span>
-</span><span id="__span-0-491"><a id="__codelineno-0-491" name="__codelineno-0-491"></a>        <span class="n">parsed_variables</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-492"><a id="__codelineno-0-492" name="__codelineno-0-492"></a>            <span class="n">parsed_variables</span><span class="p">[</span><span class="o">~</span><span class="n">parsed_variables</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="n">to_drop</span><span class="p">)[</span><span class="s2">&quot;Name&quot;</span><span class="p">]]</span>
-</span><span id="__span-0-493"><a id="__codelineno-0-493" name="__codelineno-0-493"></a>            <span class="o">.</span><span class="n">reset_index</span><span class="p">()</span>
-</span><span id="__span-0-494"><a id="__codelineno-0-494" name="__codelineno-0-494"></a>            <span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">columns</span><span class="o">=</span><span class="s2">&quot;index&quot;</span><span class="p">)</span>
-</span><span id="__span-0-495"><a id="__codelineno-0-495" name="__codelineno-0-495"></a>        <span class="p">)</span>
-</span><span id="__span-0-496"><a id="__codelineno-0-496" name="__codelineno-0-496"></a>
-</span><span id="__span-0-497"><a id="__codelineno-0-497" name="__codelineno-0-497"></a>        <span class="k">return</span> <span class="n">parsed_log</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="p">,</span> <span class="n">parsed_variables</span>
+</span><span id="__span-0-445"><a id="__codelineno-0-445" name="__codelineno-0-445"></a>            <span class="n">parsed_templates_list</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">d</span><span class="o">.</span><span class="n">copy</span><span class="p">())</span>
+</span><span id="__span-0-446"><a id="__codelineno-0-446" name="__codelineno-0-446"></a>
+</span><span id="__span-0-447"><a id="__codelineno-0-447" name="__codelineno-0-447"></a>        <span class="c1"># Create a dataframe of the parsed templates.</span>
+</span><span id="__span-0-448"><a id="__codelineno-0-448" name="__codelineno-0-448"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">parsed_templates_list</span><span class="p">)</span>
+</span><span id="__span-0-449"><a id="__codelineno-0-449" name="__codelineno-0-449"></a>        <span class="n">template_occurences</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">value_counts</span><span class="p">())</span>
+</span><span id="__span-0-450"><a id="__codelineno-0-450" name="__codelineno-0-450"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="p">[</span><span class="s2">&quot;Occurrences&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
+</span><span id="__span-0-451"><a id="__codelineno-0-451" name="__codelineno-0-451"></a>            <span class="n">template_occurences</span>
+</span><span id="__span-0-452"><a id="__codelineno-0-452" name="__codelineno-0-452"></a>        <span class="p">)</span>
+</span><span id="__span-0-453"><a id="__codelineno-0-453" name="__codelineno-0-453"></a>
+</span><span id="__span-0-454"><a id="__codelineno-0-454" name="__codelineno-0-454"></a>        <span class="c1"># Create columns for each variable (parsed or regex-derived) and extract them from each log message.</span>
+</span><span id="__span-0-455"><a id="__codelineno-0-455" name="__codelineno-0-455"></a>        <span class="n">variable_columns</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">rex</span><span class="o">.</span><span class="n">keys</span><span class="p">())</span>
+</span><span id="__span-0-456"><a id="__codelineno-0-456" name="__codelineno-0-456"></a>        <span class="n">variable_columns</span><span class="o">.</span><span class="n">extend</span><span class="p">(</span>
+</span><span id="__span-0-457"><a id="__codelineno-0-457" name="__codelineno-0-457"></a>            <span class="p">[</span>
+</span><span id="__span-0-458"><a id="__codelineno-0-458" name="__codelineno-0-458"></a>                <span class="nb">str</span><span class="p">(</span><span class="n">i</span><span class="p">)</span> <span class="o">+</span> <span class="s2">&quot;_&quot;</span> <span class="o">+</span> <span class="nb">str</span><span class="p">(</span><span class="n">j</span><span class="p">)</span>
+</span><span id="__span-0-459"><a id="__codelineno-0-459" name="__codelineno-0-459"></a>                <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span>
+</span><span id="__span-0-460"><a id="__codelineno-0-460" name="__codelineno-0-460"></a>                <span class="k">for</span> <span class="n">j</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-461"><a id="__codelineno-0-461" name="__codelineno-0-461"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">i</span><span class="p">,</span> <span class="s2">&quot;VariableIndices&quot;</span>
+</span><span id="__span-0-462"><a id="__codelineno-0-462" name="__codelineno-0-462"></a>                <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-463"><a id="__codelineno-0-463" name="__codelineno-0-463"></a>            <span class="p">]</span>
+</span><span id="__span-0-464"><a id="__codelineno-0-464" name="__codelineno-0-464"></a>        <span class="p">)</span>
+</span><span id="__span-0-465"><a id="__codelineno-0-465" name="__codelineno-0-465"></a>        <span class="n">par_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span>
+</span><span id="__span-0-466"><a id="__codelineno-0-466" name="__codelineno-0-466"></a>            <span class="n">columns</span><span class="o">=</span><span class="n">variable_columns</span><span class="p">,</span> <span class="n">index</span><span class="o">=</span><span class="nb">range</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
+</span><span id="__span-0-467"><a id="__codelineno-0-467" name="__codelineno-0-467"></a>        <span class="p">)</span>
+</span><span id="__span-0-468"><a id="__codelineno-0-468" name="__codelineno-0-468"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">concat</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="p">,</span> <span class="n">par_df</span><span class="p">),</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="__span-0-469"><a id="__codelineno-0-469" name="__codelineno-0-469"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_extract_variables</span><span class="p">()</span>
+</span><span id="__span-0-470"><a id="__codelineno-0-470" name="__codelineno-0-470"></a>
+</span><span id="__span-0-471"><a id="__codelineno-0-471" name="__codelineno-0-471"></a>        <span class="c1"># Create a dataframe of the parsed variables.</span>
+</span><span id="__span-0-472"><a id="__codelineno-0-472" name="__codelineno-0-472"></a>        <span class="n">parsed_variables</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">()</span>
+</span><span id="__span-0-473"><a id="__codelineno-0-473" name="__codelineno-0-473"></a>        <span class="n">parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">variable_columns</span>
+</span><span id="__span-0-474"><a id="__codelineno-0-474" name="__codelineno-0-474"></a>        <span class="n">parsed_variables</span><span class="p">[</span><span class="s2">&quot;Occurrences&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
+</span><span id="__span-0-475"><a id="__codelineno-0-475" name="__codelineno-0-475"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="p">[</span><span class="n">x</span><span class="p">]</span><span class="o">.</span><span class="n">notna</span><span class="p">()</span><span class="o">.</span><span class="n">sum</span><span class="p">()</span>
+</span><span id="__span-0-476"><a id="__codelineno-0-476" name="__codelineno-0-476"></a>        <span class="p">)</span>
+</span><span id="__span-0-477"><a id="__codelineno-0-477" name="__codelineno-0-477"></a>        <span class="n">parsed_variables</span><span class="p">[</span><span class="s2">&quot;Preceding 3 tokens&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
+</span><span id="__span-0-478"><a id="__codelineno-0-478" name="__codelineno-0-478"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">Drain</span><span class="o">.</span><span class="n">_preceding_3</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="p">,</span> <span class="n">x</span><span class="p">)</span>
+</span><span id="__span-0-479"><a id="__codelineno-0-479" name="__codelineno-0-479"></a>        <span class="p">)</span>
+</span><span id="__span-0-480"><a id="__codelineno-0-480" name="__codelineno-0-480"></a>        <span class="n">parsed_variables</span><span class="p">[</span><span class="s2">&quot;Examples&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
+</span><span id="__span-0-481"><a id="__codelineno-0-481" name="__codelineno-0-481"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="p">[</span><span class="n">x</span><span class="p">]</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="p">[</span><span class="n">x</span><span class="p">]</span><span class="o">.</span><span class="n">notna</span><span class="p">()]</span><span class="o">.</span><span class="n">unique</span><span class="p">()[:</span><span class="mi">5</span><span class="p">]</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
+</span><span id="__span-0-482"><a id="__codelineno-0-482" name="__codelineno-0-482"></a>        <span class="p">)</span>
+</span><span id="__span-0-483"><a id="__codelineno-0-483" name="__codelineno-0-483"></a>        <span class="n">parsed_variables</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
+</span><span id="__span-0-484"><a id="__codelineno-0-484" name="__codelineno-0-484"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="kc">True</span> <span class="k">if</span> <span class="n">x</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">rex</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span> <span class="k">else</span> <span class="kc">False</span>
+</span><span id="__span-0-485"><a id="__codelineno-0-485" name="__codelineno-0-485"></a>        <span class="p">)</span>
+</span><span id="__span-0-486"><a id="__codelineno-0-486" name="__codelineno-0-486"></a>
+</span><span id="__span-0-487"><a id="__codelineno-0-487" name="__codelineno-0-487"></a>        <span class="c1"># Drop unnecessary columns from the parsed log.</span>
+</span><span id="__span-0-488"><a id="__codelineno-0-488" name="__codelineno-0-488"></a>        <span class="n">to_drop</span> <span class="o">=</span> <span class="p">[</span><span class="s2">&quot;MsgId&quot;</span><span class="p">,</span> <span class="s2">&quot;Message&quot;</span><span class="p">,</span> <span class="s2">&quot;Tokenized&quot;</span><span class="p">,</span> <span class="s2">&quot;Replaced by regex&quot;</span><span class="p">]</span>
+</span><span id="__span-0-489"><a id="__codelineno-0-489" name="__codelineno-0-489"></a>        <span class="n">to_drop</span><span class="o">.</span><span class="n">extend</span><span class="p">(</span>
+</span><span id="__span-0-490"><a id="__codelineno-0-490" name="__codelineno-0-490"></a>            <span class="n">parsed_variables</span><span class="p">[</span><span class="n">parsed_variables</span><span class="p">[</span><span class="s2">&quot;Occurrences&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="mi">0</span><span class="p">][</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
+</span><span id="__span-0-491"><a id="__codelineno-0-491" name="__codelineno-0-491"></a>        <span class="p">)</span>
+</span><span id="__span-0-492"><a id="__codelineno-0-492" name="__codelineno-0-492"></a>        <span class="n">parsed_log</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">columns</span><span class="o">=</span><span class="n">to_drop</span><span class="p">)</span>
+</span><span id="__span-0-493"><a id="__codelineno-0-493" name="__codelineno-0-493"></a>        <span class="n">parsed_variables</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-494"><a id="__codelineno-0-494" name="__codelineno-0-494"></a>            <span class="n">parsed_variables</span><span class="p">[</span><span class="o">~</span><span class="n">parsed_variables</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="n">to_drop</span><span class="p">)[</span><span class="s2">&quot;Name&quot;</span><span class="p">]]</span>
+</span><span id="__span-0-495"><a id="__codelineno-0-495" name="__codelineno-0-495"></a>            <span class="o">.</span><span class="n">reset_index</span><span class="p">()</span>
+</span><span id="__span-0-496"><a id="__codelineno-0-496" name="__codelineno-0-496"></a>            <span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">columns</span><span class="o">=</span><span class="s2">&quot;index&quot;</span><span class="p">)</span>
+</span><span id="__span-0-497"><a id="__codelineno-0-497" name="__codelineno-0-497"></a>        <span class="p">)</span>
 </span><span id="__span-0-498"><a id="__codelineno-0-498" name="__codelineno-0-498"></a>
-</span><span id="__span-0-499"><a id="__codelineno-0-499" name="__codelineno-0-499"></a>    <span class="k">def</span> <span class="nf">_extract_variables</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-500"><a id="__codelineno-0-500" name="__codelineno-0-500"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-501"><a id="__codelineno-0-501" name="__codelineno-0-501"></a><span class="sd">        Extract the variables from the log messages.</span>
-</span><span id="__span-0-502"><a id="__codelineno-0-502" name="__codelineno-0-502"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-503"><a id="__codelineno-0-503" name="__codelineno-0-503"></a>
-</span><span id="__span-0-504"><a id="__codelineno-0-504" name="__codelineno-0-504"></a>        <span class="k">for</span> <span class="n">row</span> <span class="ow">in</span> <span class="n">tqdm</span><span class="p">(</span>
-</span><span id="__span-0-505"><a id="__codelineno-0-505" name="__codelineno-0-505"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="o">.</span><span class="n">itertuples</span><span class="p">(),</span>
-</span><span id="__span-0-506"><a id="__codelineno-0-506" name="__codelineno-0-506"></a>            <span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Extracting variables from each log message...&quot;</span><span class="p">,</span>
-</span><span id="__span-0-507"><a id="__codelineno-0-507" name="__codelineno-0-507"></a>            <span class="n">total</span><span class="o">=</span><span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="p">),</span>
-</span><span id="__span-0-508"><a id="__codelineno-0-508" name="__codelineno-0-508"></a>        <span class="p">):</span>
-</span><span id="__span-0-509"><a id="__codelineno-0-509" name="__codelineno-0-509"></a>            <span class="n">template_id</span> <span class="o">=</span> <span class="n">row</span><span class="o">.</span><span class="n">TemplateId</span>
-</span><span id="__span-0-510"><a id="__codelineno-0-510" name="__codelineno-0-510"></a>            <span class="n">variable_indices</span> <span class="o">=</span> <span class="n">row</span><span class="o">.</span><span class="n">VariableIndices</span>
-</span><span id="__span-0-511"><a id="__codelineno-0-511" name="__codelineno-0-511"></a>
-</span><span id="__span-0-512"><a id="__codelineno-0-512" name="__codelineno-0-512"></a>            <span class="n">mask</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">template_id</span>
-</span><span id="__span-0-513"><a id="__codelineno-0-513" name="__codelineno-0-513"></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">variable_indices</span><span class="p">:</span>
-</span><span id="__span-0-514"><a id="__codelineno-0-514" name="__codelineno-0-514"></a>                <span class="n">col_name</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">template_id</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="nb">str</span><span class="p">(</span><span class="n">i</span><span class="p">)</span><span class="si">}</span><span class="s2">&quot;</span>
-</span><span id="__span-0-515"><a id="__codelineno-0-515" name="__codelineno-0-515"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">mask</span><span class="p">,</span> <span class="n">col_name</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">mask</span><span class="p">,</span> <span class="s2">&quot;Tokenized&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">str</span><span class="p">[</span>
-</span><span id="__span-0-516"><a id="__codelineno-0-516" name="__codelineno-0-516"></a>                    <span class="n">i</span>
-</span><span id="__span-0-517"><a id="__codelineno-0-517" name="__codelineno-0-517"></a>                <span class="p">]</span>
-</span><span id="__span-0-518"><a id="__codelineno-0-518" name="__codelineno-0-518"></a>
-</span><span id="__span-0-519"><a id="__codelineno-0-519" name="__codelineno-0-519"></a>            <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">col_name</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">rex</span><span class="o">.</span><span class="n">keys</span><span class="p">()):</span>
-</span><span id="__span-0-520"><a id="__codelineno-0-520" name="__codelineno-0-520"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">mask</span><span class="p">,</span> <span class="n">col_name</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-521"><a id="__codelineno-0-521" name="__codelineno-0-521"></a>                    <span class="n">mask</span><span class="p">,</span> <span class="s2">&quot;Replaced by regex&quot;</span>
-</span><span id="__span-0-522"><a id="__codelineno-0-522" name="__codelineno-0-522"></a>                <span class="p">]</span><span class="o">.</span><span class="n">str</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
+</span><span id="__span-0-499"><a id="__codelineno-0-499" name="__codelineno-0-499"></a>        <span class="k">return</span> <span class="n">parsed_log</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="p">,</span> <span class="n">parsed_variables</span>
+</span><span id="__span-0-500"><a id="__codelineno-0-500" name="__codelineno-0-500"></a>
+</span><span id="__span-0-501"><a id="__codelineno-0-501" name="__codelineno-0-501"></a>    <span class="k">def</span> <span class="nf">_extract_variables</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-502"><a id="__codelineno-0-502" name="__codelineno-0-502"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-503"><a id="__codelineno-0-503" name="__codelineno-0-503"></a><span class="sd">        Extract the variables from the log messages.</span>
+</span><span id="__span-0-504"><a id="__codelineno-0-504" name="__codelineno-0-504"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-505"><a id="__codelineno-0-505" name="__codelineno-0-505"></a>
+</span><span id="__span-0-506"><a id="__codelineno-0-506" name="__codelineno-0-506"></a>        <span class="k">for</span> <span class="n">row</span> <span class="ow">in</span> <span class="n">tqdm</span><span class="p">(</span>
+</span><span id="__span-0-507"><a id="__codelineno-0-507" name="__codelineno-0-507"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="o">.</span><span class="n">itertuples</span><span class="p">(),</span>
+</span><span id="__span-0-508"><a id="__codelineno-0-508" name="__codelineno-0-508"></a>            <span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Extracting variables from each log message...&quot;</span><span class="p">,</span>
+</span><span id="__span-0-509"><a id="__codelineno-0-509" name="__codelineno-0-509"></a>            <span class="n">total</span><span class="o">=</span><span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="p">),</span>
+</span><span id="__span-0-510"><a id="__codelineno-0-510" name="__codelineno-0-510"></a>        <span class="p">):</span>
+</span><span id="__span-0-511"><a id="__codelineno-0-511" name="__codelineno-0-511"></a>            <span class="n">template_id</span> <span class="o">=</span> <span class="n">row</span><span class="o">.</span><span class="n">TemplateId</span>
+</span><span id="__span-0-512"><a id="__codelineno-0-512" name="__codelineno-0-512"></a>            <span class="n">variable_indices</span> <span class="o">=</span> <span class="n">row</span><span class="o">.</span><span class="n">VariableIndices</span>
+</span><span id="__span-0-513"><a id="__codelineno-0-513" name="__codelineno-0-513"></a>
+</span><span id="__span-0-514"><a id="__codelineno-0-514" name="__codelineno-0-514"></a>            <span class="n">mask</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">template_id</span>
+</span><span id="__span-0-515"><a id="__codelineno-0-515" name="__codelineno-0-515"></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">variable_indices</span><span class="p">:</span>
+</span><span id="__span-0-516"><a id="__codelineno-0-516" name="__codelineno-0-516"></a>                <span class="n">col_name</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">template_id</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="nb">str</span><span class="p">(</span><span class="n">i</span><span class="p">)</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="__span-0-517"><a id="__codelineno-0-517" name="__codelineno-0-517"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">mask</span><span class="p">,</span> <span class="n">col_name</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">mask</span><span class="p">,</span> <span class="s2">&quot;Tokenized&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">str</span><span class="p">[</span>
+</span><span id="__span-0-518"><a id="__codelineno-0-518" name="__codelineno-0-518"></a>                    <span class="n">i</span>
+</span><span id="__span-0-519"><a id="__codelineno-0-519" name="__codelineno-0-519"></a>                <span class="p">]</span>
+</span><span id="__span-0-520"><a id="__codelineno-0-520" name="__codelineno-0-520"></a>
+</span><span id="__span-0-521"><a id="__codelineno-0-521" name="__codelineno-0-521"></a>            <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">col_name</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">rex</span><span class="o">.</span><span class="n">keys</span><span class="p">()):</span>
+</span><span id="__span-0-522"><a id="__codelineno-0-522" name="__codelineno-0-522"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">mask</span><span class="p">,</span> <span class="n">col_name</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-523"><a id="__codelineno-0-523" name="__codelineno-0-523"></a>                    <span class="n">mask</span><span class="p">,</span> <span class="s2">&quot;Replaced by regex&quot;</span>
+</span><span id="__span-0-524"><a id="__codelineno-0-524" name="__codelineno-0-524"></a>                <span class="p">]</span><span class="o">.</span><span class="n">str</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
 </span></code></pre></div></td></tr></table></div>
               </details>
 
@@ -2869,9 +2869,7 @@ <h3 id="logos.drain.Drain.__init__" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/drain.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-56">56</a></span>
-<span class="normal"><a href="#__codelineno-0-57">57</a></span>
-<span class="normal"><a href="#__codelineno-0-58">58</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-58">58</a></span>
 <span class="normal"><a href="#__codelineno-0-59">59</a></span>
 <span class="normal"><a href="#__codelineno-0-60">60</a></span>
 <span class="normal"><a href="#__codelineno-0-61">61</a></span>
@@ -2897,35 +2895,37 @@ <h3 id="logos.drain.Drain.__init__" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-81">81</a></span>
 <span class="normal"><a href="#__codelineno-0-82">82</a></span>
 <span class="normal"><a href="#__codelineno-0-83">83</a></span>
-<span class="normal"><a href="#__codelineno-0-84">84</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-56"><a id="__codelineno-0-56" name="__codelineno-0-56"></a><span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
-</span><span id="__span-0-57"><a id="__codelineno-0-57" name="__codelineno-0-57"></a>    <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-58"><a id="__codelineno-0-58" name="__codelineno-0-58"></a>    <span class="n">indir</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;.&quot;</span><span class="p">,</span>
-</span><span id="__span-0-59"><a id="__codelineno-0-59" name="__codelineno-0-59"></a>    <span class="n">depth</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">4</span><span class="p">,</span>
-</span><span id="__span-0-60"><a id="__codelineno-0-60" name="__codelineno-0-60"></a>    <span class="n">st</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.4</span><span class="p">,</span>
-</span><span id="__span-0-61"><a id="__codelineno-0-61" name="__codelineno-0-61"></a>    <span class="n">max_children</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">100</span><span class="p">,</span>
-</span><span id="__span-0-62"><a id="__codelineno-0-62" name="__codelineno-0-62"></a>    <span class="n">rex</span><span class="p">:</span> <span class="nb">dict</span> <span class="o">=</span> <span class="p">{},</span>
-</span><span id="__span-0-63"><a id="__codelineno-0-63" name="__codelineno-0-63"></a>    <span class="n">skip_writeout</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="__span-0-64"><a id="__codelineno-0-64" name="__codelineno-0-64"></a>    <span class="n">message_prefix</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="sa">r</span><span class="s2">&quot;.*&quot;</span><span class="p">,</span>
-</span><span id="__span-0-65"><a id="__codelineno-0-65" name="__codelineno-0-65"></a><span class="p">):</span>
-</span><span id="__span-0-66"><a id="__codelineno-0-66" name="__codelineno-0-66"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-67"><a id="__codelineno-0-67" name="__codelineno-0-67"></a><span class="sd">    Initialize a Drain-based parser.</span>
-</span><span id="__span-0-68"><a id="__codelineno-0-68" name="__codelineno-0-68"></a>
-</span><span id="__span-0-69"><a id="__codelineno-0-69" name="__codelineno-0-69"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-70"><a id="__codelineno-0-70" name="__codelineno-0-70"></a><span class="sd">        indir: the input directory stores the input log file name</span>
-</span><span id="__span-0-71"><a id="__codelineno-0-71" name="__codelineno-0-71"></a><span class="sd">        depth: depth of all leaf nodes</span>
-</span><span id="__span-0-72"><a id="__codelineno-0-72" name="__codelineno-0-72"></a><span class="sd">        st: similarity threshold</span>
-</span><span id="__span-0-73"><a id="__codelineno-0-73" name="__codelineno-0-73"></a><span class="sd">        max_children: max number of children of an internal node</span>
-</span><span id="__span-0-74"><a id="__codelineno-0-74" name="__codelineno-0-74"></a><span class="sd">        rex: regular expressions used in preprocessing, provided as a dictionary from field name to field regex</span>
-</span><span id="__span-0-75"><a id="__codelineno-0-75" name="__codelineno-0-75"></a><span class="sd">        skip_writeout: whether to skip writing out the parsed log file, templates and variables.</span>
-</span><span id="__span-0-76"><a id="__codelineno-0-76" name="__codelineno-0-76"></a><span class="sd">        message_prefix: prefix that starts each message of the log file - lines are merged to their preceding line if they do not start with this prefix.</span>
-</span><span id="__span-0-77"><a id="__codelineno-0-77" name="__codelineno-0-77"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-78"><a id="__codelineno-0-78" name="__codelineno-0-78"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">indir</span> <span class="o">=</span> <span class="n">indir</span>
-</span><span id="__span-0-79"><a id="__codelineno-0-79" name="__codelineno-0-79"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">depth</span> <span class="o">=</span> <span class="n">depth</span> <span class="o">-</span> <span class="mi">2</span>
-</span><span id="__span-0-80"><a id="__codelineno-0-80" name="__codelineno-0-80"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">st</span> <span class="o">=</span> <span class="n">st</span>
-</span><span id="__span-0-81"><a id="__codelineno-0-81" name="__codelineno-0-81"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">max_children</span> <span class="o">=</span> <span class="n">max_children</span>
-</span><span id="__span-0-82"><a id="__codelineno-0-82" name="__codelineno-0-82"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rex</span> <span class="o">=</span> <span class="n">rex</span>
-</span><span id="__span-0-83"><a id="__codelineno-0-83" name="__codelineno-0-83"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">skip_writeout</span> <span class="o">=</span> <span class="n">skip_writeout</span>
-</span><span id="__span-0-84"><a id="__codelineno-0-84" name="__codelineno-0-84"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">message_prefix</span> <span class="o">=</span> <span class="n">message_prefix</span>
+<span class="normal"><a href="#__codelineno-0-84">84</a></span>
+<span class="normal"><a href="#__codelineno-0-85">85</a></span>
+<span class="normal"><a href="#__codelineno-0-86">86</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-58"><a id="__codelineno-0-58" name="__codelineno-0-58"></a><span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="__span-0-59"><a id="__codelineno-0-59" name="__codelineno-0-59"></a>    <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-60"><a id="__codelineno-0-60" name="__codelineno-0-60"></a>    <span class="n">indir</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;.&quot;</span><span class="p">,</span>
+</span><span id="__span-0-61"><a id="__codelineno-0-61" name="__codelineno-0-61"></a>    <span class="n">depth</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">4</span><span class="p">,</span>
+</span><span id="__span-0-62"><a id="__codelineno-0-62" name="__codelineno-0-62"></a>    <span class="n">st</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.4</span><span class="p">,</span>
+</span><span id="__span-0-63"><a id="__codelineno-0-63" name="__codelineno-0-63"></a>    <span class="n">max_children</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">100</span><span class="p">,</span>
+</span><span id="__span-0-64"><a id="__codelineno-0-64" name="__codelineno-0-64"></a>    <span class="n">rex</span><span class="p">:</span> <span class="nb">dict</span> <span class="o">=</span> <span class="p">{},</span>
+</span><span id="__span-0-65"><a id="__codelineno-0-65" name="__codelineno-0-65"></a>    <span class="n">skip_writeout</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-66"><a id="__codelineno-0-66" name="__codelineno-0-66"></a>    <span class="n">message_prefix</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="sa">r</span><span class="s2">&quot;.*&quot;</span><span class="p">,</span>
+</span><span id="__span-0-67"><a id="__codelineno-0-67" name="__codelineno-0-67"></a><span class="p">):</span>
+</span><span id="__span-0-68"><a id="__codelineno-0-68" name="__codelineno-0-68"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-69"><a id="__codelineno-0-69" name="__codelineno-0-69"></a><span class="sd">    Initialize a Drain-based parser.</span>
+</span><span id="__span-0-70"><a id="__codelineno-0-70" name="__codelineno-0-70"></a>
+</span><span id="__span-0-71"><a id="__codelineno-0-71" name="__codelineno-0-71"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-72"><a id="__codelineno-0-72" name="__codelineno-0-72"></a><span class="sd">        indir: the input directory stores the input log file name</span>
+</span><span id="__span-0-73"><a id="__codelineno-0-73" name="__codelineno-0-73"></a><span class="sd">        depth: depth of all leaf nodes</span>
+</span><span id="__span-0-74"><a id="__codelineno-0-74" name="__codelineno-0-74"></a><span class="sd">        st: similarity threshold</span>
+</span><span id="__span-0-75"><a id="__codelineno-0-75" name="__codelineno-0-75"></a><span class="sd">        max_children: max number of children of an internal node</span>
+</span><span id="__span-0-76"><a id="__codelineno-0-76" name="__codelineno-0-76"></a><span class="sd">        rex: regular expressions used in preprocessing, provided as a dictionary from field name to field regex</span>
+</span><span id="__span-0-77"><a id="__codelineno-0-77" name="__codelineno-0-77"></a><span class="sd">        skip_writeout: whether to skip writing out the parsed log file, templates and variables.</span>
+</span><span id="__span-0-78"><a id="__codelineno-0-78" name="__codelineno-0-78"></a><span class="sd">        message_prefix: prefix that starts each message of the log file - lines are merged to their preceding line if they do not start with this prefix.</span>
+</span><span id="__span-0-79"><a id="__codelineno-0-79" name="__codelineno-0-79"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-80"><a id="__codelineno-0-80" name="__codelineno-0-80"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">indir</span> <span class="o">=</span> <span class="n">indir</span>
+</span><span id="__span-0-81"><a id="__codelineno-0-81" name="__codelineno-0-81"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">depth</span> <span class="o">=</span> <span class="n">depth</span> <span class="o">-</span> <span class="mi">2</span>
+</span><span id="__span-0-82"><a id="__codelineno-0-82" name="__codelineno-0-82"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">st</span> <span class="o">=</span> <span class="n">st</span>
+</span><span id="__span-0-83"><a id="__codelineno-0-83" name="__codelineno-0-83"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">max_children</span> <span class="o">=</span> <span class="n">max_children</span>
+</span><span id="__span-0-84"><a id="__codelineno-0-84" name="__codelineno-0-84"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rex</span> <span class="o">=</span> <span class="n">rex</span>
+</span><span id="__span-0-85"><a id="__codelineno-0-85" name="__codelineno-0-85"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">skip_writeout</span> <span class="o">=</span> <span class="n">skip_writeout</span>
+</span><span id="__span-0-86"><a id="__codelineno-0-86" name="__codelineno-0-86"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">message_prefix</span> <span class="o">=</span> <span class="n">message_prefix</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -3009,9 +3009,7 @@ <h3 id="logos.drain.Drain.parse" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/drain.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-86"> 86</a></span>
-<span class="normal"><a href="#__codelineno-0-87"> 87</a></span>
-<span class="normal"><a href="#__codelineno-0-88"> 88</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-88"> 88</a></span>
 <span class="normal"><a href="#__codelineno-0-89"> 89</a></span>
 <span class="normal"><a href="#__codelineno-0-90"> 90</a></span>
 <span class="normal"><a href="#__codelineno-0-91"> 91</a></span>
@@ -3031,29 +3029,31 @@ <h3 id="logos.drain.Drain.parse" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-105">105</a></span>
 <span class="normal"><a href="#__codelineno-0-106">106</a></span>
 <span class="normal"><a href="#__codelineno-0-107">107</a></span>
-<span class="normal"><a href="#__codelineno-0-108">108</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-86"><a id="__codelineno-0-86" name="__codelineno-0-86"></a><span class="k">def</span> <span class="nf">parse</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filename</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">]:</span>
-</span><span id="__span-0-87"><a id="__codelineno-0-87" name="__codelineno-0-87"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-88"><a id="__codelineno-0-88" name="__codelineno-0-88"></a><span class="sd">    Parse a log file.</span>
-</span><span id="__span-0-89"><a id="__codelineno-0-89" name="__codelineno-0-89"></a>
-</span><span id="__span-0-90"><a id="__codelineno-0-90" name="__codelineno-0-90"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-91"><a id="__codelineno-0-91" name="__codelineno-0-91"></a><span class="sd">        filename: The name of the log file to parse (without path).</span>
-</span><span id="__span-0-92"><a id="__codelineno-0-92" name="__codelineno-0-92"></a>
-</span><span id="__span-0-93"><a id="__codelineno-0-93" name="__codelineno-0-93"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-94"><a id="__codelineno-0-94" name="__codelineno-0-94"></a><span class="sd">        A tuple of three dataframes, containing the parsed log file, the parsed log templates,</span>
-</span><span id="__span-0-95"><a id="__codelineno-0-95" name="__codelineno-0-95"></a><span class="sd">        and the parsed variables respectively.</span>
-</span><span id="__span-0-96"><a id="__codelineno-0-96" name="__codelineno-0-96"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-97"><a id="__codelineno-0-97" name="__codelineno-0-97"></a>
-</span><span id="__span-0-98"><a id="__codelineno-0-98" name="__codelineno-0-98"></a>    <span class="n">full_path</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">indir</span><span class="p">,</span> <span class="n">filename</span><span class="p">)</span>
-</span><span id="__span-0-99"><a id="__codelineno-0-99" name="__codelineno-0-99"></a>    <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Parsing file: </span><span class="si">{</span><span class="n">full_path</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="__span-0-100"><a id="__codelineno-0-100" name="__codelineno-0-100"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">filename</span> <span class="o">=</span> <span class="n">filename</span>
-</span><span id="__span-0-101"><a id="__codelineno-0-101" name="__codelineno-0-101"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">root</span> <span class="o">=</span> <span class="n">Node</span><span class="p">()</span>
-</span><span id="__span-0-102"><a id="__codelineno-0-102" name="__codelineno-0-102"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">cluster_list</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-103"><a id="__codelineno-0-103" name="__codelineno-0-103"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_to_df</span><span class="p">(</span><span class="n">full_path</span><span class="p">)</span>
-</span><span id="__span-0-104"><a id="__codelineno-0-104" name="__codelineno-0-104"></a>
-</span><span id="__span-0-105"><a id="__codelineno-0-105" name="__codelineno-0-105"></a>    <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Determining template for each line...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-106"><a id="__codelineno-0-106" name="__codelineno-0-106"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parse_message</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="__span-0-107"><a id="__codelineno-0-107" name="__codelineno-0-107"></a>
-</span><span id="__span-0-108"><a id="__codelineno-0-108" name="__codelineno-0-108"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_postprocess</span><span class="p">()</span>
+<span class="normal"><a href="#__codelineno-0-108">108</a></span>
+<span class="normal"><a href="#__codelineno-0-109">109</a></span>
+<span class="normal"><a href="#__codelineno-0-110">110</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-88"><a id="__codelineno-0-88" name="__codelineno-0-88"></a><span class="k">def</span> <span class="nf">parse</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filename</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">]:</span>
+</span><span id="__span-0-89"><a id="__codelineno-0-89" name="__codelineno-0-89"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-90"><a id="__codelineno-0-90" name="__codelineno-0-90"></a><span class="sd">    Parse a log file.</span>
+</span><span id="__span-0-91"><a id="__codelineno-0-91" name="__codelineno-0-91"></a>
+</span><span id="__span-0-92"><a id="__codelineno-0-92" name="__codelineno-0-92"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-93"><a id="__codelineno-0-93" name="__codelineno-0-93"></a><span class="sd">        filename: The name of the log file to parse (without path).</span>
+</span><span id="__span-0-94"><a id="__codelineno-0-94" name="__codelineno-0-94"></a>
+</span><span id="__span-0-95"><a id="__codelineno-0-95" name="__codelineno-0-95"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-96"><a id="__codelineno-0-96" name="__codelineno-0-96"></a><span class="sd">        A tuple of three dataframes, containing the parsed log file, the parsed log templates,</span>
+</span><span id="__span-0-97"><a id="__codelineno-0-97" name="__codelineno-0-97"></a><span class="sd">        and the parsed variables respectively.</span>
+</span><span id="__span-0-98"><a id="__codelineno-0-98" name="__codelineno-0-98"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-99"><a id="__codelineno-0-99" name="__codelineno-0-99"></a>
+</span><span id="__span-0-100"><a id="__codelineno-0-100" name="__codelineno-0-100"></a>    <span class="n">full_path</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">indir</span><span class="p">,</span> <span class="n">filename</span><span class="p">)</span>
+</span><span id="__span-0-101"><a id="__codelineno-0-101" name="__codelineno-0-101"></a>    <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Parsing file: </span><span class="si">{</span><span class="n">full_path</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-102"><a id="__codelineno-0-102" name="__codelineno-0-102"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">filename</span> <span class="o">=</span> <span class="n">filename</span>
+</span><span id="__span-0-103"><a id="__codelineno-0-103" name="__codelineno-0-103"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">root</span> <span class="o">=</span> <span class="n">Node</span><span class="p">()</span>
+</span><span id="__span-0-104"><a id="__codelineno-0-104" name="__codelineno-0-104"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">cluster_list</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-105"><a id="__codelineno-0-105" name="__codelineno-0-105"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_to_df</span><span class="p">(</span><span class="n">full_path</span><span class="p">)</span>
+</span><span id="__span-0-106"><a id="__codelineno-0-106" name="__codelineno-0-106"></a>
+</span><span id="__span-0-107"><a id="__codelineno-0-107" name="__codelineno-0-107"></a>    <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Determining template for each line...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-108"><a id="__codelineno-0-108" name="__codelineno-0-108"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parse_message</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="__span-0-109"><a id="__codelineno-0-109" name="__codelineno-0-109"></a>
+</span><span id="__span-0-110"><a id="__codelineno-0-110" name="__codelineno-0-110"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_postprocess</span><span class="p">()</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -3127,9 +3127,7 @@ <h3 id="logos.drain.Drain._to_df" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/drain.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-110">110</a></span>
-<span class="normal"><a href="#__codelineno-0-111">111</a></span>
-<span class="normal"><a href="#__codelineno-0-112">112</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-112">112</a></span>
 <span class="normal"><a href="#__codelineno-0-113">113</a></span>
 <span class="normal"><a href="#__codelineno-0-114">114</a></span>
 <span class="normal"><a href="#__codelineno-0-115">115</a></span>
@@ -3169,49 +3167,51 @@ <h3 id="logos.drain.Drain._to_df" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-149">149</a></span>
 <span class="normal"><a href="#__codelineno-0-150">150</a></span>
 <span class="normal"><a href="#__codelineno-0-151">151</a></span>
-<span class="normal"><a href="#__codelineno-0-152">152</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-110"><a id="__codelineno-0-110" name="__codelineno-0-110"></a><span class="k">def</span> <span class="nf">_to_df</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">log_file</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
-</span><span id="__span-0-111"><a id="__codelineno-0-111" name="__codelineno-0-111"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-112"><a id="__codelineno-0-112" name="__codelineno-0-112"></a><span class="sd">    Transform a log file into a dataframe.</span>
-</span><span id="__span-0-113"><a id="__codelineno-0-113" name="__codelineno-0-113"></a>
-</span><span id="__span-0-114"><a id="__codelineno-0-114" name="__codelineno-0-114"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-115"><a id="__codelineno-0-115" name="__codelineno-0-115"></a><span class="sd">        log_file: The path to the log file.</span>
-</span><span id="__span-0-116"><a id="__codelineno-0-116" name="__codelineno-0-116"></a>
-</span><span id="__span-0-117"><a id="__codelineno-0-117" name="__codelineno-0-117"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-118"><a id="__codelineno-0-118" name="__codelineno-0-118"></a><span class="sd">        A dataframe containing the log file&#39;s lines, tokenized and with regexes replaced.</span>
-</span><span id="__span-0-119"><a id="__codelineno-0-119" name="__codelineno-0-119"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-120"><a id="__codelineno-0-120" name="__codelineno-0-120"></a>
-</span><span id="__span-0-121"><a id="__codelineno-0-121" name="__codelineno-0-121"></a>    <span class="n">log_messages</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-122"><a id="__codelineno-0-122" name="__codelineno-0-122"></a>    <span class="n">linecount</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="__span-0-123"><a id="__codelineno-0-123" name="__codelineno-0-123"></a>
-</span><span id="__span-0-124"><a id="__codelineno-0-124" name="__codelineno-0-124"></a>    <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="n">log_file</span><span class="p">,</span> <span class="s2">&quot;r&quot;</span><span class="p">)</span> <span class="k">as</span> <span class="n">f</span><span class="p">:</span>
-</span><span id="__span-0-125"><a id="__codelineno-0-125" name="__codelineno-0-125"></a>        <span class="n">log_message</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-126"><a id="__codelineno-0-126" name="__codelineno-0-126"></a>
-</span><span id="__span-0-127"><a id="__codelineno-0-127" name="__codelineno-0-127"></a>        <span class="k">for</span> <span class="n">line</span> <span class="ow">in</span> <span class="n">tqdm</span><span class="p">(</span><span class="n">f</span><span class="o">.</span><span class="n">readlines</span><span class="p">(),</span> <span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Reading and tokenizing log lines...&quot;</span><span class="p">):</span>
-</span><span id="__span-0-128"><a id="__codelineno-0-128" name="__codelineno-0-128"></a>            <span class="n">line</span> <span class="o">=</span> <span class="n">line</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
-</span><span id="__span-0-129"><a id="__codelineno-0-129" name="__codelineno-0-129"></a>
-</span><span id="__span-0-130"><a id="__codelineno-0-130" name="__codelineno-0-130"></a>            <span class="k">if</span> <span class="n">re</span><span class="o">.</span><span class="n">match</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">message_prefix</span><span class="p">,</span> <span class="n">line</span><span class="p">):</span>
-</span><span id="__span-0-131"><a id="__codelineno-0-131" name="__codelineno-0-131"></a>                <span class="k">if</span> <span class="n">log_message</span><span class="p">:</span>
-</span><span id="__span-0-132"><a id="__codelineno-0-132" name="__codelineno-0-132"></a>                    <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-133"><a id="__codelineno-0-133" name="__codelineno-0-133"></a>                        <span class="n">log_messages</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_preprocess</span><span class="p">(</span><span class="n">log_message</span><span class="p">))</span>
-</span><span id="__span-0-134"><a id="__codelineno-0-134" name="__codelineno-0-134"></a>                        <span class="n">linecount</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="__span-0-135"><a id="__codelineno-0-135" name="__codelineno-0-135"></a>                    <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
-</span><span id="__span-0-136"><a id="__codelineno-0-136" name="__codelineno-0-136"></a>                        <span class="k">raise</span> <span class="ne">ValueError</span>
-</span><span id="__span-0-137"><a id="__codelineno-0-137" name="__codelineno-0-137"></a>                <span class="n">log_message</span> <span class="o">=</span> <span class="n">line</span>
-</span><span id="__span-0-138"><a id="__codelineno-0-138" name="__codelineno-0-138"></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-139"><a id="__codelineno-0-139" name="__codelineno-0-139"></a>                <span class="n">log_message</span> <span class="o">+=</span> <span class="s2">&quot; &quot;</span> <span class="o">+</span> <span class="n">line</span>
-</span><span id="__span-0-140"><a id="__codelineno-0-140" name="__codelineno-0-140"></a>
-</span><span id="__span-0-141"><a id="__codelineno-0-141" name="__codelineno-0-141"></a>        <span class="k">if</span> <span class="n">log_message</span><span class="p">:</span>
-</span><span id="__span-0-142"><a id="__codelineno-0-142" name="__codelineno-0-142"></a>            <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-143"><a id="__codelineno-0-143" name="__codelineno-0-143"></a>                <span class="n">log_messages</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_preprocess</span><span class="p">(</span><span class="n">log_message</span><span class="p">))</span>
-</span><span id="__span-0-144"><a id="__codelineno-0-144" name="__codelineno-0-144"></a>                <span class="n">linecount</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="__span-0-145"><a id="__codelineno-0-145" name="__codelineno-0-145"></a>            <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
-</span><span id="__span-0-146"><a id="__codelineno-0-146" name="__codelineno-0-146"></a>                <span class="k">raise</span> <span class="ne">ValueError</span>
-</span><span id="__span-0-147"><a id="__codelineno-0-147" name="__codelineno-0-147"></a>
-</span><span id="__span-0-148"><a id="__codelineno-0-148" name="__codelineno-0-148"></a>    <span class="n">logdf</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span>
-</span><span id="__span-0-149"><a id="__codelineno-0-149" name="__codelineno-0-149"></a>        <span class="n">log_messages</span><span class="p">,</span> <span class="n">columns</span><span class="o">=</span><span class="p">[</span><span class="s2">&quot;Message&quot;</span><span class="p">,</span> <span class="s2">&quot;Tokenized&quot;</span><span class="p">,</span> <span class="s2">&quot;Replaced by regex&quot;</span><span class="p">]</span>
-</span><span id="__span-0-150"><a id="__codelineno-0-150" name="__codelineno-0-150"></a>    <span class="p">)</span>
-</span><span id="__span-0-151"><a id="__codelineno-0-151" name="__codelineno-0-151"></a>    <span class="n">logdf</span><span class="p">[</span><span class="s2">&quot;MsgId&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">logdf</span><span class="p">))</span>
-</span><span id="__span-0-152"><a id="__codelineno-0-152" name="__codelineno-0-152"></a>    <span class="k">return</span> <span class="n">logdf</span>
+<span class="normal"><a href="#__codelineno-0-152">152</a></span>
+<span class="normal"><a href="#__codelineno-0-153">153</a></span>
+<span class="normal"><a href="#__codelineno-0-154">154</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-112"><a id="__codelineno-0-112" name="__codelineno-0-112"></a><span class="k">def</span> <span class="nf">_to_df</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">log_file</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
+</span><span id="__span-0-113"><a id="__codelineno-0-113" name="__codelineno-0-113"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-114"><a id="__codelineno-0-114" name="__codelineno-0-114"></a><span class="sd">    Transform a log file into a dataframe.</span>
+</span><span id="__span-0-115"><a id="__codelineno-0-115" name="__codelineno-0-115"></a>
+</span><span id="__span-0-116"><a id="__codelineno-0-116" name="__codelineno-0-116"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-117"><a id="__codelineno-0-117" name="__codelineno-0-117"></a><span class="sd">        log_file: The path to the log file.</span>
+</span><span id="__span-0-118"><a id="__codelineno-0-118" name="__codelineno-0-118"></a>
+</span><span id="__span-0-119"><a id="__codelineno-0-119" name="__codelineno-0-119"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-120"><a id="__codelineno-0-120" name="__codelineno-0-120"></a><span class="sd">        A dataframe containing the log file&#39;s lines, tokenized and with regexes replaced.</span>
+</span><span id="__span-0-121"><a id="__codelineno-0-121" name="__codelineno-0-121"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-122"><a id="__codelineno-0-122" name="__codelineno-0-122"></a>
+</span><span id="__span-0-123"><a id="__codelineno-0-123" name="__codelineno-0-123"></a>    <span class="n">log_messages</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-124"><a id="__codelineno-0-124" name="__codelineno-0-124"></a>    <span class="n">linecount</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="__span-0-125"><a id="__codelineno-0-125" name="__codelineno-0-125"></a>
+</span><span id="__span-0-126"><a id="__codelineno-0-126" name="__codelineno-0-126"></a>    <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="n">log_file</span><span class="p">,</span> <span class="s2">&quot;r&quot;</span><span class="p">)</span> <span class="k">as</span> <span class="n">f</span><span class="p">:</span>
+</span><span id="__span-0-127"><a id="__codelineno-0-127" name="__codelineno-0-127"></a>        <span class="n">log_message</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-128"><a id="__codelineno-0-128" name="__codelineno-0-128"></a>
+</span><span id="__span-0-129"><a id="__codelineno-0-129" name="__codelineno-0-129"></a>        <span class="k">for</span> <span class="n">line</span> <span class="ow">in</span> <span class="n">tqdm</span><span class="p">(</span><span class="n">f</span><span class="o">.</span><span class="n">readlines</span><span class="p">(),</span> <span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Reading and tokenizing log lines...&quot;</span><span class="p">):</span>
+</span><span id="__span-0-130"><a id="__codelineno-0-130" name="__codelineno-0-130"></a>            <span class="n">line</span> <span class="o">=</span> <span class="n">line</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
+</span><span id="__span-0-131"><a id="__codelineno-0-131" name="__codelineno-0-131"></a>
+</span><span id="__span-0-132"><a id="__codelineno-0-132" name="__codelineno-0-132"></a>            <span class="k">if</span> <span class="n">re</span><span class="o">.</span><span class="n">match</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">message_prefix</span><span class="p">,</span> <span class="n">line</span><span class="p">):</span>
+</span><span id="__span-0-133"><a id="__codelineno-0-133" name="__codelineno-0-133"></a>                <span class="k">if</span> <span class="n">log_message</span><span class="p">:</span>
+</span><span id="__span-0-134"><a id="__codelineno-0-134" name="__codelineno-0-134"></a>                    <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-135"><a id="__codelineno-0-135" name="__codelineno-0-135"></a>                        <span class="n">log_messages</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_preprocess</span><span class="p">(</span><span class="n">log_message</span><span class="p">))</span>
+</span><span id="__span-0-136"><a id="__codelineno-0-136" name="__codelineno-0-136"></a>                        <span class="n">linecount</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="__span-0-137"><a id="__codelineno-0-137" name="__codelineno-0-137"></a>                    <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-138"><a id="__codelineno-0-138" name="__codelineno-0-138"></a>                        <span class="k">raise</span> <span class="ne">ValueError</span>
+</span><span id="__span-0-139"><a id="__codelineno-0-139" name="__codelineno-0-139"></a>                <span class="n">log_message</span> <span class="o">=</span> <span class="n">line</span>
+</span><span id="__span-0-140"><a id="__codelineno-0-140" name="__codelineno-0-140"></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-141"><a id="__codelineno-0-141" name="__codelineno-0-141"></a>                <span class="n">log_message</span> <span class="o">+=</span> <span class="s2">&quot; &quot;</span> <span class="o">+</span> <span class="n">line</span>
+</span><span id="__span-0-142"><a id="__codelineno-0-142" name="__codelineno-0-142"></a>
+</span><span id="__span-0-143"><a id="__codelineno-0-143" name="__codelineno-0-143"></a>        <span class="k">if</span> <span class="n">log_message</span><span class="p">:</span>
+</span><span id="__span-0-144"><a id="__codelineno-0-144" name="__codelineno-0-144"></a>            <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-145"><a id="__codelineno-0-145" name="__codelineno-0-145"></a>                <span class="n">log_messages</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_preprocess</span><span class="p">(</span><span class="n">log_message</span><span class="p">))</span>
+</span><span id="__span-0-146"><a id="__codelineno-0-146" name="__codelineno-0-146"></a>                <span class="n">linecount</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="__span-0-147"><a id="__codelineno-0-147" name="__codelineno-0-147"></a>            <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-148"><a id="__codelineno-0-148" name="__codelineno-0-148"></a>                <span class="k">raise</span> <span class="ne">ValueError</span>
+</span><span id="__span-0-149"><a id="__codelineno-0-149" name="__codelineno-0-149"></a>
+</span><span id="__span-0-150"><a id="__codelineno-0-150" name="__codelineno-0-150"></a>    <span class="n">logdf</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span>
+</span><span id="__span-0-151"><a id="__codelineno-0-151" name="__codelineno-0-151"></a>        <span class="n">log_messages</span><span class="p">,</span> <span class="n">columns</span><span class="o">=</span><span class="p">[</span><span class="s2">&quot;Message&quot;</span><span class="p">,</span> <span class="s2">&quot;Tokenized&quot;</span><span class="p">,</span> <span class="s2">&quot;Replaced by regex&quot;</span><span class="p">]</span>
+</span><span id="__span-0-152"><a id="__codelineno-0-152" name="__codelineno-0-152"></a>    <span class="p">)</span>
+</span><span id="__span-0-153"><a id="__codelineno-0-153" name="__codelineno-0-153"></a>    <span class="n">logdf</span><span class="p">[</span><span class="s2">&quot;MsgId&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">logdf</span><span class="p">))</span>
+</span><span id="__span-0-154"><a id="__codelineno-0-154" name="__codelineno-0-154"></a>    <span class="k">return</span> <span class="n">logdf</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -3285,9 +3285,7 @@ <h3 id="logos.drain.Drain._preprocess" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/drain.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-154">154</a></span>
-<span class="normal"><a href="#__codelineno-0-155">155</a></span>
-<span class="normal"><a href="#__codelineno-0-156">156</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-156">156</a></span>
 <span class="normal"><a href="#__codelineno-0-157">157</a></span>
 <span class="normal"><a href="#__codelineno-0-158">158</a></span>
 <span class="normal"><a href="#__codelineno-0-159">159</a></span>
@@ -3309,31 +3307,33 @@ <h3 id="logos.drain.Drain._preprocess" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-175">175</a></span>
 <span class="normal"><a href="#__codelineno-0-176">176</a></span>
 <span class="normal"><a href="#__codelineno-0-177">177</a></span>
-<span class="normal"><a href="#__codelineno-0-178">178</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-154"><a id="__codelineno-0-154" name="__codelineno-0-154"></a><span class="k">def</span> <span class="nf">_preprocess</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">msg</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
-</span><span id="__span-0-155"><a id="__codelineno-0-155" name="__codelineno-0-155"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-156"><a id="__codelineno-0-156" name="__codelineno-0-156"></a><span class="sd">    Preprocess a message of a log file.</span>
-</span><span id="__span-0-157"><a id="__codelineno-0-157" name="__codelineno-0-157"></a>
-</span><span id="__span-0-158"><a id="__codelineno-0-158" name="__codelineno-0-158"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-159"><a id="__codelineno-0-159" name="__codelineno-0-159"></a><span class="sd">        msg: The message to preprocess.</span>
-</span><span id="__span-0-160"><a id="__codelineno-0-160" name="__codelineno-0-160"></a>
-</span><span id="__span-0-161"><a id="__codelineno-0-161" name="__codelineno-0-161"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-162"><a id="__codelineno-0-162" name="__codelineno-0-162"></a><span class="sd">        A tuple containing the original message, the tokenized message, and a list of the values replaced by regexes.</span>
-</span><span id="__span-0-163"><a id="__codelineno-0-163" name="__codelineno-0-163"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-164"><a id="__codelineno-0-164" name="__codelineno-0-164"></a>
-</span><span id="__span-0-165"><a id="__codelineno-0-165" name="__codelineno-0-165"></a>    <span class="n">msg</span> <span class="o">=</span> <span class="n">msg</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
+<span class="normal"><a href="#__codelineno-0-178">178</a></span>
+<span class="normal"><a href="#__codelineno-0-179">179</a></span>
+<span class="normal"><a href="#__codelineno-0-180">180</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-156"><a id="__codelineno-0-156" name="__codelineno-0-156"></a><span class="k">def</span> <span class="nf">_preprocess</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">msg</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
+</span><span id="__span-0-157"><a id="__codelineno-0-157" name="__codelineno-0-157"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-158"><a id="__codelineno-0-158" name="__codelineno-0-158"></a><span class="sd">    Preprocess a message of a log file.</span>
+</span><span id="__span-0-159"><a id="__codelineno-0-159" name="__codelineno-0-159"></a>
+</span><span id="__span-0-160"><a id="__codelineno-0-160" name="__codelineno-0-160"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-161"><a id="__codelineno-0-161" name="__codelineno-0-161"></a><span class="sd">        msg: The message to preprocess.</span>
+</span><span id="__span-0-162"><a id="__codelineno-0-162" name="__codelineno-0-162"></a>
+</span><span id="__span-0-163"><a id="__codelineno-0-163" name="__codelineno-0-163"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-164"><a id="__codelineno-0-164" name="__codelineno-0-164"></a><span class="sd">        A tuple containing the original message, the tokenized message, and a list of the values replaced by regexes.</span>
+</span><span id="__span-0-165"><a id="__codelineno-0-165" name="__codelineno-0-165"></a><span class="sd">    &quot;&quot;&quot;</span>
 </span><span id="__span-0-166"><a id="__codelineno-0-166" name="__codelineno-0-166"></a>
-</span><span id="__span-0-167"><a id="__codelineno-0-167" name="__codelineno-0-167"></a>    <span class="n">regex_matches</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-168"><a id="__codelineno-0-168" name="__codelineno-0-168"></a>    <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">rex</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">rex</span><span class="o">.</span><span class="n">values</span><span class="p">()):</span>
-</span><span id="__span-0-169"><a id="__codelineno-0-169" name="__codelineno-0-169"></a>        <span class="n">matches</span> <span class="o">=</span> <span class="n">re</span><span class="o">.</span><span class="n">findall</span><span class="p">(</span><span class="n">rex</span><span class="p">,</span> <span class="n">msg</span><span class="p">)</span>  <span class="c1">##### ASSUMPTION: only 1 match of interest</span>
-</span><span id="__span-0-170"><a id="__codelineno-0-170" name="__codelineno-0-170"></a>        <span class="n">regex_matches</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">matches</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="k">if</span> <span class="n">matches</span> <span class="k">else</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
-</span><span id="__span-0-171"><a id="__codelineno-0-171" name="__codelineno-0-171"></a>        <span class="n">msg</span> <span class="o">=</span> <span class="n">re</span><span class="o">.</span><span class="n">sub</span><span class="p">(</span><span class="n">rex</span><span class="p">,</span> <span class="s2">&quot;&lt;*&quot;</span> <span class="o">+</span> <span class="nb">str</span><span class="p">(</span><span class="n">i</span><span class="p">)</span> <span class="o">+</span> <span class="s2">&quot;&gt;&quot;</span><span class="p">,</span> <span class="n">msg</span><span class="p">,</span> <span class="n">count</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="__span-0-172"><a id="__codelineno-0-172" name="__codelineno-0-172"></a>
-</span><span id="__span-0-173"><a id="__codelineno-0-173" name="__codelineno-0-173"></a>    <span class="n">pattern</span> <span class="o">=</span> <span class="sa">r</span><span class="s1">&#39;([=,\{\}\[\]\(\);&quot;</span><span class="se">\&#39;</span><span class="s1">])&#39;</span>  <span class="c1"># Add spaces around punctuation</span>
-</span><span id="__span-0-174"><a id="__codelineno-0-174" name="__codelineno-0-174"></a>    <span class="n">msg</span> <span class="o">=</span> <span class="n">re</span><span class="o">.</span><span class="n">sub</span><span class="p">(</span><span class="n">pattern</span><span class="p">,</span> <span class="sa">r</span><span class="s2">&quot; \1 &quot;</span><span class="p">,</span> <span class="n">msg</span><span class="p">)</span>
-</span><span id="__span-0-175"><a id="__codelineno-0-175" name="__codelineno-0-175"></a>    <span class="n">pattern</span> <span class="o">=</span> <span class="sa">r</span><span class="s2">&quot;(?&lt;=\D):|:(?=\D)&quot;</span>  <span class="c1"># Colons not in timestamps</span>
-</span><span id="__span-0-176"><a id="__codelineno-0-176" name="__codelineno-0-176"></a>    <span class="n">msg</span> <span class="o">=</span> <span class="n">re</span><span class="o">.</span><span class="n">sub</span><span class="p">(</span><span class="n">pattern</span><span class="p">,</span> <span class="s2">&quot; : &quot;</span><span class="p">,</span> <span class="n">msg</span><span class="p">)</span>
-</span><span id="__span-0-177"><a id="__codelineno-0-177" name="__codelineno-0-177"></a>
-</span><span id="__span-0-178"><a id="__codelineno-0-178" name="__codelineno-0-178"></a>    <span class="k">return</span> <span class="p">(</span><span class="n">msg</span><span class="p">,</span> <span class="n">msg</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span><span class="o">.</span><span class="n">split</span><span class="p">(),</span> <span class="n">regex_matches</span><span class="p">)</span>
+</span><span id="__span-0-167"><a id="__codelineno-0-167" name="__codelineno-0-167"></a>    <span class="n">msg</span> <span class="o">=</span> <span class="n">msg</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
+</span><span id="__span-0-168"><a id="__codelineno-0-168" name="__codelineno-0-168"></a>
+</span><span id="__span-0-169"><a id="__codelineno-0-169" name="__codelineno-0-169"></a>    <span class="n">regex_matches</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-170"><a id="__codelineno-0-170" name="__codelineno-0-170"></a>    <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">rex</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">rex</span><span class="o">.</span><span class="n">values</span><span class="p">()):</span>
+</span><span id="__span-0-171"><a id="__codelineno-0-171" name="__codelineno-0-171"></a>        <span class="n">matches</span> <span class="o">=</span> <span class="n">re</span><span class="o">.</span><span class="n">findall</span><span class="p">(</span><span class="n">rex</span><span class="p">,</span> <span class="n">msg</span><span class="p">)</span>  <span class="c1">##### ASSUMPTION: only 1 match of interest</span>
+</span><span id="__span-0-172"><a id="__codelineno-0-172" name="__codelineno-0-172"></a>        <span class="n">regex_matches</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">matches</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="k">if</span> <span class="n">matches</span> <span class="k">else</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-173"><a id="__codelineno-0-173" name="__codelineno-0-173"></a>        <span class="n">msg</span> <span class="o">=</span> <span class="n">re</span><span class="o">.</span><span class="n">sub</span><span class="p">(</span><span class="n">rex</span><span class="p">,</span> <span class="s2">&quot;&lt;*&quot;</span> <span class="o">+</span> <span class="nb">str</span><span class="p">(</span><span class="n">i</span><span class="p">)</span> <span class="o">+</span> <span class="s2">&quot;&gt;&quot;</span><span class="p">,</span> <span class="n">msg</span><span class="p">,</span> <span class="n">count</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="__span-0-174"><a id="__codelineno-0-174" name="__codelineno-0-174"></a>
+</span><span id="__span-0-175"><a id="__codelineno-0-175" name="__codelineno-0-175"></a>    <span class="n">pattern</span> <span class="o">=</span> <span class="sa">r</span><span class="s1">&#39;([=,\{\}\[\]\(\);&quot;</span><span class="se">\&#39;</span><span class="s1">])&#39;</span>  <span class="c1"># Add spaces around punctuation</span>
+</span><span id="__span-0-176"><a id="__codelineno-0-176" name="__codelineno-0-176"></a>    <span class="n">msg</span> <span class="o">=</span> <span class="n">re</span><span class="o">.</span><span class="n">sub</span><span class="p">(</span><span class="n">pattern</span><span class="p">,</span> <span class="sa">r</span><span class="s2">&quot; \1 &quot;</span><span class="p">,</span> <span class="n">msg</span><span class="p">)</span>
+</span><span id="__span-0-177"><a id="__codelineno-0-177" name="__codelineno-0-177"></a>    <span class="n">pattern</span> <span class="o">=</span> <span class="sa">r</span><span class="s2">&quot;(?&lt;=\D):|:(?=\D)&quot;</span>  <span class="c1"># Colons not in timestamps</span>
+</span><span id="__span-0-178"><a id="__codelineno-0-178" name="__codelineno-0-178"></a>    <span class="n">msg</span> <span class="o">=</span> <span class="n">re</span><span class="o">.</span><span class="n">sub</span><span class="p">(</span><span class="n">pattern</span><span class="p">,</span> <span class="s2">&quot; : &quot;</span><span class="p">,</span> <span class="n">msg</span><span class="p">)</span>
+</span><span id="__span-0-179"><a id="__codelineno-0-179" name="__codelineno-0-179"></a>
+</span><span id="__span-0-180"><a id="__codelineno-0-180" name="__codelineno-0-180"></a>    <span class="k">return</span> <span class="p">(</span><span class="n">msg</span><span class="p">,</span> <span class="n">msg</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span><span class="o">.</span><span class="n">split</span><span class="p">(),</span> <span class="n">regex_matches</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -3384,9 +3384,7 @@ <h3 id="logos.drain.Drain._parse_message" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/drain.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-180">180</a></span>
-<span class="normal"><a href="#__codelineno-0-181">181</a></span>
-<span class="normal"><a href="#__codelineno-0-182">182</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-182">182</a></span>
 <span class="normal"><a href="#__codelineno-0-183">183</a></span>
 <span class="normal"><a href="#__codelineno-0-184">184</a></span>
 <span class="normal"><a href="#__codelineno-0-185">185</a></span>
@@ -3404,27 +3402,29 @@ <h3 id="logos.drain.Drain._parse_message" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-197">197</a></span>
 <span class="normal"><a href="#__codelineno-0-198">198</a></span>
 <span class="normal"><a href="#__codelineno-0-199">199</a></span>
-<span class="normal"><a href="#__codelineno-0-200">200</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-180"><a id="__codelineno-0-180" name="__codelineno-0-180"></a><span class="k">def</span> <span class="nf">_parse_message</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">msg</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-181"><a id="__codelineno-0-181" name="__codelineno-0-181"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-182"><a id="__codelineno-0-182" name="__codelineno-0-182"></a><span class="sd">    Parse a single log message and add it to the Drain parse tree in the appropriate cluster.</span>
-</span><span id="__span-0-183"><a id="__codelineno-0-183" name="__codelineno-0-183"></a>
-</span><span id="__span-0-184"><a id="__codelineno-0-184" name="__codelineno-0-184"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-185"><a id="__codelineno-0-185" name="__codelineno-0-185"></a><span class="sd">        msg: The log message to parse.</span>
-</span><span id="__span-0-186"><a id="__codelineno-0-186" name="__codelineno-0-186"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-187"><a id="__codelineno-0-187" name="__codelineno-0-187"></a>
-</span><span id="__span-0-188"><a id="__codelineno-0-188" name="__codelineno-0-188"></a>    <span class="n">line_id</span> <span class="o">=</span> <span class="n">msg</span><span class="p">[</span><span class="s2">&quot;MsgId&quot;</span><span class="p">]</span>
-</span><span id="__span-0-189"><a id="__codelineno-0-189" name="__codelineno-0-189"></a>    <span class="n">tokenized</span> <span class="o">=</span> <span class="n">msg</span><span class="p">[</span><span class="s2">&quot;Tokenized&quot;</span><span class="p">]</span>
-</span><span id="__span-0-190"><a id="__codelineno-0-190" name="__codelineno-0-190"></a>    <span class="n">cluster</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_tree_search</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">root</span><span class="p">,</span> <span class="n">tokenized</span><span class="p">)</span>
-</span><span id="__span-0-191"><a id="__codelineno-0-191" name="__codelineno-0-191"></a>
-</span><span id="__span-0-192"><a id="__codelineno-0-192" name="__codelineno-0-192"></a>    <span class="k">if</span> <span class="n">cluster</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-193"><a id="__codelineno-0-193" name="__codelineno-0-193"></a>        <span class="n">new_cluster</span> <span class="o">=</span> <span class="n">Cluster</span><span class="p">(</span><span class="n">template</span><span class="o">=</span><span class="n">tokenized</span><span class="p">,</span> <span class="n">message_ids</span><span class="o">=</span><span class="p">[</span><span class="n">line_id</span><span class="p">])</span>
-</span><span id="__span-0-194"><a id="__codelineno-0-194" name="__codelineno-0-194"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">cluster_list</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">new_cluster</span><span class="p">)</span>
-</span><span id="__span-0-195"><a id="__codelineno-0-195" name="__codelineno-0-195"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_add_cluster_to_tree</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">root</span><span class="p">,</span> <span class="n">new_cluster</span><span class="p">)</span>
-</span><span id="__span-0-196"><a id="__codelineno-0-196" name="__codelineno-0-196"></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-197"><a id="__codelineno-0-197" name="__codelineno-0-197"></a>        <span class="n">new_template</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_updated_template</span><span class="p">(</span><span class="n">tokenized</span><span class="p">,</span> <span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="p">)</span>
-</span><span id="__span-0-198"><a id="__codelineno-0-198" name="__codelineno-0-198"></a>        <span class="n">cluster</span><span class="o">.</span><span class="n">message_ids</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">line_id</span><span class="p">)</span>
-</span><span id="__span-0-199"><a id="__codelineno-0-199" name="__codelineno-0-199"></a>        <span class="k">if</span> <span class="s2">&quot; &quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">new_template</span><span class="p">)</span> <span class="o">!=</span> <span class="s2">&quot; &quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="p">):</span>
-</span><span id="__span-0-200"><a id="__codelineno-0-200" name="__codelineno-0-200"></a>            <span class="n">cluster</span><span class="o">.</span><span class="n">template</span> <span class="o">=</span> <span class="n">new_template</span>
+<span class="normal"><a href="#__codelineno-0-200">200</a></span>
+<span class="normal"><a href="#__codelineno-0-201">201</a></span>
+<span class="normal"><a href="#__codelineno-0-202">202</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-182"><a id="__codelineno-0-182" name="__codelineno-0-182"></a><span class="k">def</span> <span class="nf">_parse_message</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">msg</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-183"><a id="__codelineno-0-183" name="__codelineno-0-183"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-184"><a id="__codelineno-0-184" name="__codelineno-0-184"></a><span class="sd">    Parse a single log message and add it to the Drain parse tree in the appropriate cluster.</span>
+</span><span id="__span-0-185"><a id="__codelineno-0-185" name="__codelineno-0-185"></a>
+</span><span id="__span-0-186"><a id="__codelineno-0-186" name="__codelineno-0-186"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-187"><a id="__codelineno-0-187" name="__codelineno-0-187"></a><span class="sd">        msg: The log message to parse.</span>
+</span><span id="__span-0-188"><a id="__codelineno-0-188" name="__codelineno-0-188"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-189"><a id="__codelineno-0-189" name="__codelineno-0-189"></a>
+</span><span id="__span-0-190"><a id="__codelineno-0-190" name="__codelineno-0-190"></a>    <span class="n">line_id</span> <span class="o">=</span> <span class="n">msg</span><span class="p">[</span><span class="s2">&quot;MsgId&quot;</span><span class="p">]</span>
+</span><span id="__span-0-191"><a id="__codelineno-0-191" name="__codelineno-0-191"></a>    <span class="n">tokenized</span> <span class="o">=</span> <span class="n">msg</span><span class="p">[</span><span class="s2">&quot;Tokenized&quot;</span><span class="p">]</span>
+</span><span id="__span-0-192"><a id="__codelineno-0-192" name="__codelineno-0-192"></a>    <span class="n">cluster</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_tree_search</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">root</span><span class="p">,</span> <span class="n">tokenized</span><span class="p">)</span>
+</span><span id="__span-0-193"><a id="__codelineno-0-193" name="__codelineno-0-193"></a>
+</span><span id="__span-0-194"><a id="__codelineno-0-194" name="__codelineno-0-194"></a>    <span class="k">if</span> <span class="n">cluster</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-195"><a id="__codelineno-0-195" name="__codelineno-0-195"></a>        <span class="n">new_cluster</span> <span class="o">=</span> <span class="n">Cluster</span><span class="p">(</span><span class="n">template</span><span class="o">=</span><span class="n">tokenized</span><span class="p">,</span> <span class="n">message_ids</span><span class="o">=</span><span class="p">[</span><span class="n">line_id</span><span class="p">])</span>
+</span><span id="__span-0-196"><a id="__codelineno-0-196" name="__codelineno-0-196"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">cluster_list</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">new_cluster</span><span class="p">)</span>
+</span><span id="__span-0-197"><a id="__codelineno-0-197" name="__codelineno-0-197"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_add_cluster_to_tree</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">root</span><span class="p">,</span> <span class="n">new_cluster</span><span class="p">)</span>
+</span><span id="__span-0-198"><a id="__codelineno-0-198" name="__codelineno-0-198"></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-199"><a id="__codelineno-0-199" name="__codelineno-0-199"></a>        <span class="n">new_template</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_updated_template</span><span class="p">(</span><span class="n">tokenized</span><span class="p">,</span> <span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="p">)</span>
+</span><span id="__span-0-200"><a id="__codelineno-0-200" name="__codelineno-0-200"></a>        <span class="n">cluster</span><span class="o">.</span><span class="n">message_ids</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">line_id</span><span class="p">)</span>
+</span><span id="__span-0-201"><a id="__codelineno-0-201" name="__codelineno-0-201"></a>        <span class="k">if</span> <span class="s2">&quot; &quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">new_template</span><span class="p">)</span> <span class="o">!=</span> <span class="s2">&quot; &quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="p">):</span>
+</span><span id="__span-0-202"><a id="__codelineno-0-202" name="__codelineno-0-202"></a>            <span class="n">cluster</span><span class="o">.</span><span class="n">template</span> <span class="o">=</span> <span class="n">new_template</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -3522,9 +3522,7 @@ <h3 id="logos.drain.Drain._tree_search" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/drain.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-202">202</a></span>
-<span class="normal"><a href="#__codelineno-0-203">203</a></span>
-<span class="normal"><a href="#__codelineno-0-204">204</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-204">204</a></span>
 <span class="normal"><a href="#__codelineno-0-205">205</a></span>
 <span class="normal"><a href="#__codelineno-0-206">206</a></span>
 <span class="normal"><a href="#__codelineno-0-207">207</a></span>
@@ -3556,41 +3554,43 @@ <h3 id="logos.drain.Drain._tree_search" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-233">233</a></span>
 <span class="normal"><a href="#__codelineno-0-234">234</a></span>
 <span class="normal"><a href="#__codelineno-0-235">235</a></span>
-<span class="normal"><a href="#__codelineno-0-236">236</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-202"><a id="__codelineno-0-202" name="__codelineno-0-202"></a><span class="k">def</span> <span class="nf">_tree_search</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">root</span><span class="p">:</span> <span class="n">Node</span><span class="p">,</span> <span class="n">tokenized</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="n">Cluster</span><span class="p">]:</span>
-</span><span id="__span-0-203"><a id="__codelineno-0-203" name="__codelineno-0-203"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-204"><a id="__codelineno-0-204" name="__codelineno-0-204"></a><span class="sd">    Search the Drain parse tree for a cluster matching `tokenized`.</span>
-</span><span id="__span-0-205"><a id="__codelineno-0-205" name="__codelineno-0-205"></a>
-</span><span id="__span-0-206"><a id="__codelineno-0-206" name="__codelineno-0-206"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-207"><a id="__codelineno-0-207" name="__codelineno-0-207"></a><span class="sd">        root: The root of the Drain parse tree.</span>
-</span><span id="__span-0-208"><a id="__codelineno-0-208" name="__codelineno-0-208"></a><span class="sd">        tokenized: The tokenized log message to search for.</span>
-</span><span id="__span-0-209"><a id="__codelineno-0-209" name="__codelineno-0-209"></a>
-</span><span id="__span-0-210"><a id="__codelineno-0-210" name="__codelineno-0-210"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-211"><a id="__codelineno-0-211" name="__codelineno-0-211"></a><span class="sd">        The cluster in the Drain parse tree that matches `tokenized`,</span>
-</span><span id="__span-0-212"><a id="__codelineno-0-212" name="__codelineno-0-212"></a><span class="sd">        or None if no such cluster exists.</span>
-</span><span id="__span-0-213"><a id="__codelineno-0-213" name="__codelineno-0-213"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-214"><a id="__codelineno-0-214" name="__codelineno-0-214"></a>
-</span><span id="__span-0-215"><a id="__codelineno-0-215" name="__codelineno-0-215"></a>    <span class="n">num_toks</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">tokenized</span><span class="p">)</span>
-</span><span id="__span-0-216"><a id="__codelineno-0-216" name="__codelineno-0-216"></a>    <span class="k">if</span> <span class="n">num_toks</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">root</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
-</span><span id="__span-0-217"><a id="__codelineno-0-217" name="__codelineno-0-217"></a>        <span class="k">return</span> <span class="kc">None</span>
-</span><span id="__span-0-218"><a id="__codelineno-0-218" name="__codelineno-0-218"></a>
-</span><span id="__span-0-219"><a id="__codelineno-0-219" name="__codelineno-0-219"></a>    <span class="n">node</span> <span class="o">=</span> <span class="n">root</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">num_toks</span><span class="p">]</span>
+<span class="normal"><a href="#__codelineno-0-236">236</a></span>
+<span class="normal"><a href="#__codelineno-0-237">237</a></span>
+<span class="normal"><a href="#__codelineno-0-238">238</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-204"><a id="__codelineno-0-204" name="__codelineno-0-204"></a><span class="k">def</span> <span class="nf">_tree_search</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">root</span><span class="p">:</span> <span class="n">Node</span><span class="p">,</span> <span class="n">tokenized</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="n">Cluster</span><span class="p">]:</span>
+</span><span id="__span-0-205"><a id="__codelineno-0-205" name="__codelineno-0-205"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-206"><a id="__codelineno-0-206" name="__codelineno-0-206"></a><span class="sd">    Search the Drain parse tree for a cluster matching `tokenized`.</span>
+</span><span id="__span-0-207"><a id="__codelineno-0-207" name="__codelineno-0-207"></a>
+</span><span id="__span-0-208"><a id="__codelineno-0-208" name="__codelineno-0-208"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-209"><a id="__codelineno-0-209" name="__codelineno-0-209"></a><span class="sd">        root: The root of the Drain parse tree.</span>
+</span><span id="__span-0-210"><a id="__codelineno-0-210" name="__codelineno-0-210"></a><span class="sd">        tokenized: The tokenized log message to search for.</span>
+</span><span id="__span-0-211"><a id="__codelineno-0-211" name="__codelineno-0-211"></a>
+</span><span id="__span-0-212"><a id="__codelineno-0-212" name="__codelineno-0-212"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-213"><a id="__codelineno-0-213" name="__codelineno-0-213"></a><span class="sd">        The cluster in the Drain parse tree that matches `tokenized`,</span>
+</span><span id="__span-0-214"><a id="__codelineno-0-214" name="__codelineno-0-214"></a><span class="sd">        or None if no such cluster exists.</span>
+</span><span id="__span-0-215"><a id="__codelineno-0-215" name="__codelineno-0-215"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-216"><a id="__codelineno-0-216" name="__codelineno-0-216"></a>
+</span><span id="__span-0-217"><a id="__codelineno-0-217" name="__codelineno-0-217"></a>    <span class="n">num_toks</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">tokenized</span><span class="p">)</span>
+</span><span id="__span-0-218"><a id="__codelineno-0-218" name="__codelineno-0-218"></a>    <span class="k">if</span> <span class="n">num_toks</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">root</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
+</span><span id="__span-0-219"><a id="__codelineno-0-219" name="__codelineno-0-219"></a>        <span class="k">return</span> <span class="kc">None</span>
 </span><span id="__span-0-220"><a id="__codelineno-0-220" name="__codelineno-0-220"></a>
-</span><span id="__span-0-221"><a id="__codelineno-0-221" name="__codelineno-0-221"></a>    <span class="n">depth</span> <span class="o">=</span> <span class="mi">1</span>
-</span><span id="__span-0-222"><a id="__codelineno-0-222" name="__codelineno-0-222"></a>    <span class="k">for</span> <span class="n">token</span> <span class="ow">in</span> <span class="n">tokenized</span><span class="p">:</span>
-</span><span id="__span-0-223"><a id="__codelineno-0-223" name="__codelineno-0-223"></a>        <span class="k">if</span> <span class="n">depth</span> <span class="o">&gt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">depth</span> <span class="ow">or</span> <span class="n">depth</span> <span class="o">&gt;</span> <span class="n">num_toks</span><span class="p">:</span>
-</span><span id="__span-0-224"><a id="__codelineno-0-224" name="__codelineno-0-224"></a>            <span class="k">break</span>
-</span><span id="__span-0-225"><a id="__codelineno-0-225" name="__codelineno-0-225"></a>        <span class="k">if</span> <span class="n">token</span> <span class="ow">in</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
-</span><span id="__span-0-226"><a id="__codelineno-0-226" name="__codelineno-0-226"></a>            <span class="n">node</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">token</span><span class="p">]</span>
-</span><span id="__span-0-227"><a id="__codelineno-0-227" name="__codelineno-0-227"></a>        <span class="k">elif</span> <span class="s2">&quot;&lt;*&gt;&quot;</span> <span class="ow">in</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
-</span><span id="__span-0-228"><a id="__codelineno-0-228" name="__codelineno-0-228"></a>            <span class="n">node</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">]</span>
-</span><span id="__span-0-229"><a id="__codelineno-0-229" name="__codelineno-0-229"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-230"><a id="__codelineno-0-230" name="__codelineno-0-230"></a>            <span class="k">return</span> <span class="kc">None</span>
-</span><span id="__span-0-231"><a id="__codelineno-0-231" name="__codelineno-0-231"></a>        <span class="n">depth</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="__span-0-232"><a id="__codelineno-0-232" name="__codelineno-0-232"></a>
-</span><span id="__span-0-233"><a id="__codelineno-0-233" name="__codelineno-0-233"></a>    <span class="n">cluster_list</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span>
-</span><span id="__span-0-234"><a id="__codelineno-0-234" name="__codelineno-0-234"></a>    <span class="n">returned_cluster</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_find_cluster</span><span class="p">(</span><span class="n">cluster_list</span><span class="p">,</span> <span class="n">tokenized</span><span class="p">)</span>
-</span><span id="__span-0-235"><a id="__codelineno-0-235" name="__codelineno-0-235"></a>
-</span><span id="__span-0-236"><a id="__codelineno-0-236" name="__codelineno-0-236"></a>    <span class="k">return</span> <span class="n">returned_cluster</span>
+</span><span id="__span-0-221"><a id="__codelineno-0-221" name="__codelineno-0-221"></a>    <span class="n">node</span> <span class="o">=</span> <span class="n">root</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">num_toks</span><span class="p">]</span>
+</span><span id="__span-0-222"><a id="__codelineno-0-222" name="__codelineno-0-222"></a>
+</span><span id="__span-0-223"><a id="__codelineno-0-223" name="__codelineno-0-223"></a>    <span class="n">depth</span> <span class="o">=</span> <span class="mi">1</span>
+</span><span id="__span-0-224"><a id="__codelineno-0-224" name="__codelineno-0-224"></a>    <span class="k">for</span> <span class="n">token</span> <span class="ow">in</span> <span class="n">tokenized</span><span class="p">:</span>
+</span><span id="__span-0-225"><a id="__codelineno-0-225" name="__codelineno-0-225"></a>        <span class="k">if</span> <span class="n">depth</span> <span class="o">&gt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">depth</span> <span class="ow">or</span> <span class="n">depth</span> <span class="o">&gt;</span> <span class="n">num_toks</span><span class="p">:</span>
+</span><span id="__span-0-226"><a id="__codelineno-0-226" name="__codelineno-0-226"></a>            <span class="k">break</span>
+</span><span id="__span-0-227"><a id="__codelineno-0-227" name="__codelineno-0-227"></a>        <span class="k">if</span> <span class="n">token</span> <span class="ow">in</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
+</span><span id="__span-0-228"><a id="__codelineno-0-228" name="__codelineno-0-228"></a>            <span class="n">node</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">token</span><span class="p">]</span>
+</span><span id="__span-0-229"><a id="__codelineno-0-229" name="__codelineno-0-229"></a>        <span class="k">elif</span> <span class="s2">&quot;&lt;*&gt;&quot;</span> <span class="ow">in</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
+</span><span id="__span-0-230"><a id="__codelineno-0-230" name="__codelineno-0-230"></a>            <span class="n">node</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">]</span>
+</span><span id="__span-0-231"><a id="__codelineno-0-231" name="__codelineno-0-231"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-232"><a id="__codelineno-0-232" name="__codelineno-0-232"></a>            <span class="k">return</span> <span class="kc">None</span>
+</span><span id="__span-0-233"><a id="__codelineno-0-233" name="__codelineno-0-233"></a>        <span class="n">depth</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="__span-0-234"><a id="__codelineno-0-234" name="__codelineno-0-234"></a>
+</span><span id="__span-0-235"><a id="__codelineno-0-235" name="__codelineno-0-235"></a>    <span class="n">cluster_list</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span>
+</span><span id="__span-0-236"><a id="__codelineno-0-236" name="__codelineno-0-236"></a>    <span class="n">returned_cluster</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_find_cluster</span><span class="p">(</span><span class="n">cluster_list</span><span class="p">,</span> <span class="n">tokenized</span><span class="p">)</span>
+</span><span id="__span-0-237"><a id="__codelineno-0-237" name="__codelineno-0-237"></a>
+</span><span id="__span-0-238"><a id="__codelineno-0-238" name="__codelineno-0-238"></a>    <span class="k">return</span> <span class="n">returned_cluster</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -3655,9 +3655,7 @@ <h3 id="logos.drain.Drain._add_cluster_to_tree" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/drain.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-238">238</a></span>
-<span class="normal"><a href="#__codelineno-0-239">239</a></span>
-<span class="normal"><a href="#__codelineno-0-240">240</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-240">240</a></span>
 <span class="normal"><a href="#__codelineno-0-241">241</a></span>
 <span class="normal"><a href="#__codelineno-0-242">242</a></span>
 <span class="normal"><a href="#__codelineno-0-243">243</a></span>
@@ -3715,67 +3713,69 @@ <h3 id="logos.drain.Drain._add_cluster_to_tree" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-295">295</a></span>
 <span class="normal"><a href="#__codelineno-0-296">296</a></span>
 <span class="normal"><a href="#__codelineno-0-297">297</a></span>
-<span class="normal"><a href="#__codelineno-0-298">298</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-238"><a id="__codelineno-0-238" name="__codelineno-0-238"></a><span class="k">def</span> <span class="nf">_add_cluster_to_tree</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">root</span><span class="p">:</span> <span class="n">Node</span><span class="p">,</span> <span class="n">cluster</span><span class="p">:</span> <span class="n">Cluster</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-239"><a id="__codelineno-0-239" name="__codelineno-0-239"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-240"><a id="__codelineno-0-240" name="__codelineno-0-240"></a><span class="sd">    Add a cluster to the Drain parse tree.</span>
-</span><span id="__span-0-241"><a id="__codelineno-0-241" name="__codelineno-0-241"></a>
-</span><span id="__span-0-242"><a id="__codelineno-0-242" name="__codelineno-0-242"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-243"><a id="__codelineno-0-243" name="__codelineno-0-243"></a><span class="sd">        root: The root of the Drain parse tree.</span>
-</span><span id="__span-0-244"><a id="__codelineno-0-244" name="__codelineno-0-244"></a><span class="sd">        cluster: The cluster to add.</span>
-</span><span id="__span-0-245"><a id="__codelineno-0-245" name="__codelineno-0-245"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-246"><a id="__codelineno-0-246" name="__codelineno-0-246"></a>
-</span><span id="__span-0-247"><a id="__codelineno-0-247" name="__codelineno-0-247"></a>    <span class="c1"># Add a node to the first layer of the tree representing the length of the log message.</span>
-</span><span id="__span-0-248"><a id="__codelineno-0-248" name="__codelineno-0-248"></a>    <span class="n">length</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="p">)</span>
-</span><span id="__span-0-249"><a id="__codelineno-0-249" name="__codelineno-0-249"></a>    <span class="n">first_layer_node</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-250"><a id="__codelineno-0-250" name="__codelineno-0-250"></a>    <span class="k">if</span> <span class="n">length</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">root</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
-</span><span id="__span-0-251"><a id="__codelineno-0-251" name="__codelineno-0-251"></a>        <span class="n">first_layer_node</span> <span class="o">=</span> <span class="n">Node</span><span class="p">(</span><span class="n">depth</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="nb">id</span><span class="o">=</span><span class="n">length</span><span class="p">)</span>
-</span><span id="__span-0-252"><a id="__codelineno-0-252" name="__codelineno-0-252"></a>        <span class="n">root</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">length</span><span class="p">]</span> <span class="o">=</span> <span class="n">first_layer_node</span>
-</span><span id="__span-0-253"><a id="__codelineno-0-253" name="__codelineno-0-253"></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-254"><a id="__codelineno-0-254" name="__codelineno-0-254"></a>        <span class="n">first_layer_node</span> <span class="o">=</span> <span class="n">root</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">length</span><span class="p">]</span>
-</span><span id="__span-0-255"><a id="__codelineno-0-255" name="__codelineno-0-255"></a>
-</span><span id="__span-0-256"><a id="__codelineno-0-256" name="__codelineno-0-256"></a>    <span class="c1"># Traverse the tree to add the new cluster.</span>
-</span><span id="__span-0-257"><a id="__codelineno-0-257" name="__codelineno-0-257"></a>    <span class="n">node</span> <span class="o">=</span> <span class="n">first_layer_node</span>
-</span><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a>    <span class="n">depth</span> <span class="o">=</span> <span class="mi">1</span>
-</span><span id="__span-0-259"><a id="__codelineno-0-259" name="__codelineno-0-259"></a>    <span class="k">for</span> <span class="n">token</span> <span class="ow">in</span> <span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="p">:</span>
-</span><span id="__span-0-260"><a id="__codelineno-0-260" name="__codelineno-0-260"></a>        <span class="c1"># If out of depth, add current log cluster to the leaf node</span>
-</span><span id="__span-0-261"><a id="__codelineno-0-261" name="__codelineno-0-261"></a>        <span class="k">if</span> <span class="n">depth</span> <span class="o">&gt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">depth</span> <span class="ow">or</span> <span class="n">depth</span> <span class="o">&gt;</span> <span class="n">length</span><span class="p">:</span>
-</span><span id="__span-0-262"><a id="__codelineno-0-262" name="__codelineno-0-262"></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-263"><a id="__codelineno-0-263" name="__codelineno-0-263"></a>                <span class="n">node</span><span class="o">.</span><span class="n">children</span> <span class="o">=</span> <span class="p">[</span><span class="n">cluster</span><span class="p">]</span>
-</span><span id="__span-0-264"><a id="__codelineno-0-264" name="__codelineno-0-264"></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-265"><a id="__codelineno-0-265" name="__codelineno-0-265"></a>                <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">cluster</span><span class="p">)</span>
-</span><span id="__span-0-266"><a id="__codelineno-0-266" name="__codelineno-0-266"></a>            <span class="k">break</span>
-</span><span id="__span-0-267"><a id="__codelineno-0-267" name="__codelineno-0-267"></a>
-</span><span id="__span-0-268"><a id="__codelineno-0-268" name="__codelineno-0-268"></a>        <span class="c1"># If token not matched in this layer of existing tree.</span>
-</span><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a>        <span class="k">if</span> <span class="n">token</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
-</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="nb">any</span><span class="p">(</span><span class="n">char</span><span class="o">.</span><span class="n">isdigit</span><span class="p">()</span> <span class="k">for</span> <span class="n">char</span> <span class="ow">in</span> <span class="n">token</span><span class="p">):</span>
-</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a>                <span class="k">if</span> <span class="s2">&quot;&lt;*&gt;&quot;</span> <span class="ow">in</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
-</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a>                    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">)</span> <span class="o">&lt;</span> <span class="bp">self</span><span class="o">.</span><span class="n">max_children</span><span class="p">:</span>
-</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a>                        <span class="n">new_node</span> <span class="o">=</span> <span class="n">Node</span><span class="p">(</span><span class="n">depth</span><span class="o">=</span><span class="n">depth</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">id</span><span class="o">=</span><span class="n">token</span><span class="p">)</span>
-</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a>                        <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">token</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_node</span>
-</span><span id="__span-0-275"><a id="__codelineno-0-275" name="__codelineno-0-275"></a>                        <span class="n">node</span> <span class="o">=</span> <span class="n">new_node</span>
-</span><span id="__span-0-276"><a id="__codelineno-0-276" name="__codelineno-0-276"></a>                    <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-277"><a id="__codelineno-0-277" name="__codelineno-0-277"></a>                        <span class="n">node</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">]</span>
-</span><span id="__span-0-278"><a id="__codelineno-0-278" name="__codelineno-0-278"></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-279"><a id="__codelineno-0-279" name="__codelineno-0-279"></a>                    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">&lt;</span> <span class="bp">self</span><span class="o">.</span><span class="n">max_children</span><span class="p">:</span>
-</span><span id="__span-0-280"><a id="__codelineno-0-280" name="__codelineno-0-280"></a>                        <span class="n">new_node</span> <span class="o">=</span> <span class="n">Node</span><span class="p">(</span><span class="n">depth</span><span class="o">=</span><span class="n">depth</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">id</span><span class="o">=</span><span class="n">token</span><span class="p">)</span>
-</span><span id="__span-0-281"><a id="__codelineno-0-281" name="__codelineno-0-281"></a>                        <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">token</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_node</span>
-</span><span id="__span-0-282"><a id="__codelineno-0-282" name="__codelineno-0-282"></a>                        <span class="n">node</span> <span class="o">=</span> <span class="n">new_node</span>
-</span><span id="__span-0-283"><a id="__codelineno-0-283" name="__codelineno-0-283"></a>                    <span class="k">elif</span> <span class="nb">len</span><span class="p">(</span><span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">max_children</span><span class="p">:</span>
-</span><span id="__span-0-284"><a id="__codelineno-0-284" name="__codelineno-0-284"></a>                        <span class="n">new_node</span> <span class="o">=</span> <span class="n">Node</span><span class="p">(</span><span class="n">depth</span><span class="o">=</span><span class="n">depth</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">id</span><span class="o">=</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">)</span>
-</span><span id="__span-0-285"><a id="__codelineno-0-285" name="__codelineno-0-285"></a>                        <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_node</span>
-</span><span id="__span-0-286"><a id="__codelineno-0-286" name="__codelineno-0-286"></a>                        <span class="n">node</span> <span class="o">=</span> <span class="n">new_node</span>
-</span><span id="__span-0-287"><a id="__codelineno-0-287" name="__codelineno-0-287"></a>                    <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-288"><a id="__codelineno-0-288" name="__codelineno-0-288"></a>                        <span class="n">node</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">]</span>
-</span><span id="__span-0-289"><a id="__codelineno-0-289" name="__codelineno-0-289"></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-290"><a id="__codelineno-0-290" name="__codelineno-0-290"></a>                <span class="k">if</span> <span class="s2">&quot;&lt;*&gt;&quot;</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
-</span><span id="__span-0-291"><a id="__codelineno-0-291" name="__codelineno-0-291"></a>                    <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">Node</span><span class="p">(</span><span class="n">depth</span><span class="o">=</span><span class="n">depth</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">id</span><span class="o">=</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">)</span>
-</span><span id="__span-0-292"><a id="__codelineno-0-292" name="__codelineno-0-292"></a>                <span class="n">node</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">]</span>
-</span><span id="__span-0-293"><a id="__codelineno-0-293" name="__codelineno-0-293"></a>
-</span><span id="__span-0-294"><a id="__codelineno-0-294" name="__codelineno-0-294"></a>        <span class="c1"># If the token is matched</span>
-</span><span id="__span-0-295"><a id="__codelineno-0-295" name="__codelineno-0-295"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-296"><a id="__codelineno-0-296" name="__codelineno-0-296"></a>            <span class="n">node</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">token</span><span class="p">]</span>
-</span><span id="__span-0-297"><a id="__codelineno-0-297" name="__codelineno-0-297"></a>
-</span><span id="__span-0-298"><a id="__codelineno-0-298" name="__codelineno-0-298"></a>        <span class="n">depth</span> <span class="o">+=</span> <span class="mi">1</span>
+<span class="normal"><a href="#__codelineno-0-298">298</a></span>
+<span class="normal"><a href="#__codelineno-0-299">299</a></span>
+<span class="normal"><a href="#__codelineno-0-300">300</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-240"><a id="__codelineno-0-240" name="__codelineno-0-240"></a><span class="k">def</span> <span class="nf">_add_cluster_to_tree</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">root</span><span class="p">:</span> <span class="n">Node</span><span class="p">,</span> <span class="n">cluster</span><span class="p">:</span> <span class="n">Cluster</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-241"><a id="__codelineno-0-241" name="__codelineno-0-241"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-242"><a id="__codelineno-0-242" name="__codelineno-0-242"></a><span class="sd">    Add a cluster to the Drain parse tree.</span>
+</span><span id="__span-0-243"><a id="__codelineno-0-243" name="__codelineno-0-243"></a>
+</span><span id="__span-0-244"><a id="__codelineno-0-244" name="__codelineno-0-244"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-245"><a id="__codelineno-0-245" name="__codelineno-0-245"></a><span class="sd">        root: The root of the Drain parse tree.</span>
+</span><span id="__span-0-246"><a id="__codelineno-0-246" name="__codelineno-0-246"></a><span class="sd">        cluster: The cluster to add.</span>
+</span><span id="__span-0-247"><a id="__codelineno-0-247" name="__codelineno-0-247"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-248"><a id="__codelineno-0-248" name="__codelineno-0-248"></a>
+</span><span id="__span-0-249"><a id="__codelineno-0-249" name="__codelineno-0-249"></a>    <span class="c1"># Add a node to the first layer of the tree representing the length of the log message.</span>
+</span><span id="__span-0-250"><a id="__codelineno-0-250" name="__codelineno-0-250"></a>    <span class="n">length</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="p">)</span>
+</span><span id="__span-0-251"><a id="__codelineno-0-251" name="__codelineno-0-251"></a>    <span class="n">first_layer_node</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-252"><a id="__codelineno-0-252" name="__codelineno-0-252"></a>    <span class="k">if</span> <span class="n">length</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">root</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
+</span><span id="__span-0-253"><a id="__codelineno-0-253" name="__codelineno-0-253"></a>        <span class="n">first_layer_node</span> <span class="o">=</span> <span class="n">Node</span><span class="p">(</span><span class="n">depth</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="nb">id</span><span class="o">=</span><span class="n">length</span><span class="p">)</span>
+</span><span id="__span-0-254"><a id="__codelineno-0-254" name="__codelineno-0-254"></a>        <span class="n">root</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">length</span><span class="p">]</span> <span class="o">=</span> <span class="n">first_layer_node</span>
+</span><span id="__span-0-255"><a id="__codelineno-0-255" name="__codelineno-0-255"></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-256"><a id="__codelineno-0-256" name="__codelineno-0-256"></a>        <span class="n">first_layer_node</span> <span class="o">=</span> <span class="n">root</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">length</span><span class="p">]</span>
+</span><span id="__span-0-257"><a id="__codelineno-0-257" name="__codelineno-0-257"></a>
+</span><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a>    <span class="c1"># Traverse the tree to add the new cluster.</span>
+</span><span id="__span-0-259"><a id="__codelineno-0-259" name="__codelineno-0-259"></a>    <span class="n">node</span> <span class="o">=</span> <span class="n">first_layer_node</span>
+</span><span id="__span-0-260"><a id="__codelineno-0-260" name="__codelineno-0-260"></a>    <span class="n">depth</span> <span class="o">=</span> <span class="mi">1</span>
+</span><span id="__span-0-261"><a id="__codelineno-0-261" name="__codelineno-0-261"></a>    <span class="k">for</span> <span class="n">token</span> <span class="ow">in</span> <span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="p">:</span>
+</span><span id="__span-0-262"><a id="__codelineno-0-262" name="__codelineno-0-262"></a>        <span class="c1"># If out of depth, add current log cluster to the leaf node</span>
+</span><span id="__span-0-263"><a id="__codelineno-0-263" name="__codelineno-0-263"></a>        <span class="k">if</span> <span class="n">depth</span> <span class="o">&gt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">depth</span> <span class="ow">or</span> <span class="n">depth</span> <span class="o">&gt;</span> <span class="n">length</span><span class="p">:</span>
+</span><span id="__span-0-264"><a id="__codelineno-0-264" name="__codelineno-0-264"></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-265"><a id="__codelineno-0-265" name="__codelineno-0-265"></a>                <span class="n">node</span><span class="o">.</span><span class="n">children</span> <span class="o">=</span> <span class="p">[</span><span class="n">cluster</span><span class="p">]</span>
+</span><span id="__span-0-266"><a id="__codelineno-0-266" name="__codelineno-0-266"></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-267"><a id="__codelineno-0-267" name="__codelineno-0-267"></a>                <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">cluster</span><span class="p">)</span>
+</span><span id="__span-0-268"><a id="__codelineno-0-268" name="__codelineno-0-268"></a>            <span class="k">break</span>
+</span><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a>
+</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a>        <span class="c1"># If token not matched in this layer of existing tree.</span>
+</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a>        <span class="k">if</span> <span class="n">token</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
+</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="nb">any</span><span class="p">(</span><span class="n">char</span><span class="o">.</span><span class="n">isdigit</span><span class="p">()</span> <span class="k">for</span> <span class="n">char</span> <span class="ow">in</span> <span class="n">token</span><span class="p">):</span>
+</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a>                <span class="k">if</span> <span class="s2">&quot;&lt;*&gt;&quot;</span> <span class="ow">in</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
+</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a>                    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">)</span> <span class="o">&lt;</span> <span class="bp">self</span><span class="o">.</span><span class="n">max_children</span><span class="p">:</span>
+</span><span id="__span-0-275"><a id="__codelineno-0-275" name="__codelineno-0-275"></a>                        <span class="n">new_node</span> <span class="o">=</span> <span class="n">Node</span><span class="p">(</span><span class="n">depth</span><span class="o">=</span><span class="n">depth</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">id</span><span class="o">=</span><span class="n">token</span><span class="p">)</span>
+</span><span id="__span-0-276"><a id="__codelineno-0-276" name="__codelineno-0-276"></a>                        <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">token</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_node</span>
+</span><span id="__span-0-277"><a id="__codelineno-0-277" name="__codelineno-0-277"></a>                        <span class="n">node</span> <span class="o">=</span> <span class="n">new_node</span>
+</span><span id="__span-0-278"><a id="__codelineno-0-278" name="__codelineno-0-278"></a>                    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-279"><a id="__codelineno-0-279" name="__codelineno-0-279"></a>                        <span class="n">node</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">]</span>
+</span><span id="__span-0-280"><a id="__codelineno-0-280" name="__codelineno-0-280"></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-281"><a id="__codelineno-0-281" name="__codelineno-0-281"></a>                    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">&lt;</span> <span class="bp">self</span><span class="o">.</span><span class="n">max_children</span><span class="p">:</span>
+</span><span id="__span-0-282"><a id="__codelineno-0-282" name="__codelineno-0-282"></a>                        <span class="n">new_node</span> <span class="o">=</span> <span class="n">Node</span><span class="p">(</span><span class="n">depth</span><span class="o">=</span><span class="n">depth</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">id</span><span class="o">=</span><span class="n">token</span><span class="p">)</span>
+</span><span id="__span-0-283"><a id="__codelineno-0-283" name="__codelineno-0-283"></a>                        <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">token</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_node</span>
+</span><span id="__span-0-284"><a id="__codelineno-0-284" name="__codelineno-0-284"></a>                        <span class="n">node</span> <span class="o">=</span> <span class="n">new_node</span>
+</span><span id="__span-0-285"><a id="__codelineno-0-285" name="__codelineno-0-285"></a>                    <span class="k">elif</span> <span class="nb">len</span><span class="p">(</span><span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">max_children</span><span class="p">:</span>
+</span><span id="__span-0-286"><a id="__codelineno-0-286" name="__codelineno-0-286"></a>                        <span class="n">new_node</span> <span class="o">=</span> <span class="n">Node</span><span class="p">(</span><span class="n">depth</span><span class="o">=</span><span class="n">depth</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">id</span><span class="o">=</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-287"><a id="__codelineno-0-287" name="__codelineno-0-287"></a>                        <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_node</span>
+</span><span id="__span-0-288"><a id="__codelineno-0-288" name="__codelineno-0-288"></a>                        <span class="n">node</span> <span class="o">=</span> <span class="n">new_node</span>
+</span><span id="__span-0-289"><a id="__codelineno-0-289" name="__codelineno-0-289"></a>                    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-290"><a id="__codelineno-0-290" name="__codelineno-0-290"></a>                        <span class="n">node</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">]</span>
+</span><span id="__span-0-291"><a id="__codelineno-0-291" name="__codelineno-0-291"></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-292"><a id="__codelineno-0-292" name="__codelineno-0-292"></a>                <span class="k">if</span> <span class="s2">&quot;&lt;*&gt;&quot;</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">:</span>
+</span><span id="__span-0-293"><a id="__codelineno-0-293" name="__codelineno-0-293"></a>                    <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">Node</span><span class="p">(</span><span class="n">depth</span><span class="o">=</span><span class="n">depth</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">id</span><span class="o">=</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-294"><a id="__codelineno-0-294" name="__codelineno-0-294"></a>                <span class="n">node</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">]</span>
+</span><span id="__span-0-295"><a id="__codelineno-0-295" name="__codelineno-0-295"></a>
+</span><span id="__span-0-296"><a id="__codelineno-0-296" name="__codelineno-0-296"></a>        <span class="c1"># If the token is matched</span>
+</span><span id="__span-0-297"><a id="__codelineno-0-297" name="__codelineno-0-297"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-298"><a id="__codelineno-0-298" name="__codelineno-0-298"></a>            <span class="n">node</span> <span class="o">=</span> <span class="n">node</span><span class="o">.</span><span class="n">children</span><span class="p">[</span><span class="n">token</span><span class="p">]</span>
+</span><span id="__span-0-299"><a id="__codelineno-0-299" name="__codelineno-0-299"></a>
+</span><span id="__span-0-300"><a id="__codelineno-0-300" name="__codelineno-0-300"></a>        <span class="n">depth</span> <span class="o">+=</span> <span class="mi">1</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -3864,9 +3864,7 @@ <h3 id="logos.drain.Drain._similarity" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/drain.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-300">300</a></span>
-<span class="normal"><a href="#__codelineno-0-301">301</a></span>
-<span class="normal"><a href="#__codelineno-0-302">302</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-302">302</a></span>
 <span class="normal"><a href="#__codelineno-0-303">303</a></span>
 <span class="normal"><a href="#__codelineno-0-304">304</a></span>
 <span class="normal"><a href="#__codelineno-0-305">305</a></span>
@@ -3888,31 +3886,33 @@ <h3 id="logos.drain.Drain._similarity" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-321">321</a></span>
 <span class="normal"><a href="#__codelineno-0-322">322</a></span>
 <span class="normal"><a href="#__codelineno-0-323">323</a></span>
-<span class="normal"><a href="#__codelineno-0-324">324</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-300"><a id="__codelineno-0-300" name="__codelineno-0-300"></a><span class="k">def</span> <span class="nf">_similarity</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">seq1</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">seq2</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="nb">int</span><span class="p">]:</span>
-</span><span id="__span-0-301"><a id="__codelineno-0-301" name="__codelineno-0-301"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-302"><a id="__codelineno-0-302" name="__codelineno-0-302"></a><span class="sd">    Determine the fraction of tokens in `seq1` that are identical to the corresponding token in `seq2`.</span>
-</span><span id="__span-0-303"><a id="__codelineno-0-303" name="__codelineno-0-303"></a><span class="sd">    Also return the number of parameters in `seq1`.</span>
-</span><span id="__span-0-304"><a id="__codelineno-0-304" name="__codelineno-0-304"></a>
-</span><span id="__span-0-305"><a id="__codelineno-0-305" name="__codelineno-0-305"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-306"><a id="__codelineno-0-306" name="__codelineno-0-306"></a><span class="sd">        seq1: The first sequence.</span>
-</span><span id="__span-0-307"><a id="__codelineno-0-307" name="__codelineno-0-307"></a><span class="sd">        seq2: The second sequence.</span>
-</span><span id="__span-0-308"><a id="__codelineno-0-308" name="__codelineno-0-308"></a>
-</span><span id="__span-0-309"><a id="__codelineno-0-309" name="__codelineno-0-309"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-310"><a id="__codelineno-0-310" name="__codelineno-0-310"></a><span class="sd">        A tuple containing the fraction of identical tokens and the number of parameters in `seq1`.</span>
-</span><span id="__span-0-311"><a id="__codelineno-0-311" name="__codelineno-0-311"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-312"><a id="__codelineno-0-312" name="__codelineno-0-312"></a>    <span class="k">assert</span> <span class="nb">len</span><span class="p">(</span><span class="n">seq1</span><span class="p">)</span> <span class="o">==</span> <span class="nb">len</span><span class="p">(</span><span class="n">seq2</span><span class="p">)</span>
-</span><span id="__span-0-313"><a id="__codelineno-0-313" name="__codelineno-0-313"></a>    <span class="n">matches</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="__span-0-314"><a id="__codelineno-0-314" name="__codelineno-0-314"></a>    <span class="n">num_params</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="__span-0-315"><a id="__codelineno-0-315" name="__codelineno-0-315"></a>
-</span><span id="__span-0-316"><a id="__codelineno-0-316" name="__codelineno-0-316"></a>    <span class="k">for</span> <span class="n">token1</span><span class="p">,</span> <span class="n">token2</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">seq1</span><span class="p">,</span> <span class="n">seq2</span><span class="p">):</span>
-</span><span id="__span-0-317"><a id="__codelineno-0-317" name="__codelineno-0-317"></a>        <span class="k">if</span> <span class="n">token1</span> <span class="o">==</span> <span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">:</span>
-</span><span id="__span-0-318"><a id="__codelineno-0-318" name="__codelineno-0-318"></a>            <span class="n">num_params</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="__span-0-319"><a id="__codelineno-0-319" name="__codelineno-0-319"></a>        <span class="k">if</span> <span class="n">token1</span> <span class="o">==</span> <span class="n">token2</span><span class="p">:</span>
-</span><span id="__span-0-320"><a id="__codelineno-0-320" name="__codelineno-0-320"></a>            <span class="n">matches</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="__span-0-321"><a id="__codelineno-0-321" name="__codelineno-0-321"></a>
-</span><span id="__span-0-322"><a id="__codelineno-0-322" name="__codelineno-0-322"></a>    <span class="n">similarity</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">matches</span><span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">seq1</span><span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-324">324</a></span>
+<span class="normal"><a href="#__codelineno-0-325">325</a></span>
+<span class="normal"><a href="#__codelineno-0-326">326</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-302"><a id="__codelineno-0-302" name="__codelineno-0-302"></a><span class="k">def</span> <span class="nf">_similarity</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">seq1</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">seq2</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="nb">int</span><span class="p">]:</span>
+</span><span id="__span-0-303"><a id="__codelineno-0-303" name="__codelineno-0-303"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-304"><a id="__codelineno-0-304" name="__codelineno-0-304"></a><span class="sd">    Determine the fraction of tokens in `seq1` that are identical to the corresponding token in `seq2`.</span>
+</span><span id="__span-0-305"><a id="__codelineno-0-305" name="__codelineno-0-305"></a><span class="sd">    Also return the number of parameters in `seq1`.</span>
+</span><span id="__span-0-306"><a id="__codelineno-0-306" name="__codelineno-0-306"></a>
+</span><span id="__span-0-307"><a id="__codelineno-0-307" name="__codelineno-0-307"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-308"><a id="__codelineno-0-308" name="__codelineno-0-308"></a><span class="sd">        seq1: The first sequence.</span>
+</span><span id="__span-0-309"><a id="__codelineno-0-309" name="__codelineno-0-309"></a><span class="sd">        seq2: The second sequence.</span>
+</span><span id="__span-0-310"><a id="__codelineno-0-310" name="__codelineno-0-310"></a>
+</span><span id="__span-0-311"><a id="__codelineno-0-311" name="__codelineno-0-311"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-312"><a id="__codelineno-0-312" name="__codelineno-0-312"></a><span class="sd">        A tuple containing the fraction of identical tokens and the number of parameters in `seq1`.</span>
+</span><span id="__span-0-313"><a id="__codelineno-0-313" name="__codelineno-0-313"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-314"><a id="__codelineno-0-314" name="__codelineno-0-314"></a>    <span class="k">assert</span> <span class="nb">len</span><span class="p">(</span><span class="n">seq1</span><span class="p">)</span> <span class="o">==</span> <span class="nb">len</span><span class="p">(</span><span class="n">seq2</span><span class="p">)</span>
+</span><span id="__span-0-315"><a id="__codelineno-0-315" name="__codelineno-0-315"></a>    <span class="n">matches</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="__span-0-316"><a id="__codelineno-0-316" name="__codelineno-0-316"></a>    <span class="n">num_params</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="__span-0-317"><a id="__codelineno-0-317" name="__codelineno-0-317"></a>
+</span><span id="__span-0-318"><a id="__codelineno-0-318" name="__codelineno-0-318"></a>    <span class="k">for</span> <span class="n">token1</span><span class="p">,</span> <span class="n">token2</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">seq1</span><span class="p">,</span> <span class="n">seq2</span><span class="p">):</span>
+</span><span id="__span-0-319"><a id="__codelineno-0-319" name="__codelineno-0-319"></a>        <span class="k">if</span> <span class="n">token1</span> <span class="o">==</span> <span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">:</span>
+</span><span id="__span-0-320"><a id="__codelineno-0-320" name="__codelineno-0-320"></a>            <span class="n">num_params</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="__span-0-321"><a id="__codelineno-0-321" name="__codelineno-0-321"></a>        <span class="k">if</span> <span class="n">token1</span> <span class="o">==</span> <span class="n">token2</span><span class="p">:</span>
+</span><span id="__span-0-322"><a id="__codelineno-0-322" name="__codelineno-0-322"></a>            <span class="n">matches</span> <span class="o">+=</span> <span class="mi">1</span>
 </span><span id="__span-0-323"><a id="__codelineno-0-323" name="__codelineno-0-323"></a>
-</span><span id="__span-0-324"><a id="__codelineno-0-324" name="__codelineno-0-324"></a>    <span class="k">return</span> <span class="n">similarity</span><span class="p">,</span> <span class="n">num_params</span>
+</span><span id="__span-0-324"><a id="__codelineno-0-324" name="__codelineno-0-324"></a>    <span class="n">similarity</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">matches</span><span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">seq1</span><span class="p">)</span>
+</span><span id="__span-0-325"><a id="__codelineno-0-325" name="__codelineno-0-325"></a>
+</span><span id="__span-0-326"><a id="__codelineno-0-326" name="__codelineno-0-326"></a>    <span class="k">return</span> <span class="n">similarity</span><span class="p">,</span> <span class="n">num_params</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -4010,9 +4010,7 @@ <h3 id="logos.drain.Drain._find_cluster" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/drain.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-326">326</a></span>
-<span class="normal"><a href="#__codelineno-0-327">327</a></span>
-<span class="normal"><a href="#__codelineno-0-328">328</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-328">328</a></span>
 <span class="normal"><a href="#__codelineno-0-329">329</a></span>
 <span class="normal"><a href="#__codelineno-0-330">330</a></span>
 <span class="normal"><a href="#__codelineno-0-331">331</a></span>
@@ -4041,38 +4039,40 @@ <h3 id="logos.drain.Drain._find_cluster" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-354">354</a></span>
 <span class="normal"><a href="#__codelineno-0-355">355</a></span>
 <span class="normal"><a href="#__codelineno-0-356">356</a></span>
-<span class="normal"><a href="#__codelineno-0-357">357</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-326"><a id="__codelineno-0-326" name="__codelineno-0-326"></a><span class="k">def</span> <span class="nf">_find_cluster</span><span class="p">(</span>
-</span><span id="__span-0-327"><a id="__codelineno-0-327" name="__codelineno-0-327"></a>    <span class="bp">self</span><span class="p">,</span> <span class="n">cluster_list</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="n">Cluster</span><span class="p">],</span> <span class="n">seq</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span>
-</span><span id="__span-0-328"><a id="__codelineno-0-328" name="__codelineno-0-328"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="n">Cluster</span><span class="p">]:</span>
-</span><span id="__span-0-329"><a id="__codelineno-0-329" name="__codelineno-0-329"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-330"><a id="__codelineno-0-330" name="__codelineno-0-330"></a><span class="sd">    Find the cluster in `cluster_list` that is most similar to `seq`.</span>
-</span><span id="__span-0-331"><a id="__codelineno-0-331" name="__codelineno-0-331"></a>
-</span><span id="__span-0-332"><a id="__codelineno-0-332" name="__codelineno-0-332"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-333"><a id="__codelineno-0-333" name="__codelineno-0-333"></a><span class="sd">        cluster_list: The list of clusters to search.</span>
-</span><span id="__span-0-334"><a id="__codelineno-0-334" name="__codelineno-0-334"></a><span class="sd">        seq: The sequence of tokens to compare to.</span>
-</span><span id="__span-0-335"><a id="__codelineno-0-335" name="__codelineno-0-335"></a>
-</span><span id="__span-0-336"><a id="__codelineno-0-336" name="__codelineno-0-336"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-337"><a id="__codelineno-0-337" name="__codelineno-0-337"></a><span class="sd">        The cluster in `cluster_list` that is most similar to `seq`,</span>
-</span><span id="__span-0-338"><a id="__codelineno-0-338" name="__codelineno-0-338"></a><span class="sd">        or None if no cluster is sufficiently similar.</span>
-</span><span id="__span-0-339"><a id="__codelineno-0-339" name="__codelineno-0-339"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-340"><a id="__codelineno-0-340" name="__codelineno-0-340"></a>
-</span><span id="__span-0-341"><a id="__codelineno-0-341" name="__codelineno-0-341"></a>    <span class="n">max_similarity</span> <span class="o">=</span> <span class="o">-</span><span class="mi">1</span>
-</span><span id="__span-0-342"><a id="__codelineno-0-342" name="__codelineno-0-342"></a>    <span class="n">max_num_params</span> <span class="o">=</span> <span class="o">-</span><span class="mi">1</span>
-</span><span id="__span-0-343"><a id="__codelineno-0-343" name="__codelineno-0-343"></a>    <span class="n">max_cluster</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-344"><a id="__codelineno-0-344" name="__codelineno-0-344"></a>
-</span><span id="__span-0-345"><a id="__codelineno-0-345" name="__codelineno-0-345"></a>    <span class="k">for</span> <span class="n">cluster</span> <span class="ow">in</span> <span class="n">cluster_list</span><span class="p">:</span>
-</span><span id="__span-0-346"><a id="__codelineno-0-346" name="__codelineno-0-346"></a>        <span class="n">similarity</span><span class="p">,</span> <span class="n">num_params</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_similarity</span><span class="p">(</span><span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="p">,</span> <span class="n">seq</span><span class="p">)</span>
-</span><span id="__span-0-347"><a id="__codelineno-0-347" name="__codelineno-0-347"></a>        <span class="k">if</span> <span class="n">similarity</span> <span class="o">&gt;</span> <span class="n">max_similarity</span> <span class="ow">or</span> <span class="p">(</span>
-</span><span id="__span-0-348"><a id="__codelineno-0-348" name="__codelineno-0-348"></a>            <span class="n">similarity</span> <span class="o">==</span> <span class="n">max_similarity</span> <span class="ow">and</span> <span class="n">num_params</span> <span class="o">&gt;</span> <span class="n">max_num_params</span>
-</span><span id="__span-0-349"><a id="__codelineno-0-349" name="__codelineno-0-349"></a>        <span class="p">):</span>
-</span><span id="__span-0-350"><a id="__codelineno-0-350" name="__codelineno-0-350"></a>            <span class="n">max_similarity</span> <span class="o">=</span> <span class="n">similarity</span>
-</span><span id="__span-0-351"><a id="__codelineno-0-351" name="__codelineno-0-351"></a>            <span class="n">max_num_params</span> <span class="o">=</span> <span class="n">num_params</span>
-</span><span id="__span-0-352"><a id="__codelineno-0-352" name="__codelineno-0-352"></a>            <span class="n">max_cluster</span> <span class="o">=</span> <span class="n">cluster</span>
-</span><span id="__span-0-353"><a id="__codelineno-0-353" name="__codelineno-0-353"></a>
-</span><span id="__span-0-354"><a id="__codelineno-0-354" name="__codelineno-0-354"></a>    <span class="k">if</span> <span class="n">max_similarity</span> <span class="o">&gt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">st</span><span class="p">:</span>
-</span><span id="__span-0-355"><a id="__codelineno-0-355" name="__codelineno-0-355"></a>        <span class="k">return</span> <span class="n">max_cluster</span>
-</span><span id="__span-0-356"><a id="__codelineno-0-356" name="__codelineno-0-356"></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-357"><a id="__codelineno-0-357" name="__codelineno-0-357"></a>        <span class="k">return</span> <span class="kc">None</span>
+<span class="normal"><a href="#__codelineno-0-357">357</a></span>
+<span class="normal"><a href="#__codelineno-0-358">358</a></span>
+<span class="normal"><a href="#__codelineno-0-359">359</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-328"><a id="__codelineno-0-328" name="__codelineno-0-328"></a><span class="k">def</span> <span class="nf">_find_cluster</span><span class="p">(</span>
+</span><span id="__span-0-329"><a id="__codelineno-0-329" name="__codelineno-0-329"></a>    <span class="bp">self</span><span class="p">,</span> <span class="n">cluster_list</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="n">Cluster</span><span class="p">],</span> <span class="n">seq</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span>
+</span><span id="__span-0-330"><a id="__codelineno-0-330" name="__codelineno-0-330"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="n">Cluster</span><span class="p">]:</span>
+</span><span id="__span-0-331"><a id="__codelineno-0-331" name="__codelineno-0-331"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-332"><a id="__codelineno-0-332" name="__codelineno-0-332"></a><span class="sd">    Find the cluster in `cluster_list` that is most similar to `seq`.</span>
+</span><span id="__span-0-333"><a id="__codelineno-0-333" name="__codelineno-0-333"></a>
+</span><span id="__span-0-334"><a id="__codelineno-0-334" name="__codelineno-0-334"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-335"><a id="__codelineno-0-335" name="__codelineno-0-335"></a><span class="sd">        cluster_list: The list of clusters to search.</span>
+</span><span id="__span-0-336"><a id="__codelineno-0-336" name="__codelineno-0-336"></a><span class="sd">        seq: The sequence of tokens to compare to.</span>
+</span><span id="__span-0-337"><a id="__codelineno-0-337" name="__codelineno-0-337"></a>
+</span><span id="__span-0-338"><a id="__codelineno-0-338" name="__codelineno-0-338"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-339"><a id="__codelineno-0-339" name="__codelineno-0-339"></a><span class="sd">        The cluster in `cluster_list` that is most similar to `seq`,</span>
+</span><span id="__span-0-340"><a id="__codelineno-0-340" name="__codelineno-0-340"></a><span class="sd">        or None if no cluster is sufficiently similar.</span>
+</span><span id="__span-0-341"><a id="__codelineno-0-341" name="__codelineno-0-341"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-342"><a id="__codelineno-0-342" name="__codelineno-0-342"></a>
+</span><span id="__span-0-343"><a id="__codelineno-0-343" name="__codelineno-0-343"></a>    <span class="n">max_similarity</span> <span class="o">=</span> <span class="o">-</span><span class="mi">1</span>
+</span><span id="__span-0-344"><a id="__codelineno-0-344" name="__codelineno-0-344"></a>    <span class="n">max_num_params</span> <span class="o">=</span> <span class="o">-</span><span class="mi">1</span>
+</span><span id="__span-0-345"><a id="__codelineno-0-345" name="__codelineno-0-345"></a>    <span class="n">max_cluster</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-346"><a id="__codelineno-0-346" name="__codelineno-0-346"></a>
+</span><span id="__span-0-347"><a id="__codelineno-0-347" name="__codelineno-0-347"></a>    <span class="k">for</span> <span class="n">cluster</span> <span class="ow">in</span> <span class="n">cluster_list</span><span class="p">:</span>
+</span><span id="__span-0-348"><a id="__codelineno-0-348" name="__codelineno-0-348"></a>        <span class="n">similarity</span><span class="p">,</span> <span class="n">num_params</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_similarity</span><span class="p">(</span><span class="n">cluster</span><span class="o">.</span><span class="n">template</span><span class="p">,</span> <span class="n">seq</span><span class="p">)</span>
+</span><span id="__span-0-349"><a id="__codelineno-0-349" name="__codelineno-0-349"></a>        <span class="k">if</span> <span class="n">similarity</span> <span class="o">&gt;</span> <span class="n">max_similarity</span> <span class="ow">or</span> <span class="p">(</span>
+</span><span id="__span-0-350"><a id="__codelineno-0-350" name="__codelineno-0-350"></a>            <span class="n">similarity</span> <span class="o">==</span> <span class="n">max_similarity</span> <span class="ow">and</span> <span class="n">num_params</span> <span class="o">&gt;</span> <span class="n">max_num_params</span>
+</span><span id="__span-0-351"><a id="__codelineno-0-351" name="__codelineno-0-351"></a>        <span class="p">):</span>
+</span><span id="__span-0-352"><a id="__codelineno-0-352" name="__codelineno-0-352"></a>            <span class="n">max_similarity</span> <span class="o">=</span> <span class="n">similarity</span>
+</span><span id="__span-0-353"><a id="__codelineno-0-353" name="__codelineno-0-353"></a>            <span class="n">max_num_params</span> <span class="o">=</span> <span class="n">num_params</span>
+</span><span id="__span-0-354"><a id="__codelineno-0-354" name="__codelineno-0-354"></a>            <span class="n">max_cluster</span> <span class="o">=</span> <span class="n">cluster</span>
+</span><span id="__span-0-355"><a id="__codelineno-0-355" name="__codelineno-0-355"></a>
+</span><span id="__span-0-356"><a id="__codelineno-0-356" name="__codelineno-0-356"></a>    <span class="k">if</span> <span class="n">max_similarity</span> <span class="o">&gt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">st</span><span class="p">:</span>
+</span><span id="__span-0-357"><a id="__codelineno-0-357" name="__codelineno-0-357"></a>        <span class="k">return</span> <span class="n">max_cluster</span>
+</span><span id="__span-0-358"><a id="__codelineno-0-358" name="__codelineno-0-358"></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-359"><a id="__codelineno-0-359" name="__codelineno-0-359"></a>        <span class="k">return</span> <span class="kc">None</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -4160,9 +4160,7 @@ <h3 id="logos.drain.Drain._get_updated_template" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/drain.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-359">359</a></span>
-<span class="normal"><a href="#__codelineno-0-360">360</a></span>
-<span class="normal"><a href="#__codelineno-0-361">361</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-361">361</a></span>
 <span class="normal"><a href="#__codelineno-0-362">362</a></span>
 <span class="normal"><a href="#__codelineno-0-363">363</a></span>
 <span class="normal"><a href="#__codelineno-0-364">364</a></span>
@@ -4181,28 +4179,30 @@ <h3 id="logos.drain.Drain._get_updated_template" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-377">377</a></span>
 <span class="normal"><a href="#__codelineno-0-378">378</a></span>
 <span class="normal"><a href="#__codelineno-0-379">379</a></span>
-<span class="normal"><a href="#__codelineno-0-380">380</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-359"><a id="__codelineno-0-359" name="__codelineno-0-359"></a><span class="k">def</span> <span class="nf">_get_updated_template</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">template</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">msg</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]:</span>
-</span><span id="__span-0-360"><a id="__codelineno-0-360" name="__codelineno-0-360"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-361"><a id="__codelineno-0-361" name="__codelineno-0-361"></a><span class="sd">    Get the updated template from matching `msg` to `template`.</span>
-</span><span id="__span-0-362"><a id="__codelineno-0-362" name="__codelineno-0-362"></a>
-</span><span id="__span-0-363"><a id="__codelineno-0-363" name="__codelineno-0-363"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-364"><a id="__codelineno-0-364" name="__codelineno-0-364"></a><span class="sd">        template: The template to match to.</span>
-</span><span id="__span-0-365"><a id="__codelineno-0-365" name="__codelineno-0-365"></a><span class="sd">        msg: The message to match.</span>
-</span><span id="__span-0-366"><a id="__codelineno-0-366" name="__codelineno-0-366"></a>
-</span><span id="__span-0-367"><a id="__codelineno-0-367" name="__codelineno-0-367"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-368"><a id="__codelineno-0-368" name="__codelineno-0-368"></a><span class="sd">        The updated template.</span>
-</span><span id="__span-0-369"><a id="__codelineno-0-369" name="__codelineno-0-369"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-370"><a id="__codelineno-0-370" name="__codelineno-0-370"></a>
-</span><span id="__span-0-371"><a id="__codelineno-0-371" name="__codelineno-0-371"></a>    <span class="k">assert</span> <span class="nb">len</span><span class="p">(</span><span class="n">template</span><span class="p">)</span> <span class="o">==</span> <span class="nb">len</span><span class="p">(</span><span class="n">msg</span><span class="p">)</span>
-</span><span id="__span-0-372"><a id="__codelineno-0-372" name="__codelineno-0-372"></a>    <span class="n">updated_template</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-373"><a id="__codelineno-0-373" name="__codelineno-0-373"></a>
-</span><span id="__span-0-374"><a id="__codelineno-0-374" name="__codelineno-0-374"></a>    <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">word</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">template</span><span class="p">):</span>
-</span><span id="__span-0-375"><a id="__codelineno-0-375" name="__codelineno-0-375"></a>        <span class="k">if</span> <span class="n">word</span> <span class="o">==</span> <span class="n">msg</span><span class="p">[</span><span class="n">i</span><span class="p">]:</span>
-</span><span id="__span-0-376"><a id="__codelineno-0-376" name="__codelineno-0-376"></a>            <span class="n">updated_template</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">word</span><span class="p">)</span>
-</span><span id="__span-0-377"><a id="__codelineno-0-377" name="__codelineno-0-377"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-378"><a id="__codelineno-0-378" name="__codelineno-0-378"></a>            <span class="n">updated_template</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">)</span>
-</span><span id="__span-0-379"><a id="__codelineno-0-379" name="__codelineno-0-379"></a>
-</span><span id="__span-0-380"><a id="__codelineno-0-380" name="__codelineno-0-380"></a>    <span class="k">return</span> <span class="n">updated_template</span>
+<span class="normal"><a href="#__codelineno-0-380">380</a></span>
+<span class="normal"><a href="#__codelineno-0-381">381</a></span>
+<span class="normal"><a href="#__codelineno-0-382">382</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-361"><a id="__codelineno-0-361" name="__codelineno-0-361"></a><span class="k">def</span> <span class="nf">_get_updated_template</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">template</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">msg</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]:</span>
+</span><span id="__span-0-362"><a id="__codelineno-0-362" name="__codelineno-0-362"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-363"><a id="__codelineno-0-363" name="__codelineno-0-363"></a><span class="sd">    Get the updated template from matching `msg` to `template`.</span>
+</span><span id="__span-0-364"><a id="__codelineno-0-364" name="__codelineno-0-364"></a>
+</span><span id="__span-0-365"><a id="__codelineno-0-365" name="__codelineno-0-365"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-366"><a id="__codelineno-0-366" name="__codelineno-0-366"></a><span class="sd">        template: The template to match to.</span>
+</span><span id="__span-0-367"><a id="__codelineno-0-367" name="__codelineno-0-367"></a><span class="sd">        msg: The message to match.</span>
+</span><span id="__span-0-368"><a id="__codelineno-0-368" name="__codelineno-0-368"></a>
+</span><span id="__span-0-369"><a id="__codelineno-0-369" name="__codelineno-0-369"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-370"><a id="__codelineno-0-370" name="__codelineno-0-370"></a><span class="sd">        The updated template.</span>
+</span><span id="__span-0-371"><a id="__codelineno-0-371" name="__codelineno-0-371"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-372"><a id="__codelineno-0-372" name="__codelineno-0-372"></a>
+</span><span id="__span-0-373"><a id="__codelineno-0-373" name="__codelineno-0-373"></a>    <span class="k">assert</span> <span class="nb">len</span><span class="p">(</span><span class="n">template</span><span class="p">)</span> <span class="o">==</span> <span class="nb">len</span><span class="p">(</span><span class="n">msg</span><span class="p">)</span>
+</span><span id="__span-0-374"><a id="__codelineno-0-374" name="__codelineno-0-374"></a>    <span class="n">updated_template</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-375"><a id="__codelineno-0-375" name="__codelineno-0-375"></a>
+</span><span id="__span-0-376"><a id="__codelineno-0-376" name="__codelineno-0-376"></a>    <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">word</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">template</span><span class="p">):</span>
+</span><span id="__span-0-377"><a id="__codelineno-0-377" name="__codelineno-0-377"></a>        <span class="k">if</span> <span class="n">word</span> <span class="o">==</span> <span class="n">msg</span><span class="p">[</span><span class="n">i</span><span class="p">]:</span>
+</span><span id="__span-0-378"><a id="__codelineno-0-378" name="__codelineno-0-378"></a>            <span class="n">updated_template</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">word</span><span class="p">)</span>
+</span><span id="__span-0-379"><a id="__codelineno-0-379" name="__codelineno-0-379"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-380"><a id="__codelineno-0-380" name="__codelineno-0-380"></a>            <span class="n">updated_template</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="s2">&quot;&lt;*&gt;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-381"><a id="__codelineno-0-381" name="__codelineno-0-381"></a>
+</span><span id="__span-0-382"><a id="__codelineno-0-382" name="__codelineno-0-382"></a>    <span class="k">return</span> <span class="n">updated_template</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -4294,9 +4294,7 @@ <h3 id="logos.drain.Drain._preceding_3" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/drain.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-382">382</a></span>
-<span class="normal"><a href="#__codelineno-0-383">383</a></span>
-<span class="normal"><a href="#__codelineno-0-384">384</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-384">384</a></span>
 <span class="normal"><a href="#__codelineno-0-385">385</a></span>
 <span class="normal"><a href="#__codelineno-0-386">386</a></span>
 <span class="normal"><a href="#__codelineno-0-387">387</a></span>
@@ -4317,30 +4315,32 @@ <h3 id="logos.drain.Drain._preceding_3" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-402">402</a></span>
 <span class="normal"><a href="#__codelineno-0-403">403</a></span>
 <span class="normal"><a href="#__codelineno-0-404">404</a></span>
-<span class="normal"><a href="#__codelineno-0-405">405</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-382"><a id="__codelineno-0-382" name="__codelineno-0-382"></a><span class="nd">@staticmethod</span>
-</span><span id="__span-0-383"><a id="__codelineno-0-383" name="__codelineno-0-383"></a><span class="k">def</span> <span class="nf">_preceding_3</span><span class="p">(</span><span class="n">parsed_templates</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]:</span>
-</span><span id="__span-0-384"><a id="__codelineno-0-384" name="__codelineno-0-384"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-385"><a id="__codelineno-0-385" name="__codelineno-0-385"></a><span class="sd">    Get the 3 tokens preceding the variable `x` in the template.</span>
-</span><span id="__span-0-386"><a id="__codelineno-0-386" name="__codelineno-0-386"></a>
-</span><span id="__span-0-387"><a id="__codelineno-0-387" name="__codelineno-0-387"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-388"><a id="__codelineno-0-388" name="__codelineno-0-388"></a><span class="sd">        parsed_templates: The dataframe containing information about the parsed templates.</span>
-</span><span id="__span-0-389"><a id="__codelineno-0-389" name="__codelineno-0-389"></a><span class="sd">        x: The name of the variable.</span>
-</span><span id="__span-0-390"><a id="__codelineno-0-390" name="__codelineno-0-390"></a>
-</span><span id="__span-0-391"><a id="__codelineno-0-391" name="__codelineno-0-391"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-392"><a id="__codelineno-0-392" name="__codelineno-0-392"></a><span class="sd">        The 3 tokens preceding the variable `x` in the template.</span>
-</span><span id="__span-0-393"><a id="__codelineno-0-393" name="__codelineno-0-393"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-394"><a id="__codelineno-0-394" name="__codelineno-0-394"></a>
-</span><span id="__span-0-395"><a id="__codelineno-0-395" name="__codelineno-0-395"></a>    <span class="n">splitx</span> <span class="o">=</span> <span class="n">x</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;_&quot;</span><span class="p">)</span>
-</span><span id="__span-0-396"><a id="__codelineno-0-396" name="__codelineno-0-396"></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">splitx</span><span class="p">)</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="__span-0-397"><a id="__codelineno-0-397" name="__codelineno-0-397"></a>        <span class="k">return</span> <span class="p">[]</span>
-</span><span id="__span-0-398"><a id="__codelineno-0-398" name="__codelineno-0-398"></a>    <span class="nb">id</span> <span class="o">=</span> <span class="n">splitx</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-399"><a id="__codelineno-0-399" name="__codelineno-0-399"></a>    <span class="n">position</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">splitx</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
-</span><span id="__span-0-400"><a id="__codelineno-0-400" name="__codelineno-0-400"></a>    <span class="n">start_position</span> <span class="o">=</span> <span class="nb">max</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">position</span> <span class="o">-</span> <span class="mi">3</span><span class="p">)</span>
-</span><span id="__span-0-401"><a id="__codelineno-0-401" name="__codelineno-0-401"></a>    <span class="k">return</span> <span class="p">(</span>
-</span><span id="__span-0-402"><a id="__codelineno-0-402" name="__codelineno-0-402"></a>        <span class="n">parsed_templates</span><span class="p">[</span><span class="n">parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="nb">id</span><span class="p">][</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span>
-</span><span id="__span-0-403"><a id="__codelineno-0-403" name="__codelineno-0-403"></a>        <span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-404"><a id="__codelineno-0-404" name="__codelineno-0-404"></a>        <span class="o">.</span><span class="n">split</span><span class="p">()[</span><span class="n">start_position</span><span class="p">:</span><span class="n">position</span><span class="p">]</span>
-</span><span id="__span-0-405"><a id="__codelineno-0-405" name="__codelineno-0-405"></a>    <span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-405">405</a></span>
+<span class="normal"><a href="#__codelineno-0-406">406</a></span>
+<span class="normal"><a href="#__codelineno-0-407">407</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-384"><a id="__codelineno-0-384" name="__codelineno-0-384"></a><span class="nd">@staticmethod</span>
+</span><span id="__span-0-385"><a id="__codelineno-0-385" name="__codelineno-0-385"></a><span class="k">def</span> <span class="nf">_preceding_3</span><span class="p">(</span><span class="n">parsed_templates</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]:</span>
+</span><span id="__span-0-386"><a id="__codelineno-0-386" name="__codelineno-0-386"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-387"><a id="__codelineno-0-387" name="__codelineno-0-387"></a><span class="sd">    Get the 3 tokens preceding the variable `x` in the template.</span>
+</span><span id="__span-0-388"><a id="__codelineno-0-388" name="__codelineno-0-388"></a>
+</span><span id="__span-0-389"><a id="__codelineno-0-389" name="__codelineno-0-389"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-390"><a id="__codelineno-0-390" name="__codelineno-0-390"></a><span class="sd">        parsed_templates: The dataframe containing information about the parsed templates.</span>
+</span><span id="__span-0-391"><a id="__codelineno-0-391" name="__codelineno-0-391"></a><span class="sd">        x: The name of the variable.</span>
+</span><span id="__span-0-392"><a id="__codelineno-0-392" name="__codelineno-0-392"></a>
+</span><span id="__span-0-393"><a id="__codelineno-0-393" name="__codelineno-0-393"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-394"><a id="__codelineno-0-394" name="__codelineno-0-394"></a><span class="sd">        The 3 tokens preceding the variable `x` in the template.</span>
+</span><span id="__span-0-395"><a id="__codelineno-0-395" name="__codelineno-0-395"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-396"><a id="__codelineno-0-396" name="__codelineno-0-396"></a>
+</span><span id="__span-0-397"><a id="__codelineno-0-397" name="__codelineno-0-397"></a>    <span class="n">splitx</span> <span class="o">=</span> <span class="n">x</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;_&quot;</span><span class="p">)</span>
+</span><span id="__span-0-398"><a id="__codelineno-0-398" name="__codelineno-0-398"></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">splitx</span><span class="p">)</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="__span-0-399"><a id="__codelineno-0-399" name="__codelineno-0-399"></a>        <span class="k">return</span> <span class="p">[]</span>
+</span><span id="__span-0-400"><a id="__codelineno-0-400" name="__codelineno-0-400"></a>    <span class="nb">id</span> <span class="o">=</span> <span class="n">splitx</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-401"><a id="__codelineno-0-401" name="__codelineno-0-401"></a>    <span class="n">position</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">splitx</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+</span><span id="__span-0-402"><a id="__codelineno-0-402" name="__codelineno-0-402"></a>    <span class="n">start_position</span> <span class="o">=</span> <span class="nb">max</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">position</span> <span class="o">-</span> <span class="mi">3</span><span class="p">)</span>
+</span><span id="__span-0-403"><a id="__codelineno-0-403" name="__codelineno-0-403"></a>    <span class="k">return</span> <span class="p">(</span>
+</span><span id="__span-0-404"><a id="__codelineno-0-404" name="__codelineno-0-404"></a>        <span class="n">parsed_templates</span><span class="p">[</span><span class="n">parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="nb">id</span><span class="p">][</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span>
+</span><span id="__span-0-405"><a id="__codelineno-0-405" name="__codelineno-0-405"></a>        <span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-406"><a id="__codelineno-0-406" name="__codelineno-0-406"></a>        <span class="o">.</span><span class="n">split</span><span class="p">()[</span><span class="n">start_position</span><span class="p">:</span><span class="n">position</span><span class="p">]</span>
+</span><span id="__span-0-407"><a id="__codelineno-0-407" name="__codelineno-0-407"></a>    <span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -4362,9 +4362,7 @@ <h3 id="logos.drain.Drain._extract_variables" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/drain.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-499">499</a></span>
-<span class="normal"><a href="#__codelineno-0-500">500</a></span>
-<span class="normal"><a href="#__codelineno-0-501">501</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-501">501</a></span>
 <span class="normal"><a href="#__codelineno-0-502">502</a></span>
 <span class="normal"><a href="#__codelineno-0-503">503</a></span>
 <span class="normal"><a href="#__codelineno-0-504">504</a></span>
@@ -4385,30 +4383,32 @@ <h3 id="logos.drain.Drain._extract_variables" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-519">519</a></span>
 <span class="normal"><a href="#__codelineno-0-520">520</a></span>
 <span class="normal"><a href="#__codelineno-0-521">521</a></span>
-<span class="normal"><a href="#__codelineno-0-522">522</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-499"><a id="__codelineno-0-499" name="__codelineno-0-499"></a><span class="k">def</span> <span class="nf">_extract_variables</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-500"><a id="__codelineno-0-500" name="__codelineno-0-500"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-501"><a id="__codelineno-0-501" name="__codelineno-0-501"></a><span class="sd">    Extract the variables from the log messages.</span>
-</span><span id="__span-0-502"><a id="__codelineno-0-502" name="__codelineno-0-502"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-503"><a id="__codelineno-0-503" name="__codelineno-0-503"></a>
-</span><span id="__span-0-504"><a id="__codelineno-0-504" name="__codelineno-0-504"></a>    <span class="k">for</span> <span class="n">row</span> <span class="ow">in</span> <span class="n">tqdm</span><span class="p">(</span>
-</span><span id="__span-0-505"><a id="__codelineno-0-505" name="__codelineno-0-505"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="o">.</span><span class="n">itertuples</span><span class="p">(),</span>
-</span><span id="__span-0-506"><a id="__codelineno-0-506" name="__codelineno-0-506"></a>        <span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Extracting variables from each log message...&quot;</span><span class="p">,</span>
-</span><span id="__span-0-507"><a id="__codelineno-0-507" name="__codelineno-0-507"></a>        <span class="n">total</span><span class="o">=</span><span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="p">),</span>
-</span><span id="__span-0-508"><a id="__codelineno-0-508" name="__codelineno-0-508"></a>    <span class="p">):</span>
-</span><span id="__span-0-509"><a id="__codelineno-0-509" name="__codelineno-0-509"></a>        <span class="n">template_id</span> <span class="o">=</span> <span class="n">row</span><span class="o">.</span><span class="n">TemplateId</span>
-</span><span id="__span-0-510"><a id="__codelineno-0-510" name="__codelineno-0-510"></a>        <span class="n">variable_indices</span> <span class="o">=</span> <span class="n">row</span><span class="o">.</span><span class="n">VariableIndices</span>
-</span><span id="__span-0-511"><a id="__codelineno-0-511" name="__codelineno-0-511"></a>
-</span><span id="__span-0-512"><a id="__codelineno-0-512" name="__codelineno-0-512"></a>        <span class="n">mask</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">template_id</span>
-</span><span id="__span-0-513"><a id="__codelineno-0-513" name="__codelineno-0-513"></a>        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">variable_indices</span><span class="p">:</span>
-</span><span id="__span-0-514"><a id="__codelineno-0-514" name="__codelineno-0-514"></a>            <span class="n">col_name</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">template_id</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="nb">str</span><span class="p">(</span><span class="n">i</span><span class="p">)</span><span class="si">}</span><span class="s2">&quot;</span>
-</span><span id="__span-0-515"><a id="__codelineno-0-515" name="__codelineno-0-515"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">mask</span><span class="p">,</span> <span class="n">col_name</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">mask</span><span class="p">,</span> <span class="s2">&quot;Tokenized&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">str</span><span class="p">[</span>
-</span><span id="__span-0-516"><a id="__codelineno-0-516" name="__codelineno-0-516"></a>                <span class="n">i</span>
-</span><span id="__span-0-517"><a id="__codelineno-0-517" name="__codelineno-0-517"></a>            <span class="p">]</span>
-</span><span id="__span-0-518"><a id="__codelineno-0-518" name="__codelineno-0-518"></a>
-</span><span id="__span-0-519"><a id="__codelineno-0-519" name="__codelineno-0-519"></a>        <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">col_name</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">rex</span><span class="o">.</span><span class="n">keys</span><span class="p">()):</span>
-</span><span id="__span-0-520"><a id="__codelineno-0-520" name="__codelineno-0-520"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">mask</span><span class="p">,</span> <span class="n">col_name</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-521"><a id="__codelineno-0-521" name="__codelineno-0-521"></a>                <span class="n">mask</span><span class="p">,</span> <span class="s2">&quot;Replaced by regex&quot;</span>
-</span><span id="__span-0-522"><a id="__codelineno-0-522" name="__codelineno-0-522"></a>            <span class="p">]</span><span class="o">.</span><span class="n">str</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
+<span class="normal"><a href="#__codelineno-0-522">522</a></span>
+<span class="normal"><a href="#__codelineno-0-523">523</a></span>
+<span class="normal"><a href="#__codelineno-0-524">524</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-501"><a id="__codelineno-0-501" name="__codelineno-0-501"></a><span class="k">def</span> <span class="nf">_extract_variables</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-502"><a id="__codelineno-0-502" name="__codelineno-0-502"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-503"><a id="__codelineno-0-503" name="__codelineno-0-503"></a><span class="sd">    Extract the variables from the log messages.</span>
+</span><span id="__span-0-504"><a id="__codelineno-0-504" name="__codelineno-0-504"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-505"><a id="__codelineno-0-505" name="__codelineno-0-505"></a>
+</span><span id="__span-0-506"><a id="__codelineno-0-506" name="__codelineno-0-506"></a>    <span class="k">for</span> <span class="n">row</span> <span class="ow">in</span> <span class="n">tqdm</span><span class="p">(</span>
+</span><span id="__span-0-507"><a id="__codelineno-0-507" name="__codelineno-0-507"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="o">.</span><span class="n">itertuples</span><span class="p">(),</span>
+</span><span id="__span-0-508"><a id="__codelineno-0-508" name="__codelineno-0-508"></a>        <span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Extracting variables from each log message...&quot;</span><span class="p">,</span>
+</span><span id="__span-0-509"><a id="__codelineno-0-509" name="__codelineno-0-509"></a>        <span class="n">total</span><span class="o">=</span><span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="p">),</span>
+</span><span id="__span-0-510"><a id="__codelineno-0-510" name="__codelineno-0-510"></a>    <span class="p">):</span>
+</span><span id="__span-0-511"><a id="__codelineno-0-511" name="__codelineno-0-511"></a>        <span class="n">template_id</span> <span class="o">=</span> <span class="n">row</span><span class="o">.</span><span class="n">TemplateId</span>
+</span><span id="__span-0-512"><a id="__codelineno-0-512" name="__codelineno-0-512"></a>        <span class="n">variable_indices</span> <span class="o">=</span> <span class="n">row</span><span class="o">.</span><span class="n">VariableIndices</span>
+</span><span id="__span-0-513"><a id="__codelineno-0-513" name="__codelineno-0-513"></a>
+</span><span id="__span-0-514"><a id="__codelineno-0-514" name="__codelineno-0-514"></a>        <span class="n">mask</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">template_id</span>
+</span><span id="__span-0-515"><a id="__codelineno-0-515" name="__codelineno-0-515"></a>        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">variable_indices</span><span class="p">:</span>
+</span><span id="__span-0-516"><a id="__codelineno-0-516" name="__codelineno-0-516"></a>            <span class="n">col_name</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">template_id</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="nb">str</span><span class="p">(</span><span class="n">i</span><span class="p">)</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="__span-0-517"><a id="__codelineno-0-517" name="__codelineno-0-517"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">mask</span><span class="p">,</span> <span class="n">col_name</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">mask</span><span class="p">,</span> <span class="s2">&quot;Tokenized&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">str</span><span class="p">[</span>
+</span><span id="__span-0-518"><a id="__codelineno-0-518" name="__codelineno-0-518"></a>                <span class="n">i</span>
+</span><span id="__span-0-519"><a id="__codelineno-0-519" name="__codelineno-0-519"></a>            <span class="p">]</span>
+</span><span id="__span-0-520"><a id="__codelineno-0-520" name="__codelineno-0-520"></a>
+</span><span id="__span-0-521"><a id="__codelineno-0-521" name="__codelineno-0-521"></a>        <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">col_name</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">rex</span><span class="o">.</span><span class="n">keys</span><span class="p">()):</span>
+</span><span id="__span-0-522"><a id="__codelineno-0-522" name="__codelineno-0-522"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">mask</span><span class="p">,</span> <span class="n">col_name</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">logdf</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-523"><a id="__codelineno-0-523" name="__codelineno-0-523"></a>                <span class="n">mask</span><span class="p">,</span> <span class="s2">&quot;Replaced by regex&quot;</span>
+</span><span id="__span-0-524"><a id="__codelineno-0-524" name="__codelineno-0-524"></a>            <span class="p">]</span><span class="o">.</span><span class="n">str</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
diff --git a/reference/logos/edge_occurrence_tree/index.html b/reference/logos/edge_occurrence_tree/index.html
index 4e537c7..07ef2d1 100644
--- a/reference/logos/edge_occurrence_tree/index.html
+++ b/reference/logos/edge_occurrence_tree/index.html
@@ -752,6 +752,48 @@
     </span>
   </a>
   
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#logos.edge_occurrence_tree.Types" class="md-nav__link">
+    <span class="md-ellipsis">
+      Types
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="Types">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#logos.edge_occurrence_tree.Types.Edge" class="md-nav__link">
+    <span class="md-ellipsis">
+      Edge
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#logos.edge_occurrence_tree.Types.LeafLabelingFunction" class="md-nav__link">
+    <span class="md-ellipsis">
+      LeafLabelingFunction
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#logos.edge_occurrence_tree.Types.EdgeCountDict" class="md-nav__link">
+    <span class="md-ellipsis">
+      EdgeCountDict
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
 </li>
       
         <li class="md-nav__item">
@@ -1158,6 +1200,48 @@
     </span>
   </a>
   
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#logos.edge_occurrence_tree.Types" class="md-nav__link">
+    <span class="md-ellipsis">
+      Types
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="Types">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#logos.edge_occurrence_tree.Types.Edge" class="md-nav__link">
+    <span class="md-ellipsis">
+      Edge
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#logos.edge_occurrence_tree.Types.LeafLabelingFunction" class="md-nav__link">
+    <span class="md-ellipsis">
+      LeafLabelingFunction
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#logos.edge_occurrence_tree.Types.EdgeCountDict" class="md-nav__link">
+    <span class="md-ellipsis">
+      EdgeCountDict
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
 </li>
       
         <li class="md-nav__item">
@@ -1294,6 +1378,128 @@ <h1>EdgeOccurrenceTree</h1>
 
 
 
+<div class="doc doc-object doc-class">
+
+
+
+<h2 id="logos.edge_occurrence_tree.Types" class="doc doc-heading">
+            <code>Types</code>
+
+
+</h2>
+
+
+    <div class="doc doc-contents ">
+
+
+              <details class="quote">
+                <summary>Source code in <code>src/logos/types.py</code></summary>
+                <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-5"> 5</a></span>
+<span class="normal"><a href="#__codelineno-0-6"> 6</a></span>
+<span class="normal"><a href="#__codelineno-0-7"> 7</a></span>
+<span class="normal"><a href="#__codelineno-0-8"> 8</a></span>
+<span class="normal"><a href="#__codelineno-0-9"> 9</a></span>
+<span class="normal"><a href="#__codelineno-0-10">10</a></span>
+<span class="normal"><a href="#__codelineno-0-11">11</a></span>
+<span class="normal"><a href="#__codelineno-0-12">12</a></span>
+<span class="normal"><a href="#__codelineno-0-13">13</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-5"><a id="__codelineno-0-5" name="__codelineno-0-5"></a><span class="k">class</span> <span class="nc">Types</span><span class="p">:</span>
+</span><span id="__span-0-6"><a id="__codelineno-0-6" name="__codelineno-0-6"></a>    <span class="n">Edge</span> <span class="o">=</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">]</span>
+</span><span id="__span-0-7"><a id="__codelineno-0-7" name="__codelineno-0-7"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Type alias for a directed edge.&quot;&quot;&quot;</span>
+</span><span id="__span-0-8"><a id="__codelineno-0-8" name="__codelineno-0-8"></a>
+</span><span id="__span-0-9"><a id="__codelineno-0-9" name="__codelineno-0-9"></a>    <span class="n">LeafLabelingFunction</span> <span class="o">=</span> <span class="n">Callable</span><span class="p">[[</span><span class="nb">int</span><span class="p">],</span> <span class="nb">str</span><span class="p">]</span>
+</span><span id="__span-0-10"><a id="__codelineno-0-10" name="__codelineno-0-10"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Type alias for a leaf labeling function in `ATE`.&quot;&quot;&quot;</span>
+</span><span id="__span-0-11"><a id="__codelineno-0-11" name="__codelineno-0-11"></a>
+</span><span id="__span-0-12"><a id="__codelineno-0-12" name="__codelineno-0-12"></a>    <span class="n">EdgeCountDict</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">[</span><span class="n">Edge</span><span class="p">,</span> <span class="nb">int</span><span class="p">]</span>
+</span><span id="__span-0-13"><a id="__codelineno-0-13" name="__codelineno-0-13"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Type alias for a dictionary counting edge occurrences.&quot;&quot;&quot;</span>
+</span></code></pre></div></td></tr></table></div>
+              </details>
+
+
+
+  <div class="doc doc-children">
+
+
+
+
+
+
+
+<div class="doc doc-object doc-attribute">
+
+
+
+<h3 id="logos.edge_occurrence_tree.Types.Edge" class="doc doc-heading">
+            <code class="highlight language-python"><span class="n">Edge</span> <span class="o">=</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">]</span></code>
+
+  <span class="doc doc-labels">
+      <small class="doc doc-label doc-label-class-attribute"><code>class-attribute</code></small>
+      <small class="doc doc-label doc-label-instance-attribute"><code>instance-attribute</code></small>
+  </span>
+
+</h3>
+
+
+    <div class="doc doc-contents ">
+
+      <p>Type alias for a directed edge.</p>
+    </div>
+
+</div>
+
+<div class="doc doc-object doc-attribute">
+
+
+
+<h3 id="logos.edge_occurrence_tree.Types.LeafLabelingFunction" class="doc doc-heading">
+            <code class="highlight language-python"><span class="n">LeafLabelingFunction</span> <span class="o">=</span> <span class="n">Callable</span><span class="p">[[</span><span class="nb">int</span><span class="p">],</span> <span class="nb">str</span><span class="p">]</span></code>
+
+  <span class="doc doc-labels">
+      <small class="doc doc-label doc-label-class-attribute"><code>class-attribute</code></small>
+      <small class="doc doc-label doc-label-instance-attribute"><code>instance-attribute</code></small>
+  </span>
+
+</h3>
+
+
+    <div class="doc doc-contents ">
+
+      <p>Type alias for a leaf labeling function in <code>ATE</code>.</p>
+    </div>
+
+</div>
+
+<div class="doc doc-object doc-attribute">
+
+
+
+<h3 id="logos.edge_occurrence_tree.Types.EdgeCountDict" class="doc doc-heading">
+            <code class="highlight language-python"><span class="n">EdgeCountDict</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">[</span><span class="n">Edge</span><span class="p">,</span> <span class="nb">int</span><span class="p">]</span></code>
+
+  <span class="doc doc-labels">
+      <small class="doc doc-label doc-label-class-attribute"><code>class-attribute</code></small>
+      <small class="doc doc-label doc-label-instance-attribute"><code>instance-attribute</code></small>
+  </span>
+
+</h3>
+
+
+    <div class="doc doc-contents ">
+
+      <p>Type alias for a dictionary counting edge occurrences.</p>
+    </div>
+
+</div>
+
+
+
+
+
+  </div>
+
+    </div>
+
+</div>
+
 <div class="doc doc-object doc-class">
 
 
@@ -1312,8 +1518,7 @@ <h2 id="logos.edge_occurrence_tree.EdgeOccurrenceTree" class="doc doc-heading">
 
               <details class="quote">
                 <summary>Source code in <code>src/logos/edge_occurrence_tree.py</code></summary>
-                <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-8">  8</a></span>
-<span class="normal"><a href="#__codelineno-0-9">  9</a></span>
+                <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-9">  9</a></span>
 <span class="normal"><a href="#__codelineno-0-10"> 10</a></span>
 <span class="normal"><a href="#__codelineno-0-11"> 11</a></span>
 <span class="normal"><a href="#__codelineno-0-12"> 12</a></span>
@@ -1596,291 +1801,292 @@ <h2 id="logos.edge_occurrence_tree.EdgeOccurrenceTree" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-289">289</a></span>
 <span class="normal"><a href="#__codelineno-0-290">290</a></span>
 <span class="normal"><a href="#__codelineno-0-291">291</a></span>
-<span class="normal"><a href="#__codelineno-0-292">292</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-8"><a id="__codelineno-0-8" name="__codelineno-0-8"></a><span class="k">class</span> <span class="nc">EdgeOccurrenceTree</span><span class="p">:</span>
-</span><span id="__span-0-9"><a id="__codelineno-0-9" name="__codelineno-0-9"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-10"><a id="__codelineno-0-10" name="__codelineno-0-10"></a><span class="sd">    A tree of DAGs based on the ATE cluster they belong to.</span>
-</span><span id="__span-0-11"><a id="__codelineno-0-11" name="__codelineno-0-11"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-12"><a id="__codelineno-0-12" name="__codelineno-0-12"></a>
-</span><span id="__span-0-13"><a id="__codelineno-0-13" name="__codelineno-0-13"></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">cluster_id</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-14"><a id="__codelineno-0-14" name="__codelineno-0-14"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-15"><a id="__codelineno-0-15" name="__codelineno-0-15"></a><span class="sd">        Initialize a tree node with a specific cluster id.</span>
-</span><span id="__span-0-16"><a id="__codelineno-0-16" name="__codelineno-0-16"></a>
-</span><span id="__span-0-17"><a id="__codelineno-0-17" name="__codelineno-0-17"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-18"><a id="__codelineno-0-18" name="__codelineno-0-18"></a><span class="sd">            cluster_id: The cluster id of the DAGs that belong to this node.</span>
-</span><span id="__span-0-19"><a id="__codelineno-0-19" name="__codelineno-0-19"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-20"><a id="__codelineno-0-20" name="__codelineno-0-20"></a>
-</span><span id="__span-0-21"><a id="__codelineno-0-21" name="__codelineno-0-21"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span> <span class="o">=</span> <span class="n">cluster_id</span>
-</span><span id="__span-0-22"><a id="__codelineno-0-22" name="__codelineno-0-22"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">left</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-23"><a id="__codelineno-0-23" name="__codelineno-0-23"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">right</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-24"><a id="__codelineno-0-24" name="__codelineno-0-24"></a>
-</span><span id="__span-0-25"><a id="__codelineno-0-25" name="__codelineno-0-25"></a>    <span class="nd">@staticmethod</span>
-</span><span id="__span-0-26"><a id="__codelineno-0-26" name="__codelineno-0-26"></a>    <span class="k">def</span> <span class="nf">build_tree</span><span class="p">(</span><span class="n">linked</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">,</span> <span class="n">leaves</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">Self</span><span class="p">,</span> <span class="nb">int</span><span class="p">]:</span>
-</span><span id="__span-0-27"><a id="__codelineno-0-27" name="__codelineno-0-27"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-28"><a id="__codelineno-0-28" name="__codelineno-0-28"></a><span class="sd">        Build a tree from a linkage matrix.</span>
-</span><span id="__span-0-29"><a id="__codelineno-0-29" name="__codelineno-0-29"></a>
-</span><span id="__span-0-30"><a id="__codelineno-0-30" name="__codelineno-0-30"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-31"><a id="__codelineno-0-31" name="__codelineno-0-31"></a><span class="sd">            linked: The linkage matrix.</span>
-</span><span id="__span-0-32"><a id="__codelineno-0-32" name="__codelineno-0-32"></a><span class="sd">            leaves: The list of leaf nodes.</span>
-</span><span id="__span-0-33"><a id="__codelineno-0-33" name="__codelineno-0-33"></a>
-</span><span id="__span-0-34"><a id="__codelineno-0-34" name="__codelineno-0-34"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-35"><a id="__codelineno-0-35" name="__codelineno-0-35"></a><span class="sd">            A tuple containing the root of the tree, and the index of the next cluster to be merged.</span>
-</span><span id="__span-0-36"><a id="__codelineno-0-36" name="__codelineno-0-36"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-37"><a id="__codelineno-0-37" name="__codelineno-0-37"></a>
-</span><span id="__span-0-38"><a id="__codelineno-0-38" name="__codelineno-0-38"></a>        <span class="c1"># Base case: if there is only one cluster, return it as a leaf.</span>
-</span><span id="__span-0-39"><a id="__codelineno-0-39" name="__codelineno-0-39"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">leaves</span><span class="p">)</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="__span-0-40"><a id="__codelineno-0-40" name="__codelineno-0-40"></a>            <span class="k">return</span> <span class="n">EdgeOccurrenceTree</span><span class="p">(</span><span class="n">cluster_id</span><span class="o">=</span><span class="n">leaves</span><span class="p">[</span><span class="mi">0</span><span class="p">]),</span> <span class="o">-</span><span class="mi">1</span>
-</span><span id="__span-0-41"><a id="__codelineno-0-41" name="__codelineno-0-41"></a>
-</span><span id="__span-0-42"><a id="__codelineno-0-42" name="__codelineno-0-42"></a>        <span class="c1"># Otherwise, build the tree recursively.</span>
-</span><span id="__span-0-43"><a id="__codelineno-0-43" name="__codelineno-0-43"></a>        <span class="n">root</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="p">()</span>
-</span><span id="__span-0-44"><a id="__codelineno-0-44" name="__codelineno-0-44"></a>        <span class="n">curr</span> <span class="o">=</span> <span class="n">root</span>
-</span><span id="__span-0-45"><a id="__codelineno-0-45" name="__codelineno-0-45"></a>        <span class="n">i</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">linked</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span>
-</span><span id="__span-0-46"><a id="__codelineno-0-46" name="__codelineno-0-46"></a>        <span class="k">while</span> <span class="n">i</span> <span class="o">&gt;</span> <span class="o">-</span><span class="mi">1</span><span class="p">:</span>
-</span><span id="__span-0-47"><a id="__codelineno-0-47" name="__codelineno-0-47"></a>            <span class="c1"># Linked contains 4 elements: cluster1, cluster2, distance, num_observations</span>
-</span><span id="__span-0-48"><a id="__codelineno-0-48" name="__codelineno-0-48"></a>            <span class="c1"># They represent the clusters that were merged, the distance between them, and</span>
-</span><span id="__span-0-49"><a id="__codelineno-0-49" name="__codelineno-0-49"></a>            <span class="c1"># the number of observations in the new cluster.</span>
-</span><span id="__span-0-50"><a id="__codelineno-0-50" name="__codelineno-0-50"></a>            <span class="n">c1</span><span class="p">,</span> <span class="n">c2</span><span class="p">,</span> <span class="n">_</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">linked</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
-</span><span id="__span-0-51"><a id="__codelineno-0-51" name="__codelineno-0-51"></a>
-</span><span id="__span-0-52"><a id="__codelineno-0-52" name="__codelineno-0-52"></a>            <span class="k">if</span> <span class="n">c1</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">leaves</span> <span class="ow">and</span> <span class="n">c2</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">leaves</span><span class="p">:</span>
-</span><span id="__span-0-53"><a id="__codelineno-0-53" name="__codelineno-0-53"></a>                <span class="n">curr</span><span class="o">.</span><span class="n">left</span><span class="p">,</span> <span class="n">i</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="o">.</span><span class="n">build_tree</span><span class="p">(</span><span class="n">linked</span><span class="p">[:</span><span class="n">i</span><span class="p">],</span> <span class="n">leaves</span><span class="p">)</span>
-</span><span id="__span-0-54"><a id="__codelineno-0-54" name="__codelineno-0-54"></a>                <span class="n">curr</span><span class="o">.</span><span class="n">right</span><span class="p">,</span> <span class="n">i</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="o">.</span><span class="n">build_tree</span><span class="p">(</span><span class="n">linked</span><span class="p">[:</span><span class="n">i</span><span class="p">],</span> <span class="n">leaves</span><span class="p">)</span>
-</span><span id="__span-0-55"><a id="__codelineno-0-55" name="__codelineno-0-55"></a>                <span class="k">break</span>
-</span><span id="__span-0-56"><a id="__codelineno-0-56" name="__codelineno-0-56"></a>            <span class="k">if</span> <span class="n">c1</span> <span class="ow">in</span> <span class="n">leaves</span><span class="p">:</span>
-</span><span id="__span-0-57"><a id="__codelineno-0-57" name="__codelineno-0-57"></a>                <span class="n">curr</span><span class="o">.</span><span class="n">left</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="p">(</span><span class="n">leaves</span><span class="o">.</span><span class="n">index</span><span class="p">(</span><span class="n">c1</span><span class="p">))</span>
-</span><span id="__span-0-58"><a id="__codelineno-0-58" name="__codelineno-0-58"></a>                <span class="n">curr</span><span class="o">.</span><span class="n">right</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="p">()</span>
-</span><span id="__span-0-59"><a id="__codelineno-0-59" name="__codelineno-0-59"></a>                <span class="n">curr</span> <span class="o">=</span> <span class="n">curr</span><span class="o">.</span><span class="n">right</span>
-</span><span id="__span-0-60"><a id="__codelineno-0-60" name="__codelineno-0-60"></a>            <span class="k">if</span> <span class="n">c2</span> <span class="ow">in</span> <span class="n">leaves</span><span class="p">:</span>
-</span><span id="__span-0-61"><a id="__codelineno-0-61" name="__codelineno-0-61"></a>                <span class="n">curr</span><span class="o">.</span><span class="n">right</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="p">(</span><span class="n">leaves</span><span class="o">.</span><span class="n">index</span><span class="p">(</span><span class="n">c2</span><span class="p">))</span>
-</span><span id="__span-0-62"><a id="__codelineno-0-62" name="__codelineno-0-62"></a>                <span class="k">break</span>
-</span><span id="__span-0-63"><a id="__codelineno-0-63" name="__codelineno-0-63"></a>            <span class="n">i</span> <span class="o">-=</span> <span class="mi">1</span>
-</span><span id="__span-0-64"><a id="__codelineno-0-64" name="__codelineno-0-64"></a>        <span class="n">root</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="o">.</span><span class="n">_cleanup_tree</span><span class="p">(</span><span class="n">root</span><span class="p">)</span>
-</span><span id="__span-0-65"><a id="__codelineno-0-65" name="__codelineno-0-65"></a>        <span class="k">return</span> <span class="n">root</span><span class="p">,</span> <span class="n">i</span>
-</span><span id="__span-0-66"><a id="__codelineno-0-66" name="__codelineno-0-66"></a>
-</span><span id="__span-0-67"><a id="__codelineno-0-67" name="__codelineno-0-67"></a>    <span class="nd">@staticmethod</span>
-</span><span id="__span-0-68"><a id="__codelineno-0-68" name="__codelineno-0-68"></a>    <span class="k">def</span> <span class="nf">_cleanup_tree</span><span class="p">(</span><span class="n">root</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">Self</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Self</span><span class="p">:</span>
-</span><span id="__span-0-69"><a id="__codelineno-0-69" name="__codelineno-0-69"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-70"><a id="__codelineno-0-70" name="__codelineno-0-70"></a><span class="sd">        Clean up the tree by removing nodes that have only one child, and nodes that have no</span>
-</span><span id="__span-0-71"><a id="__codelineno-0-71" name="__codelineno-0-71"></a><span class="sd">        children and are not leaves.</span>
-</span><span id="__span-0-72"><a id="__codelineno-0-72" name="__codelineno-0-72"></a>
-</span><span id="__span-0-73"><a id="__codelineno-0-73" name="__codelineno-0-73"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-74"><a id="__codelineno-0-74" name="__codelineno-0-74"></a><span class="sd">            root: The root of the tree.</span>
-</span><span id="__span-0-75"><a id="__codelineno-0-75" name="__codelineno-0-75"></a>
-</span><span id="__span-0-76"><a id="__codelineno-0-76" name="__codelineno-0-76"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-77"><a id="__codelineno-0-77" name="__codelineno-0-77"></a><span class="sd">            The root of the cleaned up tree.</span>
-</span><span id="__span-0-78"><a id="__codelineno-0-78" name="__codelineno-0-78"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-79"><a id="__codelineno-0-79" name="__codelineno-0-79"></a>
-</span><span id="__span-0-80"><a id="__codelineno-0-80" name="__codelineno-0-80"></a>        <span class="k">if</span> <span class="n">root</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-81"><a id="__codelineno-0-81" name="__codelineno-0-81"></a>            <span class="k">return</span> <span class="kc">None</span>
-</span><span id="__span-0-82"><a id="__codelineno-0-82" name="__codelineno-0-82"></a>
-</span><span id="__span-0-83"><a id="__codelineno-0-83" name="__codelineno-0-83"></a>        <span class="c1"># Recursively clean up left and right subtrees</span>
-</span><span id="__span-0-84"><a id="__codelineno-0-84" name="__codelineno-0-84"></a>        <span class="n">root</span><span class="o">.</span><span class="n">left</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="o">.</span><span class="n">_cleanup_tree</span><span class="p">(</span><span class="n">root</span><span class="o">.</span><span class="n">left</span><span class="p">)</span>
-</span><span id="__span-0-85"><a id="__codelineno-0-85" name="__codelineno-0-85"></a>        <span class="n">root</span><span class="o">.</span><span class="n">right</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="o">.</span><span class="n">_cleanup_tree</span><span class="p">(</span><span class="n">root</span><span class="o">.</span><span class="n">right</span><span class="p">)</span>
-</span><span id="__span-0-86"><a id="__codelineno-0-86" name="__codelineno-0-86"></a>
-</span><span id="__span-0-87"><a id="__codelineno-0-87" name="__codelineno-0-87"></a>        <span class="c1"># If the current node has only one child, replace the node with its child</span>
-</span><span id="__span-0-88"><a id="__codelineno-0-88" name="__codelineno-0-88"></a>        <span class="k">if</span> <span class="n">root</span><span class="o">.</span><span class="n">left</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">root</span><span class="o">.</span><span class="n">right</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-89"><a id="__codelineno-0-89" name="__codelineno-0-89"></a>            <span class="k">return</span> <span class="n">root</span><span class="o">.</span><span class="n">right</span>
-</span><span id="__span-0-90"><a id="__codelineno-0-90" name="__codelineno-0-90"></a>        <span class="k">elif</span> <span class="n">root</span><span class="o">.</span><span class="n">left</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">root</span><span class="o">.</span><span class="n">right</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-91"><a id="__codelineno-0-91" name="__codelineno-0-91"></a>            <span class="k">return</span> <span class="n">root</span><span class="o">.</span><span class="n">left</span>
-</span><span id="__span-0-92"><a id="__codelineno-0-92" name="__codelineno-0-92"></a>
-</span><span id="__span-0-93"><a id="__codelineno-0-93" name="__codelineno-0-93"></a>        <span class="c1"># If the current node has no left and right child and is not a leaf, remove the node</span>
-</span><span id="__span-0-94"><a id="__codelineno-0-94" name="__codelineno-0-94"></a>        <span class="k">if</span> <span class="n">root</span><span class="o">.</span><span class="n">left</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">root</span><span class="o">.</span><span class="n">right</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">root</span><span class="o">.</span><span class="n">cluster_id</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-95"><a id="__codelineno-0-95" name="__codelineno-0-95"></a>            <span class="k">return</span> <span class="kc">None</span>
-</span><span id="__span-0-96"><a id="__codelineno-0-96" name="__codelineno-0-96"></a>
-</span><span id="__span-0-97"><a id="__codelineno-0-97" name="__codelineno-0-97"></a>        <span class="k">return</span> <span class="n">root</span>
-</span><span id="__span-0-98"><a id="__codelineno-0-98" name="__codelineno-0-98"></a>
-</span><span id="__span-0-99"><a id="__codelineno-0-99" name="__codelineno-0-99"></a>    <span class="k">def</span> <span class="nf">print_tree</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">depth</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">0</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-100"><a id="__codelineno-0-100" name="__codelineno-0-100"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-101"><a id="__codelineno-0-101" name="__codelineno-0-101"></a><span class="sd">        Print the tree in a readable format.</span>
-</span><span id="__span-0-102"><a id="__codelineno-0-102" name="__codelineno-0-102"></a>
-</span><span id="__span-0-103"><a id="__codelineno-0-103" name="__codelineno-0-103"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-104"><a id="__codelineno-0-104" name="__codelineno-0-104"></a><span class="sd">            depth: The depth of the current node in the tree.</span>
-</span><span id="__span-0-105"><a id="__codelineno-0-105" name="__codelineno-0-105"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-106"><a id="__codelineno-0-106" name="__codelineno-0-106"></a>
-</span><span id="__span-0-107"><a id="__codelineno-0-107" name="__codelineno-0-107"></a>        <span class="n">prefix</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-108"><a id="__codelineno-0-108" name="__codelineno-0-108"></a>        <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">depth</span><span class="p">):</span>
-</span><span id="__span-0-109"><a id="__codelineno-0-109" name="__codelineno-0-109"></a>            <span class="n">prefix</span> <span class="o">+=</span> <span class="s2">&quot;-&quot;</span>
-</span><span id="__span-0-110"><a id="__codelineno-0-110" name="__codelineno-0-110"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-111"><a id="__codelineno-0-111" name="__codelineno-0-111"></a>            <span class="nb">print</span><span class="p">(</span><span class="n">prefix</span> <span class="o">+</span> <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span><span class="p">))</span>
-</span><span id="__span-0-112"><a id="__codelineno-0-112" name="__codelineno-0-112"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-113"><a id="__codelineno-0-113" name="__codelineno-0-113"></a>            <span class="nb">print</span><span class="p">(</span><span class="n">prefix</span> <span class="o">+</span> <span class="s2">&quot;node&quot;</span><span class="p">)</span>
-</span><span id="__span-0-114"><a id="__codelineno-0-114" name="__codelineno-0-114"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="p">:</span>
-</span><span id="__span-0-115"><a id="__codelineno-0-115" name="__codelineno-0-115"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">print_tree</span><span class="p">(</span><span class="n">depth</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
-</span><span id="__span-0-116"><a id="__codelineno-0-116" name="__codelineno-0-116"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
-</span><span id="__span-0-117"><a id="__codelineno-0-117" name="__codelineno-0-117"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">print_tree</span><span class="p">(</span><span class="n">depth</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
-</span><span id="__span-0-118"><a id="__codelineno-0-118" name="__codelineno-0-118"></a>
-</span><span id="__span-0-119"><a id="__codelineno-0-119" name="__codelineno-0-119"></a>    <span class="k">def</span> <span class="nf">assign_dags_to_nodes</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">cluster_mapping</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="n">nx</span><span class="o">.</span><span class="n">DiGraph</span><span class="p">,</span> <span class="nb">int</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-120"><a id="__codelineno-0-120" name="__codelineno-0-120"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-121"><a id="__codelineno-0-121" name="__codelineno-0-121"></a><span class="sd">        Assign each DAG to the node it belongs to, based on `cluster_mapping`.</span>
-</span><span id="__span-0-122"><a id="__codelineno-0-122" name="__codelineno-0-122"></a>
-</span><span id="__span-0-123"><a id="__codelineno-0-123" name="__codelineno-0-123"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-124"><a id="__codelineno-0-124" name="__codelineno-0-124"></a><span class="sd">            cluster_mapping: A dictionary mapping DAGs to cluster id&#39;s.</span>
-</span><span id="__span-0-125"><a id="__codelineno-0-125" name="__codelineno-0-125"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-126"><a id="__codelineno-0-126" name="__codelineno-0-126"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="__span-0-127"><a id="__codelineno-0-127" name="__codelineno-0-127"></a>
-</span><span id="__span-0-128"><a id="__codelineno-0-128" name="__codelineno-0-128"></a>        <span class="c1"># If leaf, assign DAGs and set count.</span>
-</span><span id="__span-0-129"><a id="__codelineno-0-129" name="__codelineno-0-129"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-130"><a id="__codelineno-0-130" name="__codelineno-0-130"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">dags</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="__span-0-131"><a id="__codelineno-0-131" name="__codelineno-0-131"></a>                <span class="n">key</span>
-</span><span id="__span-0-132"><a id="__codelineno-0-132" name="__codelineno-0-132"></a>                <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="n">cluster_mapping</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span>
-</span><span id="__span-0-133"><a id="__codelineno-0-133" name="__codelineno-0-133"></a>                <span class="k">if</span> <span class="n">cluster_mapping</span><span class="p">[</span><span class="n">key</span><span class="p">]</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span>
-</span><span id="__span-0-134"><a id="__codelineno-0-134" name="__codelineno-0-134"></a>            <span class="p">]</span>
-</span><span id="__span-0-135"><a id="__codelineno-0-135" name="__codelineno-0-135"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dags</span><span class="p">)</span>
-</span><span id="__span-0-136"><a id="__codelineno-0-136" name="__codelineno-0-136"></a>
-</span><span id="__span-0-137"><a id="__codelineno-0-137" name="__codelineno-0-137"></a>        <span class="c1"># Otherwise, recurse for children and retireve counts.</span>
-</span><span id="__span-0-138"><a id="__codelineno-0-138" name="__codelineno-0-138"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="p">:</span>
-</span><span id="__span-0-139"><a id="__codelineno-0-139" name="__codelineno-0-139"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">assign_dags_to_nodes</span><span class="p">(</span><span class="n">cluster_mapping</span><span class="p">)</span>
-</span><span id="__span-0-140"><a id="__codelineno-0-140" name="__codelineno-0-140"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">num_dags</span>
-</span><span id="__span-0-141"><a id="__codelineno-0-141" name="__codelineno-0-141"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
-</span><span id="__span-0-142"><a id="__codelineno-0-142" name="__codelineno-0-142"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">assign_dags_to_nodes</span><span class="p">(</span><span class="n">cluster_mapping</span><span class="p">)</span>
-</span><span id="__span-0-143"><a id="__codelineno-0-143" name="__codelineno-0-143"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">num_dags</span>
-</span><span id="__span-0-144"><a id="__codelineno-0-144" name="__codelineno-0-144"></a>
-</span><span id="__span-0-145"><a id="__codelineno-0-145" name="__codelineno-0-145"></a>    <span class="k">def</span> <span class="nf">count_edge_occurrences</span><span class="p">(</span>
-</span><span id="__span-0-146"><a id="__codelineno-0-146" name="__codelineno-0-146"></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">treatment</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">outcome</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">dag</span><span class="p">:</span> <span class="n">nx</span><span class="o">.</span><span class="n">DiGraph</span>
-</span><span id="__span-0-147"><a id="__codelineno-0-147" name="__codelineno-0-147"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-148"><a id="__codelineno-0-148" name="__codelineno-0-148"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-149"><a id="__codelineno-0-149" name="__codelineno-0-149"></a><span class="sd">        Recursively count the number of times each edge occurs amongst the DAGs</span>
-</span><span id="__span-0-150"><a id="__codelineno-0-150" name="__codelineno-0-150"></a><span class="sd">        assigned to all the children of this node, omitting the edge from treatment -&gt; outcome,</span>
-</span><span id="__span-0-151"><a id="__codelineno-0-151" name="__codelineno-0-151"></a><span class="sd">        since this always exists. If a DAG is passed in, ignore the edges in that DAG as well.</span>
-</span><span id="__span-0-152"><a id="__codelineno-0-152" name="__codelineno-0-152"></a>
-</span><span id="__span-0-153"><a id="__codelineno-0-153" name="__codelineno-0-153"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-154"><a id="__codelineno-0-154" name="__codelineno-0-154"></a><span class="sd">            treatment: The treatment variable.</span>
-</span><span id="__span-0-155"><a id="__codelineno-0-155" name="__codelineno-0-155"></a><span class="sd">            outcome: The outcome variable.</span>
-</span><span id="__span-0-156"><a id="__codelineno-0-156" name="__codelineno-0-156"></a><span class="sd">            dag: The optional dag structure to ignore.</span>
-</span><span id="__span-0-157"><a id="__codelineno-0-157" name="__codelineno-0-157"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-158"><a id="__codelineno-0-158" name="__codelineno-0-158"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">:</span> <span class="n">Types</span><span class="o">.</span><span class="n">EdgeCountDict</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">int</span><span class="p">)</span>
-</span><span id="__span-0-159"><a id="__codelineno-0-159" name="__codelineno-0-159"></a>
-</span><span id="__span-0-160"><a id="__codelineno-0-160" name="__codelineno-0-160"></a>        <span class="c1"># If leaf, actually compute count.</span>
-</span><span id="__span-0-161"><a id="__codelineno-0-161" name="__codelineno-0-161"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-162"><a id="__codelineno-0-162" name="__codelineno-0-162"></a>            <span class="n">edges_to_ignore</span> <span class="o">=</span> <span class="p">[(</span><span class="n">treatment</span><span class="p">,</span> <span class="n">outcome</span><span class="p">)]</span>
-</span><span id="__span-0-163"><a id="__codelineno-0-163" name="__codelineno-0-163"></a>            <span class="k">if</span> <span class="n">dag</span><span class="p">:</span>
-</span><span id="__span-0-164"><a id="__codelineno-0-164" name="__codelineno-0-164"></a>                <span class="n">edges_to_ignore</span><span class="o">.</span><span class="n">extend</span><span class="p">(</span><span class="n">dag</span><span class="o">.</span><span class="n">edges</span><span class="p">)</span>
-</span><span id="__span-0-165"><a id="__codelineno-0-165" name="__codelineno-0-165"></a>            <span class="k">for</span> <span class="n">graph</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dags</span><span class="p">:</span>
-</span><span id="__span-0-166"><a id="__codelineno-0-166" name="__codelineno-0-166"></a>                <span class="k">for</span> <span class="n">edge</span> <span class="ow">in</span> <span class="n">graph</span><span class="o">.</span><span class="n">edges</span><span class="p">:</span>
-</span><span id="__span-0-167"><a id="__codelineno-0-167" name="__codelineno-0-167"></a>                    <span class="k">if</span> <span class="n">edge</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">edges_to_ignore</span><span class="p">:</span>
-</span><span id="__span-0-168"><a id="__codelineno-0-168" name="__codelineno-0-168"></a>                        <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="__span-0-169"><a id="__codelineno-0-169" name="__codelineno-0-169"></a>
-</span><span id="__span-0-170"><a id="__codelineno-0-170" name="__codelineno-0-170"></a>        <span class="c1"># Otherwise, derive counts from children.</span>
-</span><span id="__span-0-171"><a id="__codelineno-0-171" name="__codelineno-0-171"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="p">:</span>
-</span><span id="__span-0-172"><a id="__codelineno-0-172" name="__codelineno-0-172"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">count_edge_occurrences</span><span class="p">(</span><span class="n">treatment</span><span class="p">,</span> <span class="n">outcome</span><span class="p">,</span> <span class="n">dag</span><span class="p">)</span>
-</span><span id="__span-0-173"><a id="__codelineno-0-173" name="__codelineno-0-173"></a>            <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">edge_counts</span><span class="o">.</span><span class="n">keys</span><span class="p">():</span>
-</span><span id="__span-0-174"><a id="__codelineno-0-174" name="__codelineno-0-174"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">[</span><span class="n">key</span><span class="p">]</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">[</span><span class="n">key</span><span class="p">]</span>
-</span><span id="__span-0-175"><a id="__codelineno-0-175" name="__codelineno-0-175"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
-</span><span id="__span-0-176"><a id="__codelineno-0-176" name="__codelineno-0-176"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">count_edge_occurrences</span><span class="p">(</span><span class="n">treatment</span><span class="p">,</span> <span class="n">outcome</span><span class="p">,</span> <span class="n">dag</span><span class="p">)</span>
-</span><span id="__span-0-177"><a id="__codelineno-0-177" name="__codelineno-0-177"></a>            <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">edge_counts</span><span class="o">.</span><span class="n">keys</span><span class="p">():</span>
-</span><span id="__span-0-178"><a id="__codelineno-0-178" name="__codelineno-0-178"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">[</span><span class="n">key</span><span class="p">]</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">[</span><span class="n">key</span><span class="p">]</span>
-</span><span id="__span-0-179"><a id="__codelineno-0-179" name="__codelineno-0-179"></a>
-</span><span id="__span-0-180"><a id="__codelineno-0-180" name="__codelineno-0-180"></a>        <span class="c1"># Compute statistics.</span>
-</span><span id="__span-0-181"><a id="__codelineno-0-181" name="__codelineno-0-181"></a>        <span class="n">freq_counts</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="o">.</span><span class="n">values</span><span class="p">())</span>
-</span><span id="__span-0-182"><a id="__codelineno-0-182" name="__codelineno-0-182"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">freq_counts</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-183"><a id="__codelineno-0-183" name="__codelineno-0-183"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">mean</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-184"><a id="__codelineno-0-184" name="__codelineno-0-184"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">std_dev</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-185"><a id="__codelineno-0-185" name="__codelineno-0-185"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-186"><a id="__codelineno-0-186" name="__codelineno-0-186"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">mean</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">freq_counts</span><span class="p">)</span>
-</span><span id="__span-0-187"><a id="__codelineno-0-187" name="__codelineno-0-187"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">std_dev</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">freq_counts</span><span class="p">)</span>
-</span><span id="__span-0-188"><a id="__codelineno-0-188" name="__codelineno-0-188"></a>
-</span><span id="__span-0-189"><a id="__codelineno-0-189" name="__codelineno-0-189"></a>    <span class="k">def</span> <span class="nf">calculate_edge_expectancy</span><span class="p">(</span>
-</span><span id="__span-0-190"><a id="__codelineno-0-190" name="__codelineno-0-190"></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">totals</span><span class="p">:</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="n">Types</span><span class="o">.</span><span class="n">EdgeCountDict</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-191"><a id="__codelineno-0-191" name="__codelineno-0-191"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-192"><a id="__codelineno-0-192" name="__codelineno-0-192"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-193"><a id="__codelineno-0-193" name="__codelineno-0-193"></a><span class="sd">        For each edge at each node, calculate what percent over or under</span>
-</span><span id="__span-0-194"><a id="__codelineno-0-194" name="__codelineno-0-194"></a><span class="sd">        expectancy the edge is at in relationship to its parent.</span>
-</span><span id="__span-0-195"><a id="__codelineno-0-195" name="__codelineno-0-195"></a>
-</span><span id="__span-0-196"><a id="__codelineno-0-196" name="__codelineno-0-196"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-197"><a id="__codelineno-0-197" name="__codelineno-0-197"></a><span class="sd">            totals: A tuple containing the total number of DAGs and the mapping from</span>
-</span><span id="__span-0-198"><a id="__codelineno-0-198" name="__codelineno-0-198"></a><span class="sd">                edges to their counts for the parent of this node.</span>
-</span><span id="__span-0-199"><a id="__codelineno-0-199" name="__codelineno-0-199"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-200"><a id="__codelineno-0-200" name="__codelineno-0-200"></a>        <span class="c1"># At root node, calculate expectancy</span>
-</span><span id="__span-0-201"><a id="__codelineno-0-201" name="__codelineno-0-201"></a>        <span class="k">if</span> <span class="n">totals</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-202"><a id="__codelineno-0-202" name="__codelineno-0-202"></a>            <span class="n">totals</span> <span class="o">=</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">)</span>
-</span><span id="__span-0-203"><a id="__codelineno-0-203" name="__codelineno-0-203"></a>
-</span><span id="__span-0-204"><a id="__codelineno-0-204" name="__codelineno-0-204"></a>        <span class="c1"># Otherwise, calculate expectancy based on parent.</span>
-</span><span id="__span-0-205"><a id="__codelineno-0-205" name="__codelineno-0-205"></a>        <span class="n">total_dags</span><span class="p">,</span> <span class="n">total_edges</span> <span class="o">=</span> <span class="n">totals</span>
-</span><span id="__span-0-206"><a id="__codelineno-0-206" name="__codelineno-0-206"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">percent_expectancy</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">float</span><span class="p">)</span>
-</span><span id="__span-0-207"><a id="__codelineno-0-207" name="__codelineno-0-207"></a>
-</span><span id="__span-0-208"><a id="__codelineno-0-208" name="__codelineno-0-208"></a>        <span class="k">for</span> <span class="n">edge</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="o">.</span><span class="n">keys</span><span class="p">():</span>
-</span><span id="__span-0-209"><a id="__codelineno-0-209" name="__codelineno-0-209"></a>            <span class="n">expected</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span> <span class="o">/</span> <span class="n">total_dags</span> <span class="o">*</span> <span class="n">total_edges</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span>
-</span><span id="__span-0-210"><a id="__codelineno-0-210" name="__codelineno-0-210"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-211"><a id="__codelineno-0-211" name="__codelineno-0-211"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span> <span class="o">-</span> <span class="n">expected</span>
-</span><span id="__span-0-212"><a id="__codelineno-0-212" name="__codelineno-0-212"></a>            <span class="p">)</span> <span class="o">/</span> <span class="n">expected</span>
-</span><span id="__span-0-213"><a id="__codelineno-0-213" name="__codelineno-0-213"></a>
-</span><span id="__span-0-214"><a id="__codelineno-0-214" name="__codelineno-0-214"></a>        <span class="c1"># Recurse for children.</span>
-</span><span id="__span-0-215"><a id="__codelineno-0-215" name="__codelineno-0-215"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="p">:</span>
-</span><span id="__span-0-216"><a id="__codelineno-0-216" name="__codelineno-0-216"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">calculate_edge_expectancy</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">))</span>
-</span><span id="__span-0-217"><a id="__codelineno-0-217" name="__codelineno-0-217"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
-</span><span id="__span-0-218"><a id="__codelineno-0-218" name="__codelineno-0-218"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">calculate_edge_expectancy</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">))</span>
-</span><span id="__span-0-219"><a id="__codelineno-0-219" name="__codelineno-0-219"></a>
-</span><span id="__span-0-220"><a id="__codelineno-0-220" name="__codelineno-0-220"></a>    <span class="k">def</span> <span class="nf">find_outliers_in_tree</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">threshold</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">0</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-221"><a id="__codelineno-0-221" name="__codelineno-0-221"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-222"><a id="__codelineno-0-222" name="__codelineno-0-222"></a><span class="sd">        Find outlier edges, based on the percent expectancy of each edge. Define an outlier as an</span>
-</span><span id="__span-0-223"><a id="__codelineno-0-223" name="__codelineno-0-223"></a><span class="sd">        edge that is below expectancy on one side of the tree, and above on the other side, and</span>
-</span><span id="__span-0-224"><a id="__codelineno-0-224" name="__codelineno-0-224"></a><span class="sd">        optionally, over some threshold on both sides.</span>
-</span><span id="__span-0-225"><a id="__codelineno-0-225" name="__codelineno-0-225"></a>
-</span><span id="__span-0-226"><a id="__codelineno-0-226" name="__codelineno-0-226"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-227"><a id="__codelineno-0-227" name="__codelineno-0-227"></a><span class="sd">            threshold: The threshold for an edge to be considered an outlier.</span>
-</span><span id="__span-0-228"><a id="__codelineno-0-228" name="__codelineno-0-228"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-229"><a id="__codelineno-0-229" name="__codelineno-0-229"></a>
-</span><span id="__span-0-230"><a id="__codelineno-0-230" name="__codelineno-0-230"></a>        <span class="c1"># If able to compare, find outliers.</span>
-</span><span id="__span-0-231"><a id="__codelineno-0-231" name="__codelineno-0-231"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span> <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
-</span><span id="__span-0-232"><a id="__codelineno-0-232" name="__codelineno-0-232"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">outliers</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-233"><a id="__codelineno-0-233" name="__codelineno-0-233"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">outliers</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-234"><a id="__codelineno-0-234" name="__codelineno-0-234"></a>            <span class="n">edges</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">edge_counts</span><span class="o">.</span><span class="n">keys</span><span class="p">())</span><span class="o">.</span><span class="n">union</span><span class="p">(</span>
-</span><span id="__span-0-235"><a id="__codelineno-0-235" name="__codelineno-0-235"></a>                <span class="nb">set</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">edge_counts</span><span class="o">.</span><span class="n">keys</span><span class="p">())</span>
-</span><span id="__span-0-236"><a id="__codelineno-0-236" name="__codelineno-0-236"></a>            <span class="p">)</span>
-</span><span id="__span-0-237"><a id="__codelineno-0-237" name="__codelineno-0-237"></a>            <span class="k">for</span> <span class="n">edge</span> <span class="ow">in</span> <span class="n">edges</span><span class="p">:</span>
-</span><span id="__span-0-238"><a id="__codelineno-0-238" name="__codelineno-0-238"></a>                <span class="k">if</span> <span class="p">(</span>
-</span><span id="__span-0-239"><a id="__codelineno-0-239" name="__codelineno-0-239"></a>                    <span class="n">np</span><span class="o">.</span><span class="n">sign</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">])</span>
-</span><span id="__span-0-240"><a id="__codelineno-0-240" name="__codelineno-0-240"></a>                    <span class="o">!=</span> <span class="n">np</span><span class="o">.</span><span class="n">sign</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">])</span>
-</span><span id="__span-0-241"><a id="__codelineno-0-241" name="__codelineno-0-241"></a>                    <span class="ow">and</span> <span class="nb">abs</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">])</span> <span class="o">&gt;</span> <span class="n">threshold</span>
-</span><span id="__span-0-242"><a id="__codelineno-0-242" name="__codelineno-0-242"></a>                    <span class="ow">and</span> <span class="nb">abs</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">])</span> <span class="o">&gt;</span> <span class="n">threshold</span>
-</span><span id="__span-0-243"><a id="__codelineno-0-243" name="__codelineno-0-243"></a>                <span class="p">):</span>
-</span><span id="__span-0-244"><a id="__codelineno-0-244" name="__codelineno-0-244"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">outliers</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span>
-</span><span id="__span-0-245"><a id="__codelineno-0-245" name="__codelineno-0-245"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">outliers</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span>
-</span><span id="__span-0-246"><a id="__codelineno-0-246" name="__codelineno-0-246"></a>
-</span><span id="__span-0-247"><a id="__codelineno-0-247" name="__codelineno-0-247"></a>        <span class="c1"># Recurse for children.</span>
-</span><span id="__span-0-248"><a id="__codelineno-0-248" name="__codelineno-0-248"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="p">:</span>
-</span><span id="__span-0-249"><a id="__codelineno-0-249" name="__codelineno-0-249"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">find_outliers_in_tree</span><span class="p">(</span><span class="n">threshold</span><span class="p">)</span>
-</span><span id="__span-0-250"><a id="__codelineno-0-250" name="__codelineno-0-250"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
-</span><span id="__span-0-251"><a id="__codelineno-0-251" name="__codelineno-0-251"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">find_outliers_in_tree</span><span class="p">(</span><span class="n">threshold</span><span class="p">)</span>
-</span><span id="__span-0-252"><a id="__codelineno-0-252" name="__codelineno-0-252"></a>
-</span><span id="__span-0-253"><a id="__codelineno-0-253" name="__codelineno-0-253"></a>    <span class="k">def</span> <span class="nf">find_outliers_per_cluster</span><span class="p">(</span>
-</span><span id="__span-0-254"><a id="__codelineno-0-254" name="__codelineno-0-254"></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-255"><a id="__codelineno-0-255" name="__codelineno-0-255"></a>        <span class="n">dag</span><span class="p">:</span> <span class="n">nx</span><span class="o">.</span><span class="n">DiGraph</span><span class="p">,</span>
-</span><span id="__span-0-256"><a id="__codelineno-0-256" name="__codelineno-0-256"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">Types</span><span class="o">.</span><span class="n">EdgeCountDict</span><span class="p">,</span> <span class="nb">dict</span><span class="p">[</span><span class="n">Types</span><span class="o">.</span><span class="n">Edge</span><span class="p">,</span> <span class="nb">float</span><span class="p">]]:</span>
-</span><span id="__span-0-257"><a id="__codelineno-0-257" name="__codelineno-0-257"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a><span class="sd">        Collect the edge counts and outliers found earlier into appropriate dictionaries</span>
-</span><span id="__span-0-259"><a id="__codelineno-0-259" name="__codelineno-0-259"></a><span class="sd">        per cluster.</span>
-</span><span id="__span-0-260"><a id="__codelineno-0-260" name="__codelineno-0-260"></a>
-</span><span id="__span-0-261"><a id="__codelineno-0-261" name="__codelineno-0-261"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-262"><a id="__codelineno-0-262" name="__codelineno-0-262"></a><span class="sd">            dag: The DAG to ignore when collecting outliers.</span>
-</span><span id="__span-0-263"><a id="__codelineno-0-263" name="__codelineno-0-263"></a>
-</span><span id="__span-0-264"><a id="__codelineno-0-264" name="__codelineno-0-264"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-265"><a id="__codelineno-0-265" name="__codelineno-0-265"></a><span class="sd">            A tuple containing the following: a dictionary mapping cluster id&#39;s to edge counts,</span>
-</span><span id="__span-0-266"><a id="__codelineno-0-266" name="__codelineno-0-266"></a><span class="sd">            and a dictionary mapping cluster id&#39;s to outlier edges.</span>
-</span><span id="__span-0-267"><a id="__codelineno-0-267" name="__codelineno-0-267"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-268"><a id="__codelineno-0-268" name="__codelineno-0-268"></a>
-</span><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a>        <span class="n">cluster_edge_count</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a>        <span class="n">cluster_outliers</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a>
-</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a>        <span class="c1"># If leaf, add to cluster counts.</span>
-</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a>            <span class="n">cluster_edge_count</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span>
-</span><span id="__span-0-275"><a id="__codelineno-0-275" name="__codelineno-0-275"></a>            <span class="n">edges_to_ignore</span> <span class="o">=</span> <span class="n">dag</span><span class="o">.</span><span class="n">edges</span> <span class="k">if</span> <span class="n">dag</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="k">else</span> <span class="p">[]</span>
-</span><span id="__span-0-276"><a id="__codelineno-0-276" name="__codelineno-0-276"></a>            <span class="n">cluster_outliers</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span><span class="p">]</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="__span-0-277"><a id="__codelineno-0-277" name="__codelineno-0-277"></a>                <span class="n">edge</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">outliers</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span>
-</span><span id="__span-0-278"><a id="__codelineno-0-278" name="__codelineno-0-278"></a>                <span class="k">for</span> <span class="n">edge</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">outliers</span>
-</span><span id="__span-0-279"><a id="__codelineno-0-279" name="__codelineno-0-279"></a>                <span class="k">if</span> <span class="n">edge</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">edges_to_ignore</span>
-</span><span id="__span-0-280"><a id="__codelineno-0-280" name="__codelineno-0-280"></a>            <span class="p">}</span>
-</span><span id="__span-0-281"><a id="__codelineno-0-281" name="__codelineno-0-281"></a>
-</span><span id="__span-0-282"><a id="__codelineno-0-282" name="__codelineno-0-282"></a>        <span class="c1"># Otherwise, recurse for children.</span>
-</span><span id="__span-0-283"><a id="__codelineno-0-283" name="__codelineno-0-283"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="p">:</span>
-</span><span id="__span-0-284"><a id="__codelineno-0-284" name="__codelineno-0-284"></a>            <span class="n">lec</span><span class="p">,</span> <span class="n">lo</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">find_outliers_per_cluster</span><span class="p">(</span><span class="n">dag</span><span class="p">)</span>
-</span><span id="__span-0-285"><a id="__codelineno-0-285" name="__codelineno-0-285"></a>            <span class="n">cluster_edge_count</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">lec</span><span class="p">)</span>
-</span><span id="__span-0-286"><a id="__codelineno-0-286" name="__codelineno-0-286"></a>            <span class="n">cluster_outliers</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">lo</span><span class="p">)</span>
-</span><span id="__span-0-287"><a id="__codelineno-0-287" name="__codelineno-0-287"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
-</span><span id="__span-0-288"><a id="__codelineno-0-288" name="__codelineno-0-288"></a>            <span class="n">rec</span><span class="p">,</span> <span class="n">ro</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">find_outliers_per_cluster</span><span class="p">(</span><span class="n">dag</span><span class="p">)</span>
-</span><span id="__span-0-289"><a id="__codelineno-0-289" name="__codelineno-0-289"></a>            <span class="n">cluster_edge_count</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">rec</span><span class="p">)</span>
-</span><span id="__span-0-290"><a id="__codelineno-0-290" name="__codelineno-0-290"></a>            <span class="n">cluster_outliers</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">ro</span><span class="p">)</span>
-</span><span id="__span-0-291"><a id="__codelineno-0-291" name="__codelineno-0-291"></a>
-</span><span id="__span-0-292"><a id="__codelineno-0-292" name="__codelineno-0-292"></a>        <span class="k">return</span> <span class="n">cluster_edge_count</span><span class="p">,</span> <span class="n">cluster_outliers</span>
+<span class="normal"><a href="#__codelineno-0-292">292</a></span>
+<span class="normal"><a href="#__codelineno-0-293">293</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-9"><a id="__codelineno-0-9" name="__codelineno-0-9"></a><span class="k">class</span> <span class="nc">EdgeOccurrenceTree</span><span class="p">:</span>
+</span><span id="__span-0-10"><a id="__codelineno-0-10" name="__codelineno-0-10"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-11"><a id="__codelineno-0-11" name="__codelineno-0-11"></a><span class="sd">    A tree of DAGs based on the ATE cluster they belong to.</span>
+</span><span id="__span-0-12"><a id="__codelineno-0-12" name="__codelineno-0-12"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-13"><a id="__codelineno-0-13" name="__codelineno-0-13"></a>
+</span><span id="__span-0-14"><a id="__codelineno-0-14" name="__codelineno-0-14"></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">cluster_id</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-15"><a id="__codelineno-0-15" name="__codelineno-0-15"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-16"><a id="__codelineno-0-16" name="__codelineno-0-16"></a><span class="sd">        Initialize a tree node with a specific cluster id.</span>
+</span><span id="__span-0-17"><a id="__codelineno-0-17" name="__codelineno-0-17"></a>
+</span><span id="__span-0-18"><a id="__codelineno-0-18" name="__codelineno-0-18"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-19"><a id="__codelineno-0-19" name="__codelineno-0-19"></a><span class="sd">            cluster_id: The cluster id of the DAGs that belong to this node.</span>
+</span><span id="__span-0-20"><a id="__codelineno-0-20" name="__codelineno-0-20"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-21"><a id="__codelineno-0-21" name="__codelineno-0-21"></a>
+</span><span id="__span-0-22"><a id="__codelineno-0-22" name="__codelineno-0-22"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span> <span class="o">=</span> <span class="n">cluster_id</span>
+</span><span id="__span-0-23"><a id="__codelineno-0-23" name="__codelineno-0-23"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">left</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-24"><a id="__codelineno-0-24" name="__codelineno-0-24"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">right</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-25"><a id="__codelineno-0-25" name="__codelineno-0-25"></a>
+</span><span id="__span-0-26"><a id="__codelineno-0-26" name="__codelineno-0-26"></a>    <span class="nd">@staticmethod</span>
+</span><span id="__span-0-27"><a id="__codelineno-0-27" name="__codelineno-0-27"></a>    <span class="k">def</span> <span class="nf">build_tree</span><span class="p">(</span><span class="n">linked</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">,</span> <span class="n">leaves</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">Self</span><span class="p">,</span> <span class="nb">int</span><span class="p">]:</span>
+</span><span id="__span-0-28"><a id="__codelineno-0-28" name="__codelineno-0-28"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-29"><a id="__codelineno-0-29" name="__codelineno-0-29"></a><span class="sd">        Build a tree from a linkage matrix.</span>
+</span><span id="__span-0-30"><a id="__codelineno-0-30" name="__codelineno-0-30"></a>
+</span><span id="__span-0-31"><a id="__codelineno-0-31" name="__codelineno-0-31"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-32"><a id="__codelineno-0-32" name="__codelineno-0-32"></a><span class="sd">            linked: The linkage matrix.</span>
+</span><span id="__span-0-33"><a id="__codelineno-0-33" name="__codelineno-0-33"></a><span class="sd">            leaves: The list of leaf nodes.</span>
+</span><span id="__span-0-34"><a id="__codelineno-0-34" name="__codelineno-0-34"></a>
+</span><span id="__span-0-35"><a id="__codelineno-0-35" name="__codelineno-0-35"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-36"><a id="__codelineno-0-36" name="__codelineno-0-36"></a><span class="sd">            A tuple containing the root of the tree, and the index of the next cluster to be merged.</span>
+</span><span id="__span-0-37"><a id="__codelineno-0-37" name="__codelineno-0-37"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-38"><a id="__codelineno-0-38" name="__codelineno-0-38"></a>
+</span><span id="__span-0-39"><a id="__codelineno-0-39" name="__codelineno-0-39"></a>        <span class="c1"># Base case: if there is only one cluster, return it as a leaf.</span>
+</span><span id="__span-0-40"><a id="__codelineno-0-40" name="__codelineno-0-40"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">leaves</span><span class="p">)</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="__span-0-41"><a id="__codelineno-0-41" name="__codelineno-0-41"></a>            <span class="k">return</span> <span class="n">EdgeOccurrenceTree</span><span class="p">(</span><span class="n">cluster_id</span><span class="o">=</span><span class="n">leaves</span><span class="p">[</span><span class="mi">0</span><span class="p">]),</span> <span class="o">-</span><span class="mi">1</span>
+</span><span id="__span-0-42"><a id="__codelineno-0-42" name="__codelineno-0-42"></a>
+</span><span id="__span-0-43"><a id="__codelineno-0-43" name="__codelineno-0-43"></a>        <span class="c1"># Otherwise, build the tree recursively.</span>
+</span><span id="__span-0-44"><a id="__codelineno-0-44" name="__codelineno-0-44"></a>        <span class="n">root</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="p">()</span>
+</span><span id="__span-0-45"><a id="__codelineno-0-45" name="__codelineno-0-45"></a>        <span class="n">curr</span> <span class="o">=</span> <span class="n">root</span>
+</span><span id="__span-0-46"><a id="__codelineno-0-46" name="__codelineno-0-46"></a>        <span class="n">i</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">linked</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span>
+</span><span id="__span-0-47"><a id="__codelineno-0-47" name="__codelineno-0-47"></a>        <span class="k">while</span> <span class="n">i</span> <span class="o">&gt;</span> <span class="o">-</span><span class="mi">1</span><span class="p">:</span>
+</span><span id="__span-0-48"><a id="__codelineno-0-48" name="__codelineno-0-48"></a>            <span class="c1"># Linked contains 4 elements: cluster1, cluster2, distance, num_observations</span>
+</span><span id="__span-0-49"><a id="__codelineno-0-49" name="__codelineno-0-49"></a>            <span class="c1"># They represent the clusters that were merged, the distance between them, and</span>
+</span><span id="__span-0-50"><a id="__codelineno-0-50" name="__codelineno-0-50"></a>            <span class="c1"># the number of observations in the new cluster.</span>
+</span><span id="__span-0-51"><a id="__codelineno-0-51" name="__codelineno-0-51"></a>            <span class="n">c1</span><span class="p">,</span> <span class="n">c2</span><span class="p">,</span> <span class="n">_</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">linked</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
+</span><span id="__span-0-52"><a id="__codelineno-0-52" name="__codelineno-0-52"></a>
+</span><span id="__span-0-53"><a id="__codelineno-0-53" name="__codelineno-0-53"></a>            <span class="k">if</span> <span class="n">c1</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">leaves</span> <span class="ow">and</span> <span class="n">c2</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">leaves</span><span class="p">:</span>
+</span><span id="__span-0-54"><a id="__codelineno-0-54" name="__codelineno-0-54"></a>                <span class="n">curr</span><span class="o">.</span><span class="n">left</span><span class="p">,</span> <span class="n">i</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="o">.</span><span class="n">build_tree</span><span class="p">(</span><span class="n">linked</span><span class="p">[:</span><span class="n">i</span><span class="p">],</span> <span class="n">leaves</span><span class="p">)</span>
+</span><span id="__span-0-55"><a id="__codelineno-0-55" name="__codelineno-0-55"></a>                <span class="n">curr</span><span class="o">.</span><span class="n">right</span><span class="p">,</span> <span class="n">i</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="o">.</span><span class="n">build_tree</span><span class="p">(</span><span class="n">linked</span><span class="p">[:</span><span class="n">i</span><span class="p">],</span> <span class="n">leaves</span><span class="p">)</span>
+</span><span id="__span-0-56"><a id="__codelineno-0-56" name="__codelineno-0-56"></a>                <span class="k">break</span>
+</span><span id="__span-0-57"><a id="__codelineno-0-57" name="__codelineno-0-57"></a>            <span class="k">if</span> <span class="n">c1</span> <span class="ow">in</span> <span class="n">leaves</span><span class="p">:</span>
+</span><span id="__span-0-58"><a id="__codelineno-0-58" name="__codelineno-0-58"></a>                <span class="n">curr</span><span class="o">.</span><span class="n">left</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="p">(</span><span class="n">leaves</span><span class="o">.</span><span class="n">index</span><span class="p">(</span><span class="n">c1</span><span class="p">))</span>
+</span><span id="__span-0-59"><a id="__codelineno-0-59" name="__codelineno-0-59"></a>                <span class="n">curr</span><span class="o">.</span><span class="n">right</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="p">()</span>
+</span><span id="__span-0-60"><a id="__codelineno-0-60" name="__codelineno-0-60"></a>                <span class="n">curr</span> <span class="o">=</span> <span class="n">curr</span><span class="o">.</span><span class="n">right</span>
+</span><span id="__span-0-61"><a id="__codelineno-0-61" name="__codelineno-0-61"></a>            <span class="k">if</span> <span class="n">c2</span> <span class="ow">in</span> <span class="n">leaves</span><span class="p">:</span>
+</span><span id="__span-0-62"><a id="__codelineno-0-62" name="__codelineno-0-62"></a>                <span class="n">curr</span><span class="o">.</span><span class="n">right</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="p">(</span><span class="n">leaves</span><span class="o">.</span><span class="n">index</span><span class="p">(</span><span class="n">c2</span><span class="p">))</span>
+</span><span id="__span-0-63"><a id="__codelineno-0-63" name="__codelineno-0-63"></a>                <span class="k">break</span>
+</span><span id="__span-0-64"><a id="__codelineno-0-64" name="__codelineno-0-64"></a>            <span class="n">i</span> <span class="o">-=</span> <span class="mi">1</span>
+</span><span id="__span-0-65"><a id="__codelineno-0-65" name="__codelineno-0-65"></a>        <span class="n">root</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="o">.</span><span class="n">_cleanup_tree</span><span class="p">(</span><span class="n">root</span><span class="p">)</span>
+</span><span id="__span-0-66"><a id="__codelineno-0-66" name="__codelineno-0-66"></a>        <span class="k">return</span> <span class="n">root</span><span class="p">,</span> <span class="n">i</span>
+</span><span id="__span-0-67"><a id="__codelineno-0-67" name="__codelineno-0-67"></a>
+</span><span id="__span-0-68"><a id="__codelineno-0-68" name="__codelineno-0-68"></a>    <span class="nd">@staticmethod</span>
+</span><span id="__span-0-69"><a id="__codelineno-0-69" name="__codelineno-0-69"></a>    <span class="k">def</span> <span class="nf">_cleanup_tree</span><span class="p">(</span><span class="n">root</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">Self</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Self</span><span class="p">:</span>
+</span><span id="__span-0-70"><a id="__codelineno-0-70" name="__codelineno-0-70"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-71"><a id="__codelineno-0-71" name="__codelineno-0-71"></a><span class="sd">        Clean up the tree by removing nodes that have only one child, and nodes that have no</span>
+</span><span id="__span-0-72"><a id="__codelineno-0-72" name="__codelineno-0-72"></a><span class="sd">        children and are not leaves.</span>
+</span><span id="__span-0-73"><a id="__codelineno-0-73" name="__codelineno-0-73"></a>
+</span><span id="__span-0-74"><a id="__codelineno-0-74" name="__codelineno-0-74"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-75"><a id="__codelineno-0-75" name="__codelineno-0-75"></a><span class="sd">            root: The root of the tree.</span>
+</span><span id="__span-0-76"><a id="__codelineno-0-76" name="__codelineno-0-76"></a>
+</span><span id="__span-0-77"><a id="__codelineno-0-77" name="__codelineno-0-77"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-78"><a id="__codelineno-0-78" name="__codelineno-0-78"></a><span class="sd">            The root of the cleaned up tree.</span>
+</span><span id="__span-0-79"><a id="__codelineno-0-79" name="__codelineno-0-79"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-80"><a id="__codelineno-0-80" name="__codelineno-0-80"></a>
+</span><span id="__span-0-81"><a id="__codelineno-0-81" name="__codelineno-0-81"></a>        <span class="k">if</span> <span class="n">root</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-82"><a id="__codelineno-0-82" name="__codelineno-0-82"></a>            <span class="k">return</span> <span class="kc">None</span>
+</span><span id="__span-0-83"><a id="__codelineno-0-83" name="__codelineno-0-83"></a>
+</span><span id="__span-0-84"><a id="__codelineno-0-84" name="__codelineno-0-84"></a>        <span class="c1"># Recursively clean up left and right subtrees</span>
+</span><span id="__span-0-85"><a id="__codelineno-0-85" name="__codelineno-0-85"></a>        <span class="n">root</span><span class="o">.</span><span class="n">left</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="o">.</span><span class="n">_cleanup_tree</span><span class="p">(</span><span class="n">root</span><span class="o">.</span><span class="n">left</span><span class="p">)</span>
+</span><span id="__span-0-86"><a id="__codelineno-0-86" name="__codelineno-0-86"></a>        <span class="n">root</span><span class="o">.</span><span class="n">right</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="o">.</span><span class="n">_cleanup_tree</span><span class="p">(</span><span class="n">root</span><span class="o">.</span><span class="n">right</span><span class="p">)</span>
+</span><span id="__span-0-87"><a id="__codelineno-0-87" name="__codelineno-0-87"></a>
+</span><span id="__span-0-88"><a id="__codelineno-0-88" name="__codelineno-0-88"></a>        <span class="c1"># If the current node has only one child, replace the node with its child</span>
+</span><span id="__span-0-89"><a id="__codelineno-0-89" name="__codelineno-0-89"></a>        <span class="k">if</span> <span class="n">root</span><span class="o">.</span><span class="n">left</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">root</span><span class="o">.</span><span class="n">right</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-90"><a id="__codelineno-0-90" name="__codelineno-0-90"></a>            <span class="k">return</span> <span class="n">root</span><span class="o">.</span><span class="n">right</span>
+</span><span id="__span-0-91"><a id="__codelineno-0-91" name="__codelineno-0-91"></a>        <span class="k">elif</span> <span class="n">root</span><span class="o">.</span><span class="n">left</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">root</span><span class="o">.</span><span class="n">right</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-92"><a id="__codelineno-0-92" name="__codelineno-0-92"></a>            <span class="k">return</span> <span class="n">root</span><span class="o">.</span><span class="n">left</span>
+</span><span id="__span-0-93"><a id="__codelineno-0-93" name="__codelineno-0-93"></a>
+</span><span id="__span-0-94"><a id="__codelineno-0-94" name="__codelineno-0-94"></a>        <span class="c1"># If the current node has no left and right child and is not a leaf, remove the node</span>
+</span><span id="__span-0-95"><a id="__codelineno-0-95" name="__codelineno-0-95"></a>        <span class="k">if</span> <span class="n">root</span><span class="o">.</span><span class="n">left</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">root</span><span class="o">.</span><span class="n">right</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">root</span><span class="o">.</span><span class="n">cluster_id</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-96"><a id="__codelineno-0-96" name="__codelineno-0-96"></a>            <span class="k">return</span> <span class="kc">None</span>
+</span><span id="__span-0-97"><a id="__codelineno-0-97" name="__codelineno-0-97"></a>
+</span><span id="__span-0-98"><a id="__codelineno-0-98" name="__codelineno-0-98"></a>        <span class="k">return</span> <span class="n">root</span>
+</span><span id="__span-0-99"><a id="__codelineno-0-99" name="__codelineno-0-99"></a>
+</span><span id="__span-0-100"><a id="__codelineno-0-100" name="__codelineno-0-100"></a>    <span class="k">def</span> <span class="nf">print_tree</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">depth</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">0</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-101"><a id="__codelineno-0-101" name="__codelineno-0-101"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-102"><a id="__codelineno-0-102" name="__codelineno-0-102"></a><span class="sd">        Print the tree in a readable format.</span>
+</span><span id="__span-0-103"><a id="__codelineno-0-103" name="__codelineno-0-103"></a>
+</span><span id="__span-0-104"><a id="__codelineno-0-104" name="__codelineno-0-104"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-105"><a id="__codelineno-0-105" name="__codelineno-0-105"></a><span class="sd">            depth: The depth of the current node in the tree.</span>
+</span><span id="__span-0-106"><a id="__codelineno-0-106" name="__codelineno-0-106"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-107"><a id="__codelineno-0-107" name="__codelineno-0-107"></a>
+</span><span id="__span-0-108"><a id="__codelineno-0-108" name="__codelineno-0-108"></a>        <span class="n">prefix</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-109"><a id="__codelineno-0-109" name="__codelineno-0-109"></a>        <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">depth</span><span class="p">):</span>
+</span><span id="__span-0-110"><a id="__codelineno-0-110" name="__codelineno-0-110"></a>            <span class="n">prefix</span> <span class="o">+=</span> <span class="s2">&quot;-&quot;</span>
+</span><span id="__span-0-111"><a id="__codelineno-0-111" name="__codelineno-0-111"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-112"><a id="__codelineno-0-112" name="__codelineno-0-112"></a>            <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="n">prefix</span> <span class="o">+</span> <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span><span class="p">))</span>
+</span><span id="__span-0-113"><a id="__codelineno-0-113" name="__codelineno-0-113"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-114"><a id="__codelineno-0-114" name="__codelineno-0-114"></a>            <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="n">prefix</span> <span class="o">+</span> <span class="s2">&quot;node&quot;</span><span class="p">)</span>
+</span><span id="__span-0-115"><a id="__codelineno-0-115" name="__codelineno-0-115"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="p">:</span>
+</span><span id="__span-0-116"><a id="__codelineno-0-116" name="__codelineno-0-116"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">print_tree</span><span class="p">(</span><span class="n">depth</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="__span-0-117"><a id="__codelineno-0-117" name="__codelineno-0-117"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
+</span><span id="__span-0-118"><a id="__codelineno-0-118" name="__codelineno-0-118"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">print_tree</span><span class="p">(</span><span class="n">depth</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="__span-0-119"><a id="__codelineno-0-119" name="__codelineno-0-119"></a>
+</span><span id="__span-0-120"><a id="__codelineno-0-120" name="__codelineno-0-120"></a>    <span class="k">def</span> <span class="nf">assign_dags_to_nodes</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">cluster_mapping</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="n">nx</span><span class="o">.</span><span class="n">DiGraph</span><span class="p">,</span> <span class="nb">int</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-121"><a id="__codelineno-0-121" name="__codelineno-0-121"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-122"><a id="__codelineno-0-122" name="__codelineno-0-122"></a><span class="sd">        Assign each DAG to the node it belongs to, based on `cluster_mapping`.</span>
+</span><span id="__span-0-123"><a id="__codelineno-0-123" name="__codelineno-0-123"></a>
+</span><span id="__span-0-124"><a id="__codelineno-0-124" name="__codelineno-0-124"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-125"><a id="__codelineno-0-125" name="__codelineno-0-125"></a><span class="sd">            cluster_mapping: A dictionary mapping DAGs to cluster id&#39;s.</span>
+</span><span id="__span-0-126"><a id="__codelineno-0-126" name="__codelineno-0-126"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-127"><a id="__codelineno-0-127" name="__codelineno-0-127"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="__span-0-128"><a id="__codelineno-0-128" name="__codelineno-0-128"></a>
+</span><span id="__span-0-129"><a id="__codelineno-0-129" name="__codelineno-0-129"></a>        <span class="c1"># If leaf, assign DAGs and set count.</span>
+</span><span id="__span-0-130"><a id="__codelineno-0-130" name="__codelineno-0-130"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-131"><a id="__codelineno-0-131" name="__codelineno-0-131"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">dags</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="__span-0-132"><a id="__codelineno-0-132" name="__codelineno-0-132"></a>                <span class="n">key</span>
+</span><span id="__span-0-133"><a id="__codelineno-0-133" name="__codelineno-0-133"></a>                <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="n">cluster_mapping</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span>
+</span><span id="__span-0-134"><a id="__codelineno-0-134" name="__codelineno-0-134"></a>                <span class="k">if</span> <span class="n">cluster_mapping</span><span class="p">[</span><span class="n">key</span><span class="p">]</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span>
+</span><span id="__span-0-135"><a id="__codelineno-0-135" name="__codelineno-0-135"></a>            <span class="p">]</span>
+</span><span id="__span-0-136"><a id="__codelineno-0-136" name="__codelineno-0-136"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dags</span><span class="p">)</span>
+</span><span id="__span-0-137"><a id="__codelineno-0-137" name="__codelineno-0-137"></a>
+</span><span id="__span-0-138"><a id="__codelineno-0-138" name="__codelineno-0-138"></a>        <span class="c1"># Otherwise, recurse for children and retireve counts.</span>
+</span><span id="__span-0-139"><a id="__codelineno-0-139" name="__codelineno-0-139"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="p">:</span>
+</span><span id="__span-0-140"><a id="__codelineno-0-140" name="__codelineno-0-140"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">assign_dags_to_nodes</span><span class="p">(</span><span class="n">cluster_mapping</span><span class="p">)</span>
+</span><span id="__span-0-141"><a id="__codelineno-0-141" name="__codelineno-0-141"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">num_dags</span>
+</span><span id="__span-0-142"><a id="__codelineno-0-142" name="__codelineno-0-142"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
+</span><span id="__span-0-143"><a id="__codelineno-0-143" name="__codelineno-0-143"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">assign_dags_to_nodes</span><span class="p">(</span><span class="n">cluster_mapping</span><span class="p">)</span>
+</span><span id="__span-0-144"><a id="__codelineno-0-144" name="__codelineno-0-144"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">num_dags</span>
+</span><span id="__span-0-145"><a id="__codelineno-0-145" name="__codelineno-0-145"></a>
+</span><span id="__span-0-146"><a id="__codelineno-0-146" name="__codelineno-0-146"></a>    <span class="k">def</span> <span class="nf">count_edge_occurrences</span><span class="p">(</span>
+</span><span id="__span-0-147"><a id="__codelineno-0-147" name="__codelineno-0-147"></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">treatment</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">outcome</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">dag</span><span class="p">:</span> <span class="n">nx</span><span class="o">.</span><span class="n">DiGraph</span>
+</span><span id="__span-0-148"><a id="__codelineno-0-148" name="__codelineno-0-148"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-149"><a id="__codelineno-0-149" name="__codelineno-0-149"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-150"><a id="__codelineno-0-150" name="__codelineno-0-150"></a><span class="sd">        Recursively count the number of times each edge occurs amongst the DAGs</span>
+</span><span id="__span-0-151"><a id="__codelineno-0-151" name="__codelineno-0-151"></a><span class="sd">        assigned to all the children of this node, omitting the edge from treatment -&gt; outcome,</span>
+</span><span id="__span-0-152"><a id="__codelineno-0-152" name="__codelineno-0-152"></a><span class="sd">        since this always exists. If a DAG is passed in, ignore the edges in that DAG as well.</span>
+</span><span id="__span-0-153"><a id="__codelineno-0-153" name="__codelineno-0-153"></a>
+</span><span id="__span-0-154"><a id="__codelineno-0-154" name="__codelineno-0-154"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-155"><a id="__codelineno-0-155" name="__codelineno-0-155"></a><span class="sd">            treatment: The treatment variable.</span>
+</span><span id="__span-0-156"><a id="__codelineno-0-156" name="__codelineno-0-156"></a><span class="sd">            outcome: The outcome variable.</span>
+</span><span id="__span-0-157"><a id="__codelineno-0-157" name="__codelineno-0-157"></a><span class="sd">            dag: The optional dag structure to ignore.</span>
+</span><span id="__span-0-158"><a id="__codelineno-0-158" name="__codelineno-0-158"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-159"><a id="__codelineno-0-159" name="__codelineno-0-159"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">:</span> <span class="n">Types</span><span class="o">.</span><span class="n">EdgeCountDict</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="__span-0-160"><a id="__codelineno-0-160" name="__codelineno-0-160"></a>
+</span><span id="__span-0-161"><a id="__codelineno-0-161" name="__codelineno-0-161"></a>        <span class="c1"># If leaf, actually compute count.</span>
+</span><span id="__span-0-162"><a id="__codelineno-0-162" name="__codelineno-0-162"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-163"><a id="__codelineno-0-163" name="__codelineno-0-163"></a>            <span class="n">edges_to_ignore</span> <span class="o">=</span> <span class="p">[(</span><span class="n">treatment</span><span class="p">,</span> <span class="n">outcome</span><span class="p">)]</span>
+</span><span id="__span-0-164"><a id="__codelineno-0-164" name="__codelineno-0-164"></a>            <span class="k">if</span> <span class="n">dag</span><span class="p">:</span>
+</span><span id="__span-0-165"><a id="__codelineno-0-165" name="__codelineno-0-165"></a>                <span class="n">edges_to_ignore</span><span class="o">.</span><span class="n">extend</span><span class="p">(</span><span class="n">dag</span><span class="o">.</span><span class="n">edges</span><span class="p">)</span>
+</span><span id="__span-0-166"><a id="__codelineno-0-166" name="__codelineno-0-166"></a>            <span class="k">for</span> <span class="n">graph</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dags</span><span class="p">:</span>
+</span><span id="__span-0-167"><a id="__codelineno-0-167" name="__codelineno-0-167"></a>                <span class="k">for</span> <span class="n">edge</span> <span class="ow">in</span> <span class="n">graph</span><span class="o">.</span><span class="n">edges</span><span class="p">:</span>
+</span><span id="__span-0-168"><a id="__codelineno-0-168" name="__codelineno-0-168"></a>                    <span class="k">if</span> <span class="n">edge</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">edges_to_ignore</span><span class="p">:</span>
+</span><span id="__span-0-169"><a id="__codelineno-0-169" name="__codelineno-0-169"></a>                        <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="__span-0-170"><a id="__codelineno-0-170" name="__codelineno-0-170"></a>
+</span><span id="__span-0-171"><a id="__codelineno-0-171" name="__codelineno-0-171"></a>        <span class="c1"># Otherwise, derive counts from children.</span>
+</span><span id="__span-0-172"><a id="__codelineno-0-172" name="__codelineno-0-172"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="p">:</span>
+</span><span id="__span-0-173"><a id="__codelineno-0-173" name="__codelineno-0-173"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">count_edge_occurrences</span><span class="p">(</span><span class="n">treatment</span><span class="p">,</span> <span class="n">outcome</span><span class="p">,</span> <span class="n">dag</span><span class="p">)</span>
+</span><span id="__span-0-174"><a id="__codelineno-0-174" name="__codelineno-0-174"></a>            <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">edge_counts</span><span class="o">.</span><span class="n">keys</span><span class="p">():</span>
+</span><span id="__span-0-175"><a id="__codelineno-0-175" name="__codelineno-0-175"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">[</span><span class="n">key</span><span class="p">]</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">[</span><span class="n">key</span><span class="p">]</span>
+</span><span id="__span-0-176"><a id="__codelineno-0-176" name="__codelineno-0-176"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
+</span><span id="__span-0-177"><a id="__codelineno-0-177" name="__codelineno-0-177"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">count_edge_occurrences</span><span class="p">(</span><span class="n">treatment</span><span class="p">,</span> <span class="n">outcome</span><span class="p">,</span> <span class="n">dag</span><span class="p">)</span>
+</span><span id="__span-0-178"><a id="__codelineno-0-178" name="__codelineno-0-178"></a>            <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">edge_counts</span><span class="o">.</span><span class="n">keys</span><span class="p">():</span>
+</span><span id="__span-0-179"><a id="__codelineno-0-179" name="__codelineno-0-179"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">[</span><span class="n">key</span><span class="p">]</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">[</span><span class="n">key</span><span class="p">]</span>
+</span><span id="__span-0-180"><a id="__codelineno-0-180" name="__codelineno-0-180"></a>
+</span><span id="__span-0-181"><a id="__codelineno-0-181" name="__codelineno-0-181"></a>        <span class="c1"># Compute statistics.</span>
+</span><span id="__span-0-182"><a id="__codelineno-0-182" name="__codelineno-0-182"></a>        <span class="n">freq_counts</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="o">.</span><span class="n">values</span><span class="p">())</span>
+</span><span id="__span-0-183"><a id="__codelineno-0-183" name="__codelineno-0-183"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">freq_counts</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-184"><a id="__codelineno-0-184" name="__codelineno-0-184"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">mean</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-185"><a id="__codelineno-0-185" name="__codelineno-0-185"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">std_dev</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-186"><a id="__codelineno-0-186" name="__codelineno-0-186"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-187"><a id="__codelineno-0-187" name="__codelineno-0-187"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">mean</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">freq_counts</span><span class="p">)</span>
+</span><span id="__span-0-188"><a id="__codelineno-0-188" name="__codelineno-0-188"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">std_dev</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">freq_counts</span><span class="p">)</span>
+</span><span id="__span-0-189"><a id="__codelineno-0-189" name="__codelineno-0-189"></a>
+</span><span id="__span-0-190"><a id="__codelineno-0-190" name="__codelineno-0-190"></a>    <span class="k">def</span> <span class="nf">calculate_edge_expectancy</span><span class="p">(</span>
+</span><span id="__span-0-191"><a id="__codelineno-0-191" name="__codelineno-0-191"></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">totals</span><span class="p">:</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="n">Types</span><span class="o">.</span><span class="n">EdgeCountDict</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-192"><a id="__codelineno-0-192" name="__codelineno-0-192"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-193"><a id="__codelineno-0-193" name="__codelineno-0-193"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-194"><a id="__codelineno-0-194" name="__codelineno-0-194"></a><span class="sd">        For each edge at each node, calculate what percent over or under</span>
+</span><span id="__span-0-195"><a id="__codelineno-0-195" name="__codelineno-0-195"></a><span class="sd">        expectancy the edge is at in relationship to its parent.</span>
+</span><span id="__span-0-196"><a id="__codelineno-0-196" name="__codelineno-0-196"></a>
+</span><span id="__span-0-197"><a id="__codelineno-0-197" name="__codelineno-0-197"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-198"><a id="__codelineno-0-198" name="__codelineno-0-198"></a><span class="sd">            totals: A tuple containing the total number of DAGs and the mapping from</span>
+</span><span id="__span-0-199"><a id="__codelineno-0-199" name="__codelineno-0-199"></a><span class="sd">                edges to their counts for the parent of this node.</span>
+</span><span id="__span-0-200"><a id="__codelineno-0-200" name="__codelineno-0-200"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-201"><a id="__codelineno-0-201" name="__codelineno-0-201"></a>        <span class="c1"># At root node, calculate expectancy</span>
+</span><span id="__span-0-202"><a id="__codelineno-0-202" name="__codelineno-0-202"></a>        <span class="k">if</span> <span class="n">totals</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-203"><a id="__codelineno-0-203" name="__codelineno-0-203"></a>            <span class="n">totals</span> <span class="o">=</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">)</span>
+</span><span id="__span-0-204"><a id="__codelineno-0-204" name="__codelineno-0-204"></a>
+</span><span id="__span-0-205"><a id="__codelineno-0-205" name="__codelineno-0-205"></a>        <span class="c1"># Otherwise, calculate expectancy based on parent.</span>
+</span><span id="__span-0-206"><a id="__codelineno-0-206" name="__codelineno-0-206"></a>        <span class="n">total_dags</span><span class="p">,</span> <span class="n">total_edges</span> <span class="o">=</span> <span class="n">totals</span>
+</span><span id="__span-0-207"><a id="__codelineno-0-207" name="__codelineno-0-207"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">percent_expectancy</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">float</span><span class="p">)</span>
+</span><span id="__span-0-208"><a id="__codelineno-0-208" name="__codelineno-0-208"></a>
+</span><span id="__span-0-209"><a id="__codelineno-0-209" name="__codelineno-0-209"></a>        <span class="k">for</span> <span class="n">edge</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="o">.</span><span class="n">keys</span><span class="p">():</span>
+</span><span id="__span-0-210"><a id="__codelineno-0-210" name="__codelineno-0-210"></a>            <span class="n">expected</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span> <span class="o">/</span> <span class="n">total_dags</span> <span class="o">*</span> <span class="n">total_edges</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span>
+</span><span id="__span-0-211"><a id="__codelineno-0-211" name="__codelineno-0-211"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-212"><a id="__codelineno-0-212" name="__codelineno-0-212"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span> <span class="o">-</span> <span class="n">expected</span>
+</span><span id="__span-0-213"><a id="__codelineno-0-213" name="__codelineno-0-213"></a>            <span class="p">)</span> <span class="o">/</span> <span class="n">expected</span>
+</span><span id="__span-0-214"><a id="__codelineno-0-214" name="__codelineno-0-214"></a>
+</span><span id="__span-0-215"><a id="__codelineno-0-215" name="__codelineno-0-215"></a>        <span class="c1"># Recurse for children.</span>
+</span><span id="__span-0-216"><a id="__codelineno-0-216" name="__codelineno-0-216"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="p">:</span>
+</span><span id="__span-0-217"><a id="__codelineno-0-217" name="__codelineno-0-217"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">calculate_edge_expectancy</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">))</span>
+</span><span id="__span-0-218"><a id="__codelineno-0-218" name="__codelineno-0-218"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
+</span><span id="__span-0-219"><a id="__codelineno-0-219" name="__codelineno-0-219"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">calculate_edge_expectancy</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">))</span>
+</span><span id="__span-0-220"><a id="__codelineno-0-220" name="__codelineno-0-220"></a>
+</span><span id="__span-0-221"><a id="__codelineno-0-221" name="__codelineno-0-221"></a>    <span class="k">def</span> <span class="nf">find_outliers_in_tree</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">threshold</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">0</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-222"><a id="__codelineno-0-222" name="__codelineno-0-222"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-223"><a id="__codelineno-0-223" name="__codelineno-0-223"></a><span class="sd">        Find outlier edges, based on the percent expectancy of each edge. Define an outlier as an</span>
+</span><span id="__span-0-224"><a id="__codelineno-0-224" name="__codelineno-0-224"></a><span class="sd">        edge that is below expectancy on one side of the tree, and above on the other side, and</span>
+</span><span id="__span-0-225"><a id="__codelineno-0-225" name="__codelineno-0-225"></a><span class="sd">        optionally, over some threshold on both sides.</span>
+</span><span id="__span-0-226"><a id="__codelineno-0-226" name="__codelineno-0-226"></a>
+</span><span id="__span-0-227"><a id="__codelineno-0-227" name="__codelineno-0-227"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-228"><a id="__codelineno-0-228" name="__codelineno-0-228"></a><span class="sd">            threshold: The threshold for an edge to be considered an outlier.</span>
+</span><span id="__span-0-229"><a id="__codelineno-0-229" name="__codelineno-0-229"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-230"><a id="__codelineno-0-230" name="__codelineno-0-230"></a>
+</span><span id="__span-0-231"><a id="__codelineno-0-231" name="__codelineno-0-231"></a>        <span class="c1"># If able to compare, find outliers.</span>
+</span><span id="__span-0-232"><a id="__codelineno-0-232" name="__codelineno-0-232"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span> <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
+</span><span id="__span-0-233"><a id="__codelineno-0-233" name="__codelineno-0-233"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">outliers</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-234"><a id="__codelineno-0-234" name="__codelineno-0-234"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">outliers</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-235"><a id="__codelineno-0-235" name="__codelineno-0-235"></a>            <span class="n">edges</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">edge_counts</span><span class="o">.</span><span class="n">keys</span><span class="p">())</span><span class="o">.</span><span class="n">union</span><span class="p">(</span>
+</span><span id="__span-0-236"><a id="__codelineno-0-236" name="__codelineno-0-236"></a>                <span class="nb">set</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">edge_counts</span><span class="o">.</span><span class="n">keys</span><span class="p">())</span>
+</span><span id="__span-0-237"><a id="__codelineno-0-237" name="__codelineno-0-237"></a>            <span class="p">)</span>
+</span><span id="__span-0-238"><a id="__codelineno-0-238" name="__codelineno-0-238"></a>            <span class="k">for</span> <span class="n">edge</span> <span class="ow">in</span> <span class="n">edges</span><span class="p">:</span>
+</span><span id="__span-0-239"><a id="__codelineno-0-239" name="__codelineno-0-239"></a>                <span class="k">if</span> <span class="p">(</span>
+</span><span id="__span-0-240"><a id="__codelineno-0-240" name="__codelineno-0-240"></a>                    <span class="n">np</span><span class="o">.</span><span class="n">sign</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">])</span>
+</span><span id="__span-0-241"><a id="__codelineno-0-241" name="__codelineno-0-241"></a>                    <span class="o">!=</span> <span class="n">np</span><span class="o">.</span><span class="n">sign</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">])</span>
+</span><span id="__span-0-242"><a id="__codelineno-0-242" name="__codelineno-0-242"></a>                    <span class="ow">and</span> <span class="nb">abs</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">])</span> <span class="o">&gt;</span> <span class="n">threshold</span>
+</span><span id="__span-0-243"><a id="__codelineno-0-243" name="__codelineno-0-243"></a>                    <span class="ow">and</span> <span class="nb">abs</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">])</span> <span class="o">&gt;</span> <span class="n">threshold</span>
+</span><span id="__span-0-244"><a id="__codelineno-0-244" name="__codelineno-0-244"></a>                <span class="p">):</span>
+</span><span id="__span-0-245"><a id="__codelineno-0-245" name="__codelineno-0-245"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">outliers</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span>
+</span><span id="__span-0-246"><a id="__codelineno-0-246" name="__codelineno-0-246"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">outliers</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span>
+</span><span id="__span-0-247"><a id="__codelineno-0-247" name="__codelineno-0-247"></a>
+</span><span id="__span-0-248"><a id="__codelineno-0-248" name="__codelineno-0-248"></a>        <span class="c1"># Recurse for children.</span>
+</span><span id="__span-0-249"><a id="__codelineno-0-249" name="__codelineno-0-249"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="p">:</span>
+</span><span id="__span-0-250"><a id="__codelineno-0-250" name="__codelineno-0-250"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">find_outliers_in_tree</span><span class="p">(</span><span class="n">threshold</span><span class="p">)</span>
+</span><span id="__span-0-251"><a id="__codelineno-0-251" name="__codelineno-0-251"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
+</span><span id="__span-0-252"><a id="__codelineno-0-252" name="__codelineno-0-252"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">find_outliers_in_tree</span><span class="p">(</span><span class="n">threshold</span><span class="p">)</span>
+</span><span id="__span-0-253"><a id="__codelineno-0-253" name="__codelineno-0-253"></a>
+</span><span id="__span-0-254"><a id="__codelineno-0-254" name="__codelineno-0-254"></a>    <span class="k">def</span> <span class="nf">find_outliers_per_cluster</span><span class="p">(</span>
+</span><span id="__span-0-255"><a id="__codelineno-0-255" name="__codelineno-0-255"></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-256"><a id="__codelineno-0-256" name="__codelineno-0-256"></a>        <span class="n">dag</span><span class="p">:</span> <span class="n">nx</span><span class="o">.</span><span class="n">DiGraph</span><span class="p">,</span>
+</span><span id="__span-0-257"><a id="__codelineno-0-257" name="__codelineno-0-257"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">Types</span><span class="o">.</span><span class="n">EdgeCountDict</span><span class="p">,</span> <span class="nb">dict</span><span class="p">[</span><span class="n">Types</span><span class="o">.</span><span class="n">Edge</span><span class="p">,</span> <span class="nb">float</span><span class="p">]]:</span>
+</span><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-259"><a id="__codelineno-0-259" name="__codelineno-0-259"></a><span class="sd">        Collect the edge counts and outliers found earlier into appropriate dictionaries</span>
+</span><span id="__span-0-260"><a id="__codelineno-0-260" name="__codelineno-0-260"></a><span class="sd">        per cluster.</span>
+</span><span id="__span-0-261"><a id="__codelineno-0-261" name="__codelineno-0-261"></a>
+</span><span id="__span-0-262"><a id="__codelineno-0-262" name="__codelineno-0-262"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-263"><a id="__codelineno-0-263" name="__codelineno-0-263"></a><span class="sd">            dag: The DAG to ignore when collecting outliers.</span>
+</span><span id="__span-0-264"><a id="__codelineno-0-264" name="__codelineno-0-264"></a>
+</span><span id="__span-0-265"><a id="__codelineno-0-265" name="__codelineno-0-265"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-266"><a id="__codelineno-0-266" name="__codelineno-0-266"></a><span class="sd">            A tuple containing the following: a dictionary mapping cluster id&#39;s to edge counts,</span>
+</span><span id="__span-0-267"><a id="__codelineno-0-267" name="__codelineno-0-267"></a><span class="sd">            and a dictionary mapping cluster id&#39;s to outlier edges.</span>
+</span><span id="__span-0-268"><a id="__codelineno-0-268" name="__codelineno-0-268"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a>
+</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a>        <span class="n">cluster_edge_count</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a>        <span class="n">cluster_outliers</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a>
+</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a>        <span class="c1"># If leaf, add to cluster counts.</span>
+</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-275"><a id="__codelineno-0-275" name="__codelineno-0-275"></a>            <span class="n">cluster_edge_count</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span>
+</span><span id="__span-0-276"><a id="__codelineno-0-276" name="__codelineno-0-276"></a>            <span class="n">edges_to_ignore</span> <span class="o">=</span> <span class="n">dag</span><span class="o">.</span><span class="n">edges</span> <span class="k">if</span> <span class="n">dag</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="k">else</span> <span class="p">[]</span>
+</span><span id="__span-0-277"><a id="__codelineno-0-277" name="__codelineno-0-277"></a>            <span class="n">cluster_outliers</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span><span class="p">]</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="__span-0-278"><a id="__codelineno-0-278" name="__codelineno-0-278"></a>                <span class="n">edge</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">outliers</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span>
+</span><span id="__span-0-279"><a id="__codelineno-0-279" name="__codelineno-0-279"></a>                <span class="k">for</span> <span class="n">edge</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">outliers</span>
+</span><span id="__span-0-280"><a id="__codelineno-0-280" name="__codelineno-0-280"></a>                <span class="k">if</span> <span class="n">edge</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">edges_to_ignore</span>
+</span><span id="__span-0-281"><a id="__codelineno-0-281" name="__codelineno-0-281"></a>            <span class="p">}</span>
+</span><span id="__span-0-282"><a id="__codelineno-0-282" name="__codelineno-0-282"></a>
+</span><span id="__span-0-283"><a id="__codelineno-0-283" name="__codelineno-0-283"></a>        <span class="c1"># Otherwise, recurse for children.</span>
+</span><span id="__span-0-284"><a id="__codelineno-0-284" name="__codelineno-0-284"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="p">:</span>
+</span><span id="__span-0-285"><a id="__codelineno-0-285" name="__codelineno-0-285"></a>            <span class="n">lec</span><span class="p">,</span> <span class="n">lo</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">find_outliers_per_cluster</span><span class="p">(</span><span class="n">dag</span><span class="p">)</span>
+</span><span id="__span-0-286"><a id="__codelineno-0-286" name="__codelineno-0-286"></a>            <span class="n">cluster_edge_count</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">lec</span><span class="p">)</span>
+</span><span id="__span-0-287"><a id="__codelineno-0-287" name="__codelineno-0-287"></a>            <span class="n">cluster_outliers</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">lo</span><span class="p">)</span>
+</span><span id="__span-0-288"><a id="__codelineno-0-288" name="__codelineno-0-288"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
+</span><span id="__span-0-289"><a id="__codelineno-0-289" name="__codelineno-0-289"></a>            <span class="n">rec</span><span class="p">,</span> <span class="n">ro</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">find_outliers_per_cluster</span><span class="p">(</span><span class="n">dag</span><span class="p">)</span>
+</span><span id="__span-0-290"><a id="__codelineno-0-290" name="__codelineno-0-290"></a>            <span class="n">cluster_edge_count</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">rec</span><span class="p">)</span>
+</span><span id="__span-0-291"><a id="__codelineno-0-291" name="__codelineno-0-291"></a>            <span class="n">cluster_outliers</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">ro</span><span class="p">)</span>
+</span><span id="__span-0-292"><a id="__codelineno-0-292" name="__codelineno-0-292"></a>
+</span><span id="__span-0-293"><a id="__codelineno-0-293" name="__codelineno-0-293"></a>        <span class="k">return</span> <span class="n">cluster_edge_count</span><span class="p">,</span> <span class="n">cluster_outliers</span>
 </span></code></pre></div></td></tr></table></div>
               </details>
 
@@ -1940,8 +2146,7 @@ <h3 id="logos.edge_occurrence_tree.EdgeOccurrenceTree.__init__" class="doc doc-h
 
             <details class="quote">
               <summary>Source code in <code>src/logos/edge_occurrence_tree.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-13">13</a></span>
-<span class="normal"><a href="#__codelineno-0-14">14</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-14">14</a></span>
 <span class="normal"><a href="#__codelineno-0-15">15</a></span>
 <span class="normal"><a href="#__codelineno-0-16">16</a></span>
 <span class="normal"><a href="#__codelineno-0-17">17</a></span>
@@ -1950,17 +2155,18 @@ <h3 id="logos.edge_occurrence_tree.EdgeOccurrenceTree.__init__" class="doc doc-h
 <span class="normal"><a href="#__codelineno-0-20">20</a></span>
 <span class="normal"><a href="#__codelineno-0-21">21</a></span>
 <span class="normal"><a href="#__codelineno-0-22">22</a></span>
-<span class="normal"><a href="#__codelineno-0-23">23</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-13"><a id="__codelineno-0-13" name="__codelineno-0-13"></a><span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">cluster_id</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-14"><a id="__codelineno-0-14" name="__codelineno-0-14"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-15"><a id="__codelineno-0-15" name="__codelineno-0-15"></a><span class="sd">    Initialize a tree node with a specific cluster id.</span>
-</span><span id="__span-0-16"><a id="__codelineno-0-16" name="__codelineno-0-16"></a>
-</span><span id="__span-0-17"><a id="__codelineno-0-17" name="__codelineno-0-17"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-18"><a id="__codelineno-0-18" name="__codelineno-0-18"></a><span class="sd">        cluster_id: The cluster id of the DAGs that belong to this node.</span>
-</span><span id="__span-0-19"><a id="__codelineno-0-19" name="__codelineno-0-19"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-20"><a id="__codelineno-0-20" name="__codelineno-0-20"></a>
-</span><span id="__span-0-21"><a id="__codelineno-0-21" name="__codelineno-0-21"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span> <span class="o">=</span> <span class="n">cluster_id</span>
-</span><span id="__span-0-22"><a id="__codelineno-0-22" name="__codelineno-0-22"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">left</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-23"><a id="__codelineno-0-23" name="__codelineno-0-23"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">right</span> <span class="o">=</span> <span class="kc">None</span>
+<span class="normal"><a href="#__codelineno-0-23">23</a></span>
+<span class="normal"><a href="#__codelineno-0-24">24</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-14"><a id="__codelineno-0-14" name="__codelineno-0-14"></a><span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">cluster_id</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-15"><a id="__codelineno-0-15" name="__codelineno-0-15"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-16"><a id="__codelineno-0-16" name="__codelineno-0-16"></a><span class="sd">    Initialize a tree node with a specific cluster id.</span>
+</span><span id="__span-0-17"><a id="__codelineno-0-17" name="__codelineno-0-17"></a>
+</span><span id="__span-0-18"><a id="__codelineno-0-18" name="__codelineno-0-18"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-19"><a id="__codelineno-0-19" name="__codelineno-0-19"></a><span class="sd">        cluster_id: The cluster id of the DAGs that belong to this node.</span>
+</span><span id="__span-0-20"><a id="__codelineno-0-20" name="__codelineno-0-20"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-21"><a id="__codelineno-0-21" name="__codelineno-0-21"></a>
+</span><span id="__span-0-22"><a id="__codelineno-0-22" name="__codelineno-0-22"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span> <span class="o">=</span> <span class="n">cluster_id</span>
+</span><span id="__span-0-23"><a id="__codelineno-0-23" name="__codelineno-0-23"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">left</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-24"><a id="__codelineno-0-24" name="__codelineno-0-24"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">right</span> <span class="o">=</span> <span class="kc">None</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -2039,7 +2245,7 @@ <h3 id="logos.edge_occurrence_tree.EdgeOccurrenceTree.build_tree" class="doc doc
       <tbody>
           <tr class="doc-section-item">
             <td>
-                  <code>tuple[<span title="typing.Self">Self</span>, int]</code>
+                  <code>tuple[<span title="logos.types.Self">Self</span>, int]</code>
             </td>
             <td>
               <div class="doc-md-description">
@@ -2052,8 +2258,7 @@ <h3 id="logos.edge_occurrence_tree.EdgeOccurrenceTree.build_tree" class="doc doc
 
             <details class="quote">
               <summary>Source code in <code>src/logos/edge_occurrence_tree.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-25">25</a></span>
-<span class="normal"><a href="#__codelineno-0-26">26</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-26">26</a></span>
 <span class="normal"><a href="#__codelineno-0-27">27</a></span>
 <span class="normal"><a href="#__codelineno-0-28">28</a></span>
 <span class="normal"><a href="#__codelineno-0-29">29</a></span>
@@ -2092,47 +2297,48 @@ <h3 id="logos.edge_occurrence_tree.EdgeOccurrenceTree.build_tree" class="doc doc
 <span class="normal"><a href="#__codelineno-0-62">62</a></span>
 <span class="normal"><a href="#__codelineno-0-63">63</a></span>
 <span class="normal"><a href="#__codelineno-0-64">64</a></span>
-<span class="normal"><a href="#__codelineno-0-65">65</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-25"><a id="__codelineno-0-25" name="__codelineno-0-25"></a><span class="nd">@staticmethod</span>
-</span><span id="__span-0-26"><a id="__codelineno-0-26" name="__codelineno-0-26"></a><span class="k">def</span> <span class="nf">build_tree</span><span class="p">(</span><span class="n">linked</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">,</span> <span class="n">leaves</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">Self</span><span class="p">,</span> <span class="nb">int</span><span class="p">]:</span>
-</span><span id="__span-0-27"><a id="__codelineno-0-27" name="__codelineno-0-27"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-28"><a id="__codelineno-0-28" name="__codelineno-0-28"></a><span class="sd">    Build a tree from a linkage matrix.</span>
-</span><span id="__span-0-29"><a id="__codelineno-0-29" name="__codelineno-0-29"></a>
-</span><span id="__span-0-30"><a id="__codelineno-0-30" name="__codelineno-0-30"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-31"><a id="__codelineno-0-31" name="__codelineno-0-31"></a><span class="sd">        linked: The linkage matrix.</span>
-</span><span id="__span-0-32"><a id="__codelineno-0-32" name="__codelineno-0-32"></a><span class="sd">        leaves: The list of leaf nodes.</span>
-</span><span id="__span-0-33"><a id="__codelineno-0-33" name="__codelineno-0-33"></a>
-</span><span id="__span-0-34"><a id="__codelineno-0-34" name="__codelineno-0-34"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-35"><a id="__codelineno-0-35" name="__codelineno-0-35"></a><span class="sd">        A tuple containing the root of the tree, and the index of the next cluster to be merged.</span>
-</span><span id="__span-0-36"><a id="__codelineno-0-36" name="__codelineno-0-36"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-37"><a id="__codelineno-0-37" name="__codelineno-0-37"></a>
-</span><span id="__span-0-38"><a id="__codelineno-0-38" name="__codelineno-0-38"></a>    <span class="c1"># Base case: if there is only one cluster, return it as a leaf.</span>
-</span><span id="__span-0-39"><a id="__codelineno-0-39" name="__codelineno-0-39"></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">leaves</span><span class="p">)</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="__span-0-40"><a id="__codelineno-0-40" name="__codelineno-0-40"></a>        <span class="k">return</span> <span class="n">EdgeOccurrenceTree</span><span class="p">(</span><span class="n">cluster_id</span><span class="o">=</span><span class="n">leaves</span><span class="p">[</span><span class="mi">0</span><span class="p">]),</span> <span class="o">-</span><span class="mi">1</span>
-</span><span id="__span-0-41"><a id="__codelineno-0-41" name="__codelineno-0-41"></a>
-</span><span id="__span-0-42"><a id="__codelineno-0-42" name="__codelineno-0-42"></a>    <span class="c1"># Otherwise, build the tree recursively.</span>
-</span><span id="__span-0-43"><a id="__codelineno-0-43" name="__codelineno-0-43"></a>    <span class="n">root</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="p">()</span>
-</span><span id="__span-0-44"><a id="__codelineno-0-44" name="__codelineno-0-44"></a>    <span class="n">curr</span> <span class="o">=</span> <span class="n">root</span>
-</span><span id="__span-0-45"><a id="__codelineno-0-45" name="__codelineno-0-45"></a>    <span class="n">i</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">linked</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span>
-</span><span id="__span-0-46"><a id="__codelineno-0-46" name="__codelineno-0-46"></a>    <span class="k">while</span> <span class="n">i</span> <span class="o">&gt;</span> <span class="o">-</span><span class="mi">1</span><span class="p">:</span>
-</span><span id="__span-0-47"><a id="__codelineno-0-47" name="__codelineno-0-47"></a>        <span class="c1"># Linked contains 4 elements: cluster1, cluster2, distance, num_observations</span>
-</span><span id="__span-0-48"><a id="__codelineno-0-48" name="__codelineno-0-48"></a>        <span class="c1"># They represent the clusters that were merged, the distance between them, and</span>
-</span><span id="__span-0-49"><a id="__codelineno-0-49" name="__codelineno-0-49"></a>        <span class="c1"># the number of observations in the new cluster.</span>
-</span><span id="__span-0-50"><a id="__codelineno-0-50" name="__codelineno-0-50"></a>        <span class="n">c1</span><span class="p">,</span> <span class="n">c2</span><span class="p">,</span> <span class="n">_</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">linked</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
-</span><span id="__span-0-51"><a id="__codelineno-0-51" name="__codelineno-0-51"></a>
-</span><span id="__span-0-52"><a id="__codelineno-0-52" name="__codelineno-0-52"></a>        <span class="k">if</span> <span class="n">c1</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">leaves</span> <span class="ow">and</span> <span class="n">c2</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">leaves</span><span class="p">:</span>
-</span><span id="__span-0-53"><a id="__codelineno-0-53" name="__codelineno-0-53"></a>            <span class="n">curr</span><span class="o">.</span><span class="n">left</span><span class="p">,</span> <span class="n">i</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="o">.</span><span class="n">build_tree</span><span class="p">(</span><span class="n">linked</span><span class="p">[:</span><span class="n">i</span><span class="p">],</span> <span class="n">leaves</span><span class="p">)</span>
-</span><span id="__span-0-54"><a id="__codelineno-0-54" name="__codelineno-0-54"></a>            <span class="n">curr</span><span class="o">.</span><span class="n">right</span><span class="p">,</span> <span class="n">i</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="o">.</span><span class="n">build_tree</span><span class="p">(</span><span class="n">linked</span><span class="p">[:</span><span class="n">i</span><span class="p">],</span> <span class="n">leaves</span><span class="p">)</span>
-</span><span id="__span-0-55"><a id="__codelineno-0-55" name="__codelineno-0-55"></a>            <span class="k">break</span>
-</span><span id="__span-0-56"><a id="__codelineno-0-56" name="__codelineno-0-56"></a>        <span class="k">if</span> <span class="n">c1</span> <span class="ow">in</span> <span class="n">leaves</span><span class="p">:</span>
-</span><span id="__span-0-57"><a id="__codelineno-0-57" name="__codelineno-0-57"></a>            <span class="n">curr</span><span class="o">.</span><span class="n">left</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="p">(</span><span class="n">leaves</span><span class="o">.</span><span class="n">index</span><span class="p">(</span><span class="n">c1</span><span class="p">))</span>
-</span><span id="__span-0-58"><a id="__codelineno-0-58" name="__codelineno-0-58"></a>            <span class="n">curr</span><span class="o">.</span><span class="n">right</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="p">()</span>
-</span><span id="__span-0-59"><a id="__codelineno-0-59" name="__codelineno-0-59"></a>            <span class="n">curr</span> <span class="o">=</span> <span class="n">curr</span><span class="o">.</span><span class="n">right</span>
-</span><span id="__span-0-60"><a id="__codelineno-0-60" name="__codelineno-0-60"></a>        <span class="k">if</span> <span class="n">c2</span> <span class="ow">in</span> <span class="n">leaves</span><span class="p">:</span>
-</span><span id="__span-0-61"><a id="__codelineno-0-61" name="__codelineno-0-61"></a>            <span class="n">curr</span><span class="o">.</span><span class="n">right</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="p">(</span><span class="n">leaves</span><span class="o">.</span><span class="n">index</span><span class="p">(</span><span class="n">c2</span><span class="p">))</span>
-</span><span id="__span-0-62"><a id="__codelineno-0-62" name="__codelineno-0-62"></a>            <span class="k">break</span>
-</span><span id="__span-0-63"><a id="__codelineno-0-63" name="__codelineno-0-63"></a>        <span class="n">i</span> <span class="o">-=</span> <span class="mi">1</span>
-</span><span id="__span-0-64"><a id="__codelineno-0-64" name="__codelineno-0-64"></a>    <span class="n">root</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="o">.</span><span class="n">_cleanup_tree</span><span class="p">(</span><span class="n">root</span><span class="p">)</span>
-</span><span id="__span-0-65"><a id="__codelineno-0-65" name="__codelineno-0-65"></a>    <span class="k">return</span> <span class="n">root</span><span class="p">,</span> <span class="n">i</span>
+<span class="normal"><a href="#__codelineno-0-65">65</a></span>
+<span class="normal"><a href="#__codelineno-0-66">66</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-26"><a id="__codelineno-0-26" name="__codelineno-0-26"></a><span class="nd">@staticmethod</span>
+</span><span id="__span-0-27"><a id="__codelineno-0-27" name="__codelineno-0-27"></a><span class="k">def</span> <span class="nf">build_tree</span><span class="p">(</span><span class="n">linked</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">,</span> <span class="n">leaves</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">Self</span><span class="p">,</span> <span class="nb">int</span><span class="p">]:</span>
+</span><span id="__span-0-28"><a id="__codelineno-0-28" name="__codelineno-0-28"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-29"><a id="__codelineno-0-29" name="__codelineno-0-29"></a><span class="sd">    Build a tree from a linkage matrix.</span>
+</span><span id="__span-0-30"><a id="__codelineno-0-30" name="__codelineno-0-30"></a>
+</span><span id="__span-0-31"><a id="__codelineno-0-31" name="__codelineno-0-31"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-32"><a id="__codelineno-0-32" name="__codelineno-0-32"></a><span class="sd">        linked: The linkage matrix.</span>
+</span><span id="__span-0-33"><a id="__codelineno-0-33" name="__codelineno-0-33"></a><span class="sd">        leaves: The list of leaf nodes.</span>
+</span><span id="__span-0-34"><a id="__codelineno-0-34" name="__codelineno-0-34"></a>
+</span><span id="__span-0-35"><a id="__codelineno-0-35" name="__codelineno-0-35"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-36"><a id="__codelineno-0-36" name="__codelineno-0-36"></a><span class="sd">        A tuple containing the root of the tree, and the index of the next cluster to be merged.</span>
+</span><span id="__span-0-37"><a id="__codelineno-0-37" name="__codelineno-0-37"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-38"><a id="__codelineno-0-38" name="__codelineno-0-38"></a>
+</span><span id="__span-0-39"><a id="__codelineno-0-39" name="__codelineno-0-39"></a>    <span class="c1"># Base case: if there is only one cluster, return it as a leaf.</span>
+</span><span id="__span-0-40"><a id="__codelineno-0-40" name="__codelineno-0-40"></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">leaves</span><span class="p">)</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="__span-0-41"><a id="__codelineno-0-41" name="__codelineno-0-41"></a>        <span class="k">return</span> <span class="n">EdgeOccurrenceTree</span><span class="p">(</span><span class="n">cluster_id</span><span class="o">=</span><span class="n">leaves</span><span class="p">[</span><span class="mi">0</span><span class="p">]),</span> <span class="o">-</span><span class="mi">1</span>
+</span><span id="__span-0-42"><a id="__codelineno-0-42" name="__codelineno-0-42"></a>
+</span><span id="__span-0-43"><a id="__codelineno-0-43" name="__codelineno-0-43"></a>    <span class="c1"># Otherwise, build the tree recursively.</span>
+</span><span id="__span-0-44"><a id="__codelineno-0-44" name="__codelineno-0-44"></a>    <span class="n">root</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="p">()</span>
+</span><span id="__span-0-45"><a id="__codelineno-0-45" name="__codelineno-0-45"></a>    <span class="n">curr</span> <span class="o">=</span> <span class="n">root</span>
+</span><span id="__span-0-46"><a id="__codelineno-0-46" name="__codelineno-0-46"></a>    <span class="n">i</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">linked</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span>
+</span><span id="__span-0-47"><a id="__codelineno-0-47" name="__codelineno-0-47"></a>    <span class="k">while</span> <span class="n">i</span> <span class="o">&gt;</span> <span class="o">-</span><span class="mi">1</span><span class="p">:</span>
+</span><span id="__span-0-48"><a id="__codelineno-0-48" name="__codelineno-0-48"></a>        <span class="c1"># Linked contains 4 elements: cluster1, cluster2, distance, num_observations</span>
+</span><span id="__span-0-49"><a id="__codelineno-0-49" name="__codelineno-0-49"></a>        <span class="c1"># They represent the clusters that were merged, the distance between them, and</span>
+</span><span id="__span-0-50"><a id="__codelineno-0-50" name="__codelineno-0-50"></a>        <span class="c1"># the number of observations in the new cluster.</span>
+</span><span id="__span-0-51"><a id="__codelineno-0-51" name="__codelineno-0-51"></a>        <span class="n">c1</span><span class="p">,</span> <span class="n">c2</span><span class="p">,</span> <span class="n">_</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">linked</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
+</span><span id="__span-0-52"><a id="__codelineno-0-52" name="__codelineno-0-52"></a>
+</span><span id="__span-0-53"><a id="__codelineno-0-53" name="__codelineno-0-53"></a>        <span class="k">if</span> <span class="n">c1</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">leaves</span> <span class="ow">and</span> <span class="n">c2</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">leaves</span><span class="p">:</span>
+</span><span id="__span-0-54"><a id="__codelineno-0-54" name="__codelineno-0-54"></a>            <span class="n">curr</span><span class="o">.</span><span class="n">left</span><span class="p">,</span> <span class="n">i</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="o">.</span><span class="n">build_tree</span><span class="p">(</span><span class="n">linked</span><span class="p">[:</span><span class="n">i</span><span class="p">],</span> <span class="n">leaves</span><span class="p">)</span>
+</span><span id="__span-0-55"><a id="__codelineno-0-55" name="__codelineno-0-55"></a>            <span class="n">curr</span><span class="o">.</span><span class="n">right</span><span class="p">,</span> <span class="n">i</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="o">.</span><span class="n">build_tree</span><span class="p">(</span><span class="n">linked</span><span class="p">[:</span><span class="n">i</span><span class="p">],</span> <span class="n">leaves</span><span class="p">)</span>
+</span><span id="__span-0-56"><a id="__codelineno-0-56" name="__codelineno-0-56"></a>            <span class="k">break</span>
+</span><span id="__span-0-57"><a id="__codelineno-0-57" name="__codelineno-0-57"></a>        <span class="k">if</span> <span class="n">c1</span> <span class="ow">in</span> <span class="n">leaves</span><span class="p">:</span>
+</span><span id="__span-0-58"><a id="__codelineno-0-58" name="__codelineno-0-58"></a>            <span class="n">curr</span><span class="o">.</span><span class="n">left</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="p">(</span><span class="n">leaves</span><span class="o">.</span><span class="n">index</span><span class="p">(</span><span class="n">c1</span><span class="p">))</span>
+</span><span id="__span-0-59"><a id="__codelineno-0-59" name="__codelineno-0-59"></a>            <span class="n">curr</span><span class="o">.</span><span class="n">right</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="p">()</span>
+</span><span id="__span-0-60"><a id="__codelineno-0-60" name="__codelineno-0-60"></a>            <span class="n">curr</span> <span class="o">=</span> <span class="n">curr</span><span class="o">.</span><span class="n">right</span>
+</span><span id="__span-0-61"><a id="__codelineno-0-61" name="__codelineno-0-61"></a>        <span class="k">if</span> <span class="n">c2</span> <span class="ow">in</span> <span class="n">leaves</span><span class="p">:</span>
+</span><span id="__span-0-62"><a id="__codelineno-0-62" name="__codelineno-0-62"></a>            <span class="n">curr</span><span class="o">.</span><span class="n">right</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="p">(</span><span class="n">leaves</span><span class="o">.</span><span class="n">index</span><span class="p">(</span><span class="n">c2</span><span class="p">))</span>
+</span><span id="__span-0-63"><a id="__codelineno-0-63" name="__codelineno-0-63"></a>            <span class="k">break</span>
+</span><span id="__span-0-64"><a id="__codelineno-0-64" name="__codelineno-0-64"></a>        <span class="n">i</span> <span class="o">-=</span> <span class="mi">1</span>
+</span><span id="__span-0-65"><a id="__codelineno-0-65" name="__codelineno-0-65"></a>    <span class="n">root</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="o">.</span><span class="n">_cleanup_tree</span><span class="p">(</span><span class="n">root</span><span class="p">)</span>
+</span><span id="__span-0-66"><a id="__codelineno-0-66" name="__codelineno-0-66"></a>    <span class="k">return</span> <span class="n">root</span><span class="p">,</span> <span class="n">i</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -2172,7 +2378,7 @@ <h3 id="logos.edge_occurrence_tree.EdgeOccurrenceTree._cleanup_tree" class="doc
           <tr class="doc-section-item">
             <td><code>root</code></td>
             <td>
-                  <code><span title="typing.Optional">Optional</span>[<span title="typing.Self">Self</span>]</code>
+                  <code><span title="typing.Optional">Optional</span>[<span title="logos.types.Self">Self</span>]</code>
             </td>
             <td>
               <div class="doc-md-description">
@@ -2198,7 +2404,7 @@ <h3 id="logos.edge_occurrence_tree.EdgeOccurrenceTree._cleanup_tree" class="doc
       <tbody>
           <tr class="doc-section-item">
             <td>
-                  <code><span title="typing.Self">Self</span></code>
+                  <code><span title="logos.types.Self">Self</span></code>
             </td>
             <td>
               <div class="doc-md-description">
@@ -2211,8 +2417,7 @@ <h3 id="logos.edge_occurrence_tree.EdgeOccurrenceTree._cleanup_tree" class="doc
 
             <details class="quote">
               <summary>Source code in <code>src/logos/edge_occurrence_tree.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-67">67</a></span>
-<span class="normal"><a href="#__codelineno-0-68">68</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-68">68</a></span>
 <span class="normal"><a href="#__codelineno-0-69">69</a></span>
 <span class="normal"><a href="#__codelineno-0-70">70</a></span>
 <span class="normal"><a href="#__codelineno-0-71">71</a></span>
@@ -2241,37 +2446,38 @@ <h3 id="logos.edge_occurrence_tree.EdgeOccurrenceTree._cleanup_tree" class="doc
 <span class="normal"><a href="#__codelineno-0-94">94</a></span>
 <span class="normal"><a href="#__codelineno-0-95">95</a></span>
 <span class="normal"><a href="#__codelineno-0-96">96</a></span>
-<span class="normal"><a href="#__codelineno-0-97">97</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-67"><a id="__codelineno-0-67" name="__codelineno-0-67"></a><span class="nd">@staticmethod</span>
-</span><span id="__span-0-68"><a id="__codelineno-0-68" name="__codelineno-0-68"></a><span class="k">def</span> <span class="nf">_cleanup_tree</span><span class="p">(</span><span class="n">root</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">Self</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Self</span><span class="p">:</span>
-</span><span id="__span-0-69"><a id="__codelineno-0-69" name="__codelineno-0-69"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-70"><a id="__codelineno-0-70" name="__codelineno-0-70"></a><span class="sd">    Clean up the tree by removing nodes that have only one child, and nodes that have no</span>
-</span><span id="__span-0-71"><a id="__codelineno-0-71" name="__codelineno-0-71"></a><span class="sd">    children and are not leaves.</span>
-</span><span id="__span-0-72"><a id="__codelineno-0-72" name="__codelineno-0-72"></a>
-</span><span id="__span-0-73"><a id="__codelineno-0-73" name="__codelineno-0-73"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-74"><a id="__codelineno-0-74" name="__codelineno-0-74"></a><span class="sd">        root: The root of the tree.</span>
-</span><span id="__span-0-75"><a id="__codelineno-0-75" name="__codelineno-0-75"></a>
-</span><span id="__span-0-76"><a id="__codelineno-0-76" name="__codelineno-0-76"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-77"><a id="__codelineno-0-77" name="__codelineno-0-77"></a><span class="sd">        The root of the cleaned up tree.</span>
-</span><span id="__span-0-78"><a id="__codelineno-0-78" name="__codelineno-0-78"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-79"><a id="__codelineno-0-79" name="__codelineno-0-79"></a>
-</span><span id="__span-0-80"><a id="__codelineno-0-80" name="__codelineno-0-80"></a>    <span class="k">if</span> <span class="n">root</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-81"><a id="__codelineno-0-81" name="__codelineno-0-81"></a>        <span class="k">return</span> <span class="kc">None</span>
-</span><span id="__span-0-82"><a id="__codelineno-0-82" name="__codelineno-0-82"></a>
-</span><span id="__span-0-83"><a id="__codelineno-0-83" name="__codelineno-0-83"></a>    <span class="c1"># Recursively clean up left and right subtrees</span>
-</span><span id="__span-0-84"><a id="__codelineno-0-84" name="__codelineno-0-84"></a>    <span class="n">root</span><span class="o">.</span><span class="n">left</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="o">.</span><span class="n">_cleanup_tree</span><span class="p">(</span><span class="n">root</span><span class="o">.</span><span class="n">left</span><span class="p">)</span>
-</span><span id="__span-0-85"><a id="__codelineno-0-85" name="__codelineno-0-85"></a>    <span class="n">root</span><span class="o">.</span><span class="n">right</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="o">.</span><span class="n">_cleanup_tree</span><span class="p">(</span><span class="n">root</span><span class="o">.</span><span class="n">right</span><span class="p">)</span>
-</span><span id="__span-0-86"><a id="__codelineno-0-86" name="__codelineno-0-86"></a>
-</span><span id="__span-0-87"><a id="__codelineno-0-87" name="__codelineno-0-87"></a>    <span class="c1"># If the current node has only one child, replace the node with its child</span>
-</span><span id="__span-0-88"><a id="__codelineno-0-88" name="__codelineno-0-88"></a>    <span class="k">if</span> <span class="n">root</span><span class="o">.</span><span class="n">left</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">root</span><span class="o">.</span><span class="n">right</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-89"><a id="__codelineno-0-89" name="__codelineno-0-89"></a>        <span class="k">return</span> <span class="n">root</span><span class="o">.</span><span class="n">right</span>
-</span><span id="__span-0-90"><a id="__codelineno-0-90" name="__codelineno-0-90"></a>    <span class="k">elif</span> <span class="n">root</span><span class="o">.</span><span class="n">left</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">root</span><span class="o">.</span><span class="n">right</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-91"><a id="__codelineno-0-91" name="__codelineno-0-91"></a>        <span class="k">return</span> <span class="n">root</span><span class="o">.</span><span class="n">left</span>
-</span><span id="__span-0-92"><a id="__codelineno-0-92" name="__codelineno-0-92"></a>
-</span><span id="__span-0-93"><a id="__codelineno-0-93" name="__codelineno-0-93"></a>    <span class="c1"># If the current node has no left and right child and is not a leaf, remove the node</span>
-</span><span id="__span-0-94"><a id="__codelineno-0-94" name="__codelineno-0-94"></a>    <span class="k">if</span> <span class="n">root</span><span class="o">.</span><span class="n">left</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">root</span><span class="o">.</span><span class="n">right</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">root</span><span class="o">.</span><span class="n">cluster_id</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-95"><a id="__codelineno-0-95" name="__codelineno-0-95"></a>        <span class="k">return</span> <span class="kc">None</span>
-</span><span id="__span-0-96"><a id="__codelineno-0-96" name="__codelineno-0-96"></a>
-</span><span id="__span-0-97"><a id="__codelineno-0-97" name="__codelineno-0-97"></a>    <span class="k">return</span> <span class="n">root</span>
+<span class="normal"><a href="#__codelineno-0-97">97</a></span>
+<span class="normal"><a href="#__codelineno-0-98">98</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-68"><a id="__codelineno-0-68" name="__codelineno-0-68"></a><span class="nd">@staticmethod</span>
+</span><span id="__span-0-69"><a id="__codelineno-0-69" name="__codelineno-0-69"></a><span class="k">def</span> <span class="nf">_cleanup_tree</span><span class="p">(</span><span class="n">root</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">Self</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Self</span><span class="p">:</span>
+</span><span id="__span-0-70"><a id="__codelineno-0-70" name="__codelineno-0-70"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-71"><a id="__codelineno-0-71" name="__codelineno-0-71"></a><span class="sd">    Clean up the tree by removing nodes that have only one child, and nodes that have no</span>
+</span><span id="__span-0-72"><a id="__codelineno-0-72" name="__codelineno-0-72"></a><span class="sd">    children and are not leaves.</span>
+</span><span id="__span-0-73"><a id="__codelineno-0-73" name="__codelineno-0-73"></a>
+</span><span id="__span-0-74"><a id="__codelineno-0-74" name="__codelineno-0-74"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-75"><a id="__codelineno-0-75" name="__codelineno-0-75"></a><span class="sd">        root: The root of the tree.</span>
+</span><span id="__span-0-76"><a id="__codelineno-0-76" name="__codelineno-0-76"></a>
+</span><span id="__span-0-77"><a id="__codelineno-0-77" name="__codelineno-0-77"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-78"><a id="__codelineno-0-78" name="__codelineno-0-78"></a><span class="sd">        The root of the cleaned up tree.</span>
+</span><span id="__span-0-79"><a id="__codelineno-0-79" name="__codelineno-0-79"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-80"><a id="__codelineno-0-80" name="__codelineno-0-80"></a>
+</span><span id="__span-0-81"><a id="__codelineno-0-81" name="__codelineno-0-81"></a>    <span class="k">if</span> <span class="n">root</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-82"><a id="__codelineno-0-82" name="__codelineno-0-82"></a>        <span class="k">return</span> <span class="kc">None</span>
+</span><span id="__span-0-83"><a id="__codelineno-0-83" name="__codelineno-0-83"></a>
+</span><span id="__span-0-84"><a id="__codelineno-0-84" name="__codelineno-0-84"></a>    <span class="c1"># Recursively clean up left and right subtrees</span>
+</span><span id="__span-0-85"><a id="__codelineno-0-85" name="__codelineno-0-85"></a>    <span class="n">root</span><span class="o">.</span><span class="n">left</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="o">.</span><span class="n">_cleanup_tree</span><span class="p">(</span><span class="n">root</span><span class="o">.</span><span class="n">left</span><span class="p">)</span>
+</span><span id="__span-0-86"><a id="__codelineno-0-86" name="__codelineno-0-86"></a>    <span class="n">root</span><span class="o">.</span><span class="n">right</span> <span class="o">=</span> <span class="n">EdgeOccurrenceTree</span><span class="o">.</span><span class="n">_cleanup_tree</span><span class="p">(</span><span class="n">root</span><span class="o">.</span><span class="n">right</span><span class="p">)</span>
+</span><span id="__span-0-87"><a id="__codelineno-0-87" name="__codelineno-0-87"></a>
+</span><span id="__span-0-88"><a id="__codelineno-0-88" name="__codelineno-0-88"></a>    <span class="c1"># If the current node has only one child, replace the node with its child</span>
+</span><span id="__span-0-89"><a id="__codelineno-0-89" name="__codelineno-0-89"></a>    <span class="k">if</span> <span class="n">root</span><span class="o">.</span><span class="n">left</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">root</span><span class="o">.</span><span class="n">right</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-90"><a id="__codelineno-0-90" name="__codelineno-0-90"></a>        <span class="k">return</span> <span class="n">root</span><span class="o">.</span><span class="n">right</span>
+</span><span id="__span-0-91"><a id="__codelineno-0-91" name="__codelineno-0-91"></a>    <span class="k">elif</span> <span class="n">root</span><span class="o">.</span><span class="n">left</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">root</span><span class="o">.</span><span class="n">right</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-92"><a id="__codelineno-0-92" name="__codelineno-0-92"></a>        <span class="k">return</span> <span class="n">root</span><span class="o">.</span><span class="n">left</span>
+</span><span id="__span-0-93"><a id="__codelineno-0-93" name="__codelineno-0-93"></a>
+</span><span id="__span-0-94"><a id="__codelineno-0-94" name="__codelineno-0-94"></a>    <span class="c1"># If the current node has no left and right child and is not a leaf, remove the node</span>
+</span><span id="__span-0-95"><a id="__codelineno-0-95" name="__codelineno-0-95"></a>    <span class="k">if</span> <span class="n">root</span><span class="o">.</span><span class="n">left</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">root</span><span class="o">.</span><span class="n">right</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">root</span><span class="o">.</span><span class="n">cluster_id</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-96"><a id="__codelineno-0-96" name="__codelineno-0-96"></a>        <span class="k">return</span> <span class="kc">None</span>
+</span><span id="__span-0-97"><a id="__codelineno-0-97" name="__codelineno-0-97"></a>
+</span><span id="__span-0-98"><a id="__codelineno-0-98" name="__codelineno-0-98"></a>    <span class="k">return</span> <span class="n">root</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -2322,8 +2528,7 @@ <h3 id="logos.edge_occurrence_tree.EdgeOccurrenceTree.print_tree" class="doc doc
 
             <details class="quote">
               <summary>Source code in <code>src/logos/edge_occurrence_tree.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-99"> 99</a></span>
-<span class="normal"><a href="#__codelineno-0-100">100</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-100">100</a></span>
 <span class="normal"><a href="#__codelineno-0-101">101</a></span>
 <span class="normal"><a href="#__codelineno-0-102">102</a></span>
 <span class="normal"><a href="#__codelineno-0-103">103</a></span>
@@ -2340,25 +2545,26 @@ <h3 id="logos.edge_occurrence_tree.EdgeOccurrenceTree.print_tree" class="doc doc
 <span class="normal"><a href="#__codelineno-0-114">114</a></span>
 <span class="normal"><a href="#__codelineno-0-115">115</a></span>
 <span class="normal"><a href="#__codelineno-0-116">116</a></span>
-<span class="normal"><a href="#__codelineno-0-117">117</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-99"><a id="__codelineno-0-99" name="__codelineno-0-99"></a><span class="k">def</span> <span class="nf">print_tree</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">depth</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">0</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-100"><a id="__codelineno-0-100" name="__codelineno-0-100"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-101"><a id="__codelineno-0-101" name="__codelineno-0-101"></a><span class="sd">    Print the tree in a readable format.</span>
-</span><span id="__span-0-102"><a id="__codelineno-0-102" name="__codelineno-0-102"></a>
-</span><span id="__span-0-103"><a id="__codelineno-0-103" name="__codelineno-0-103"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-104"><a id="__codelineno-0-104" name="__codelineno-0-104"></a><span class="sd">        depth: The depth of the current node in the tree.</span>
-</span><span id="__span-0-105"><a id="__codelineno-0-105" name="__codelineno-0-105"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-106"><a id="__codelineno-0-106" name="__codelineno-0-106"></a>
-</span><span id="__span-0-107"><a id="__codelineno-0-107" name="__codelineno-0-107"></a>    <span class="n">prefix</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-108"><a id="__codelineno-0-108" name="__codelineno-0-108"></a>    <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">depth</span><span class="p">):</span>
-</span><span id="__span-0-109"><a id="__codelineno-0-109" name="__codelineno-0-109"></a>        <span class="n">prefix</span> <span class="o">+=</span> <span class="s2">&quot;-&quot;</span>
-</span><span id="__span-0-110"><a id="__codelineno-0-110" name="__codelineno-0-110"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-111"><a id="__codelineno-0-111" name="__codelineno-0-111"></a>        <span class="nb">print</span><span class="p">(</span><span class="n">prefix</span> <span class="o">+</span> <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span><span class="p">))</span>
-</span><span id="__span-0-112"><a id="__codelineno-0-112" name="__codelineno-0-112"></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-113"><a id="__codelineno-0-113" name="__codelineno-0-113"></a>        <span class="nb">print</span><span class="p">(</span><span class="n">prefix</span> <span class="o">+</span> <span class="s2">&quot;node&quot;</span><span class="p">)</span>
-</span><span id="__span-0-114"><a id="__codelineno-0-114" name="__codelineno-0-114"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="p">:</span>
-</span><span id="__span-0-115"><a id="__codelineno-0-115" name="__codelineno-0-115"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">print_tree</span><span class="p">(</span><span class="n">depth</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
-</span><span id="__span-0-116"><a id="__codelineno-0-116" name="__codelineno-0-116"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
-</span><span id="__span-0-117"><a id="__codelineno-0-117" name="__codelineno-0-117"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">print_tree</span><span class="p">(</span><span class="n">depth</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-117">117</a></span>
+<span class="normal"><a href="#__codelineno-0-118">118</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-100"><a id="__codelineno-0-100" name="__codelineno-0-100"></a><span class="k">def</span> <span class="nf">print_tree</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">depth</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">0</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-101"><a id="__codelineno-0-101" name="__codelineno-0-101"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-102"><a id="__codelineno-0-102" name="__codelineno-0-102"></a><span class="sd">    Print the tree in a readable format.</span>
+</span><span id="__span-0-103"><a id="__codelineno-0-103" name="__codelineno-0-103"></a>
+</span><span id="__span-0-104"><a id="__codelineno-0-104" name="__codelineno-0-104"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-105"><a id="__codelineno-0-105" name="__codelineno-0-105"></a><span class="sd">        depth: The depth of the current node in the tree.</span>
+</span><span id="__span-0-106"><a id="__codelineno-0-106" name="__codelineno-0-106"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-107"><a id="__codelineno-0-107" name="__codelineno-0-107"></a>
+</span><span id="__span-0-108"><a id="__codelineno-0-108" name="__codelineno-0-108"></a>    <span class="n">prefix</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-109"><a id="__codelineno-0-109" name="__codelineno-0-109"></a>    <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">depth</span><span class="p">):</span>
+</span><span id="__span-0-110"><a id="__codelineno-0-110" name="__codelineno-0-110"></a>        <span class="n">prefix</span> <span class="o">+=</span> <span class="s2">&quot;-&quot;</span>
+</span><span id="__span-0-111"><a id="__codelineno-0-111" name="__codelineno-0-111"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-112"><a id="__codelineno-0-112" name="__codelineno-0-112"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="n">prefix</span> <span class="o">+</span> <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span><span class="p">))</span>
+</span><span id="__span-0-113"><a id="__codelineno-0-113" name="__codelineno-0-113"></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-114"><a id="__codelineno-0-114" name="__codelineno-0-114"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="n">prefix</span> <span class="o">+</span> <span class="s2">&quot;node&quot;</span><span class="p">)</span>
+</span><span id="__span-0-115"><a id="__codelineno-0-115" name="__codelineno-0-115"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="p">:</span>
+</span><span id="__span-0-116"><a id="__codelineno-0-116" name="__codelineno-0-116"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">print_tree</span><span class="p">(</span><span class="n">depth</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="__span-0-117"><a id="__codelineno-0-117" name="__codelineno-0-117"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
+</span><span id="__span-0-118"><a id="__codelineno-0-118" name="__codelineno-0-118"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">print_tree</span><span class="p">(</span><span class="n">depth</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -2409,8 +2615,7 @@ <h3 id="logos.edge_occurrence_tree.EdgeOccurrenceTree.assign_dags_to_nodes" clas
 
             <details class="quote">
               <summary>Source code in <code>src/logos/edge_occurrence_tree.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-119">119</a></span>
-<span class="normal"><a href="#__codelineno-0-120">120</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-120">120</a></span>
 <span class="normal"><a href="#__codelineno-0-121">121</a></span>
 <span class="normal"><a href="#__codelineno-0-122">122</a></span>
 <span class="normal"><a href="#__codelineno-0-123">123</a></span>
@@ -2433,31 +2638,32 @@ <h3 id="logos.edge_occurrence_tree.EdgeOccurrenceTree.assign_dags_to_nodes" clas
 <span class="normal"><a href="#__codelineno-0-140">140</a></span>
 <span class="normal"><a href="#__codelineno-0-141">141</a></span>
 <span class="normal"><a href="#__codelineno-0-142">142</a></span>
-<span class="normal"><a href="#__codelineno-0-143">143</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-119"><a id="__codelineno-0-119" name="__codelineno-0-119"></a><span class="k">def</span> <span class="nf">assign_dags_to_nodes</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">cluster_mapping</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="n">nx</span><span class="o">.</span><span class="n">DiGraph</span><span class="p">,</span> <span class="nb">int</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-120"><a id="__codelineno-0-120" name="__codelineno-0-120"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-121"><a id="__codelineno-0-121" name="__codelineno-0-121"></a><span class="sd">    Assign each DAG to the node it belongs to, based on `cluster_mapping`.</span>
-</span><span id="__span-0-122"><a id="__codelineno-0-122" name="__codelineno-0-122"></a>
-</span><span id="__span-0-123"><a id="__codelineno-0-123" name="__codelineno-0-123"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-124"><a id="__codelineno-0-124" name="__codelineno-0-124"></a><span class="sd">        cluster_mapping: A dictionary mapping DAGs to cluster id&#39;s.</span>
-</span><span id="__span-0-125"><a id="__codelineno-0-125" name="__codelineno-0-125"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-126"><a id="__codelineno-0-126" name="__codelineno-0-126"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="__span-0-127"><a id="__codelineno-0-127" name="__codelineno-0-127"></a>
-</span><span id="__span-0-128"><a id="__codelineno-0-128" name="__codelineno-0-128"></a>    <span class="c1"># If leaf, assign DAGs and set count.</span>
-</span><span id="__span-0-129"><a id="__codelineno-0-129" name="__codelineno-0-129"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-130"><a id="__codelineno-0-130" name="__codelineno-0-130"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dags</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="__span-0-131"><a id="__codelineno-0-131" name="__codelineno-0-131"></a>            <span class="n">key</span>
-</span><span id="__span-0-132"><a id="__codelineno-0-132" name="__codelineno-0-132"></a>            <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="n">cluster_mapping</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span>
-</span><span id="__span-0-133"><a id="__codelineno-0-133" name="__codelineno-0-133"></a>            <span class="k">if</span> <span class="n">cluster_mapping</span><span class="p">[</span><span class="n">key</span><span class="p">]</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span>
-</span><span id="__span-0-134"><a id="__codelineno-0-134" name="__codelineno-0-134"></a>        <span class="p">]</span>
-</span><span id="__span-0-135"><a id="__codelineno-0-135" name="__codelineno-0-135"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dags</span><span class="p">)</span>
-</span><span id="__span-0-136"><a id="__codelineno-0-136" name="__codelineno-0-136"></a>
-</span><span id="__span-0-137"><a id="__codelineno-0-137" name="__codelineno-0-137"></a>    <span class="c1"># Otherwise, recurse for children and retireve counts.</span>
-</span><span id="__span-0-138"><a id="__codelineno-0-138" name="__codelineno-0-138"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="p">:</span>
-</span><span id="__span-0-139"><a id="__codelineno-0-139" name="__codelineno-0-139"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">assign_dags_to_nodes</span><span class="p">(</span><span class="n">cluster_mapping</span><span class="p">)</span>
-</span><span id="__span-0-140"><a id="__codelineno-0-140" name="__codelineno-0-140"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">num_dags</span>
-</span><span id="__span-0-141"><a id="__codelineno-0-141" name="__codelineno-0-141"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
-</span><span id="__span-0-142"><a id="__codelineno-0-142" name="__codelineno-0-142"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">assign_dags_to_nodes</span><span class="p">(</span><span class="n">cluster_mapping</span><span class="p">)</span>
-</span><span id="__span-0-143"><a id="__codelineno-0-143" name="__codelineno-0-143"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">num_dags</span>
+<span class="normal"><a href="#__codelineno-0-143">143</a></span>
+<span class="normal"><a href="#__codelineno-0-144">144</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-120"><a id="__codelineno-0-120" name="__codelineno-0-120"></a><span class="k">def</span> <span class="nf">assign_dags_to_nodes</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">cluster_mapping</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="n">nx</span><span class="o">.</span><span class="n">DiGraph</span><span class="p">,</span> <span class="nb">int</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-121"><a id="__codelineno-0-121" name="__codelineno-0-121"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-122"><a id="__codelineno-0-122" name="__codelineno-0-122"></a><span class="sd">    Assign each DAG to the node it belongs to, based on `cluster_mapping`.</span>
+</span><span id="__span-0-123"><a id="__codelineno-0-123" name="__codelineno-0-123"></a>
+</span><span id="__span-0-124"><a id="__codelineno-0-124" name="__codelineno-0-124"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-125"><a id="__codelineno-0-125" name="__codelineno-0-125"></a><span class="sd">        cluster_mapping: A dictionary mapping DAGs to cluster id&#39;s.</span>
+</span><span id="__span-0-126"><a id="__codelineno-0-126" name="__codelineno-0-126"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-127"><a id="__codelineno-0-127" name="__codelineno-0-127"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="__span-0-128"><a id="__codelineno-0-128" name="__codelineno-0-128"></a>
+</span><span id="__span-0-129"><a id="__codelineno-0-129" name="__codelineno-0-129"></a>    <span class="c1"># If leaf, assign DAGs and set count.</span>
+</span><span id="__span-0-130"><a id="__codelineno-0-130" name="__codelineno-0-130"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-131"><a id="__codelineno-0-131" name="__codelineno-0-131"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dags</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="__span-0-132"><a id="__codelineno-0-132" name="__codelineno-0-132"></a>            <span class="n">key</span>
+</span><span id="__span-0-133"><a id="__codelineno-0-133" name="__codelineno-0-133"></a>            <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="n">cluster_mapping</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span>
+</span><span id="__span-0-134"><a id="__codelineno-0-134" name="__codelineno-0-134"></a>            <span class="k">if</span> <span class="n">cluster_mapping</span><span class="p">[</span><span class="n">key</span><span class="p">]</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span>
+</span><span id="__span-0-135"><a id="__codelineno-0-135" name="__codelineno-0-135"></a>        <span class="p">]</span>
+</span><span id="__span-0-136"><a id="__codelineno-0-136" name="__codelineno-0-136"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dags</span><span class="p">)</span>
+</span><span id="__span-0-137"><a id="__codelineno-0-137" name="__codelineno-0-137"></a>
+</span><span id="__span-0-138"><a id="__codelineno-0-138" name="__codelineno-0-138"></a>    <span class="c1"># Otherwise, recurse for children and retireve counts.</span>
+</span><span id="__span-0-139"><a id="__codelineno-0-139" name="__codelineno-0-139"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="p">:</span>
+</span><span id="__span-0-140"><a id="__codelineno-0-140" name="__codelineno-0-140"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">assign_dags_to_nodes</span><span class="p">(</span><span class="n">cluster_mapping</span><span class="p">)</span>
+</span><span id="__span-0-141"><a id="__codelineno-0-141" name="__codelineno-0-141"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">num_dags</span>
+</span><span id="__span-0-142"><a id="__codelineno-0-142" name="__codelineno-0-142"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
+</span><span id="__span-0-143"><a id="__codelineno-0-143" name="__codelineno-0-143"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">assign_dags_to_nodes</span><span class="p">(</span><span class="n">cluster_mapping</span><span class="p">)</span>
+</span><span id="__span-0-144"><a id="__codelineno-0-144" name="__codelineno-0-144"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">num_dags</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -2538,8 +2744,7 @@ <h3 id="logos.edge_occurrence_tree.EdgeOccurrenceTree.count_edge_occurrences" cl
 
             <details class="quote">
               <summary>Source code in <code>src/logos/edge_occurrence_tree.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-145">145</a></span>
-<span class="normal"><a href="#__codelineno-0-146">146</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-146">146</a></span>
 <span class="normal"><a href="#__codelineno-0-147">147</a></span>
 <span class="normal"><a href="#__codelineno-0-148">148</a></span>
 <span class="normal"><a href="#__codelineno-0-149">149</a></span>
@@ -2580,49 +2785,50 @@ <h3 id="logos.edge_occurrence_tree.EdgeOccurrenceTree.count_edge_occurrences" cl
 <span class="normal"><a href="#__codelineno-0-184">184</a></span>
 <span class="normal"><a href="#__codelineno-0-185">185</a></span>
 <span class="normal"><a href="#__codelineno-0-186">186</a></span>
-<span class="normal"><a href="#__codelineno-0-187">187</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-145"><a id="__codelineno-0-145" name="__codelineno-0-145"></a><span class="k">def</span> <span class="nf">count_edge_occurrences</span><span class="p">(</span>
-</span><span id="__span-0-146"><a id="__codelineno-0-146" name="__codelineno-0-146"></a>    <span class="bp">self</span><span class="p">,</span> <span class="n">treatment</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">outcome</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">dag</span><span class="p">:</span> <span class="n">nx</span><span class="o">.</span><span class="n">DiGraph</span>
-</span><span id="__span-0-147"><a id="__codelineno-0-147" name="__codelineno-0-147"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-148"><a id="__codelineno-0-148" name="__codelineno-0-148"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-149"><a id="__codelineno-0-149" name="__codelineno-0-149"></a><span class="sd">    Recursively count the number of times each edge occurs amongst the DAGs</span>
-</span><span id="__span-0-150"><a id="__codelineno-0-150" name="__codelineno-0-150"></a><span class="sd">    assigned to all the children of this node, omitting the edge from treatment -&gt; outcome,</span>
-</span><span id="__span-0-151"><a id="__codelineno-0-151" name="__codelineno-0-151"></a><span class="sd">    since this always exists. If a DAG is passed in, ignore the edges in that DAG as well.</span>
-</span><span id="__span-0-152"><a id="__codelineno-0-152" name="__codelineno-0-152"></a>
-</span><span id="__span-0-153"><a id="__codelineno-0-153" name="__codelineno-0-153"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-154"><a id="__codelineno-0-154" name="__codelineno-0-154"></a><span class="sd">        treatment: The treatment variable.</span>
-</span><span id="__span-0-155"><a id="__codelineno-0-155" name="__codelineno-0-155"></a><span class="sd">        outcome: The outcome variable.</span>
-</span><span id="__span-0-156"><a id="__codelineno-0-156" name="__codelineno-0-156"></a><span class="sd">        dag: The optional dag structure to ignore.</span>
-</span><span id="__span-0-157"><a id="__codelineno-0-157" name="__codelineno-0-157"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-158"><a id="__codelineno-0-158" name="__codelineno-0-158"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">:</span> <span class="n">Types</span><span class="o">.</span><span class="n">EdgeCountDict</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">int</span><span class="p">)</span>
-</span><span id="__span-0-159"><a id="__codelineno-0-159" name="__codelineno-0-159"></a>
-</span><span id="__span-0-160"><a id="__codelineno-0-160" name="__codelineno-0-160"></a>    <span class="c1"># If leaf, actually compute count.</span>
-</span><span id="__span-0-161"><a id="__codelineno-0-161" name="__codelineno-0-161"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-162"><a id="__codelineno-0-162" name="__codelineno-0-162"></a>        <span class="n">edges_to_ignore</span> <span class="o">=</span> <span class="p">[(</span><span class="n">treatment</span><span class="p">,</span> <span class="n">outcome</span><span class="p">)]</span>
-</span><span id="__span-0-163"><a id="__codelineno-0-163" name="__codelineno-0-163"></a>        <span class="k">if</span> <span class="n">dag</span><span class="p">:</span>
-</span><span id="__span-0-164"><a id="__codelineno-0-164" name="__codelineno-0-164"></a>            <span class="n">edges_to_ignore</span><span class="o">.</span><span class="n">extend</span><span class="p">(</span><span class="n">dag</span><span class="o">.</span><span class="n">edges</span><span class="p">)</span>
-</span><span id="__span-0-165"><a id="__codelineno-0-165" name="__codelineno-0-165"></a>        <span class="k">for</span> <span class="n">graph</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dags</span><span class="p">:</span>
-</span><span id="__span-0-166"><a id="__codelineno-0-166" name="__codelineno-0-166"></a>            <span class="k">for</span> <span class="n">edge</span> <span class="ow">in</span> <span class="n">graph</span><span class="o">.</span><span class="n">edges</span><span class="p">:</span>
-</span><span id="__span-0-167"><a id="__codelineno-0-167" name="__codelineno-0-167"></a>                <span class="k">if</span> <span class="n">edge</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">edges_to_ignore</span><span class="p">:</span>
-</span><span id="__span-0-168"><a id="__codelineno-0-168" name="__codelineno-0-168"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="__span-0-169"><a id="__codelineno-0-169" name="__codelineno-0-169"></a>
-</span><span id="__span-0-170"><a id="__codelineno-0-170" name="__codelineno-0-170"></a>    <span class="c1"># Otherwise, derive counts from children.</span>
-</span><span id="__span-0-171"><a id="__codelineno-0-171" name="__codelineno-0-171"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="p">:</span>
-</span><span id="__span-0-172"><a id="__codelineno-0-172" name="__codelineno-0-172"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">count_edge_occurrences</span><span class="p">(</span><span class="n">treatment</span><span class="p">,</span> <span class="n">outcome</span><span class="p">,</span> <span class="n">dag</span><span class="p">)</span>
-</span><span id="__span-0-173"><a id="__codelineno-0-173" name="__codelineno-0-173"></a>        <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">edge_counts</span><span class="o">.</span><span class="n">keys</span><span class="p">():</span>
-</span><span id="__span-0-174"><a id="__codelineno-0-174" name="__codelineno-0-174"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">[</span><span class="n">key</span><span class="p">]</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">[</span><span class="n">key</span><span class="p">]</span>
-</span><span id="__span-0-175"><a id="__codelineno-0-175" name="__codelineno-0-175"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
-</span><span id="__span-0-176"><a id="__codelineno-0-176" name="__codelineno-0-176"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">count_edge_occurrences</span><span class="p">(</span><span class="n">treatment</span><span class="p">,</span> <span class="n">outcome</span><span class="p">,</span> <span class="n">dag</span><span class="p">)</span>
-</span><span id="__span-0-177"><a id="__codelineno-0-177" name="__codelineno-0-177"></a>        <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">edge_counts</span><span class="o">.</span><span class="n">keys</span><span class="p">():</span>
-</span><span id="__span-0-178"><a id="__codelineno-0-178" name="__codelineno-0-178"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">[</span><span class="n">key</span><span class="p">]</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">[</span><span class="n">key</span><span class="p">]</span>
-</span><span id="__span-0-179"><a id="__codelineno-0-179" name="__codelineno-0-179"></a>
-</span><span id="__span-0-180"><a id="__codelineno-0-180" name="__codelineno-0-180"></a>    <span class="c1"># Compute statistics.</span>
-</span><span id="__span-0-181"><a id="__codelineno-0-181" name="__codelineno-0-181"></a>    <span class="n">freq_counts</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="o">.</span><span class="n">values</span><span class="p">())</span>
-</span><span id="__span-0-182"><a id="__codelineno-0-182" name="__codelineno-0-182"></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">freq_counts</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-183"><a id="__codelineno-0-183" name="__codelineno-0-183"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">mean</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-184"><a id="__codelineno-0-184" name="__codelineno-0-184"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">std_dev</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-185"><a id="__codelineno-0-185" name="__codelineno-0-185"></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-186"><a id="__codelineno-0-186" name="__codelineno-0-186"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">mean</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">freq_counts</span><span class="p">)</span>
-</span><span id="__span-0-187"><a id="__codelineno-0-187" name="__codelineno-0-187"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">std_dev</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">freq_counts</span><span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-187">187</a></span>
+<span class="normal"><a href="#__codelineno-0-188">188</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-146"><a id="__codelineno-0-146" name="__codelineno-0-146"></a><span class="k">def</span> <span class="nf">count_edge_occurrences</span><span class="p">(</span>
+</span><span id="__span-0-147"><a id="__codelineno-0-147" name="__codelineno-0-147"></a>    <span class="bp">self</span><span class="p">,</span> <span class="n">treatment</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">outcome</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">dag</span><span class="p">:</span> <span class="n">nx</span><span class="o">.</span><span class="n">DiGraph</span>
+</span><span id="__span-0-148"><a id="__codelineno-0-148" name="__codelineno-0-148"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-149"><a id="__codelineno-0-149" name="__codelineno-0-149"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-150"><a id="__codelineno-0-150" name="__codelineno-0-150"></a><span class="sd">    Recursively count the number of times each edge occurs amongst the DAGs</span>
+</span><span id="__span-0-151"><a id="__codelineno-0-151" name="__codelineno-0-151"></a><span class="sd">    assigned to all the children of this node, omitting the edge from treatment -&gt; outcome,</span>
+</span><span id="__span-0-152"><a id="__codelineno-0-152" name="__codelineno-0-152"></a><span class="sd">    since this always exists. If a DAG is passed in, ignore the edges in that DAG as well.</span>
+</span><span id="__span-0-153"><a id="__codelineno-0-153" name="__codelineno-0-153"></a>
+</span><span id="__span-0-154"><a id="__codelineno-0-154" name="__codelineno-0-154"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-155"><a id="__codelineno-0-155" name="__codelineno-0-155"></a><span class="sd">        treatment: The treatment variable.</span>
+</span><span id="__span-0-156"><a id="__codelineno-0-156" name="__codelineno-0-156"></a><span class="sd">        outcome: The outcome variable.</span>
+</span><span id="__span-0-157"><a id="__codelineno-0-157" name="__codelineno-0-157"></a><span class="sd">        dag: The optional dag structure to ignore.</span>
+</span><span id="__span-0-158"><a id="__codelineno-0-158" name="__codelineno-0-158"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-159"><a id="__codelineno-0-159" name="__codelineno-0-159"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">:</span> <span class="n">Types</span><span class="o">.</span><span class="n">EdgeCountDict</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="__span-0-160"><a id="__codelineno-0-160" name="__codelineno-0-160"></a>
+</span><span id="__span-0-161"><a id="__codelineno-0-161" name="__codelineno-0-161"></a>    <span class="c1"># If leaf, actually compute count.</span>
+</span><span id="__span-0-162"><a id="__codelineno-0-162" name="__codelineno-0-162"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-163"><a id="__codelineno-0-163" name="__codelineno-0-163"></a>        <span class="n">edges_to_ignore</span> <span class="o">=</span> <span class="p">[(</span><span class="n">treatment</span><span class="p">,</span> <span class="n">outcome</span><span class="p">)]</span>
+</span><span id="__span-0-164"><a id="__codelineno-0-164" name="__codelineno-0-164"></a>        <span class="k">if</span> <span class="n">dag</span><span class="p">:</span>
+</span><span id="__span-0-165"><a id="__codelineno-0-165" name="__codelineno-0-165"></a>            <span class="n">edges_to_ignore</span><span class="o">.</span><span class="n">extend</span><span class="p">(</span><span class="n">dag</span><span class="o">.</span><span class="n">edges</span><span class="p">)</span>
+</span><span id="__span-0-166"><a id="__codelineno-0-166" name="__codelineno-0-166"></a>        <span class="k">for</span> <span class="n">graph</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dags</span><span class="p">:</span>
+</span><span id="__span-0-167"><a id="__codelineno-0-167" name="__codelineno-0-167"></a>            <span class="k">for</span> <span class="n">edge</span> <span class="ow">in</span> <span class="n">graph</span><span class="o">.</span><span class="n">edges</span><span class="p">:</span>
+</span><span id="__span-0-168"><a id="__codelineno-0-168" name="__codelineno-0-168"></a>                <span class="k">if</span> <span class="n">edge</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">edges_to_ignore</span><span class="p">:</span>
+</span><span id="__span-0-169"><a id="__codelineno-0-169" name="__codelineno-0-169"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="__span-0-170"><a id="__codelineno-0-170" name="__codelineno-0-170"></a>
+</span><span id="__span-0-171"><a id="__codelineno-0-171" name="__codelineno-0-171"></a>    <span class="c1"># Otherwise, derive counts from children.</span>
+</span><span id="__span-0-172"><a id="__codelineno-0-172" name="__codelineno-0-172"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="p">:</span>
+</span><span id="__span-0-173"><a id="__codelineno-0-173" name="__codelineno-0-173"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">count_edge_occurrences</span><span class="p">(</span><span class="n">treatment</span><span class="p">,</span> <span class="n">outcome</span><span class="p">,</span> <span class="n">dag</span><span class="p">)</span>
+</span><span id="__span-0-174"><a id="__codelineno-0-174" name="__codelineno-0-174"></a>        <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">edge_counts</span><span class="o">.</span><span class="n">keys</span><span class="p">():</span>
+</span><span id="__span-0-175"><a id="__codelineno-0-175" name="__codelineno-0-175"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">[</span><span class="n">key</span><span class="p">]</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">[</span><span class="n">key</span><span class="p">]</span>
+</span><span id="__span-0-176"><a id="__codelineno-0-176" name="__codelineno-0-176"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
+</span><span id="__span-0-177"><a id="__codelineno-0-177" name="__codelineno-0-177"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">count_edge_occurrences</span><span class="p">(</span><span class="n">treatment</span><span class="p">,</span> <span class="n">outcome</span><span class="p">,</span> <span class="n">dag</span><span class="p">)</span>
+</span><span id="__span-0-178"><a id="__codelineno-0-178" name="__codelineno-0-178"></a>        <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">edge_counts</span><span class="o">.</span><span class="n">keys</span><span class="p">():</span>
+</span><span id="__span-0-179"><a id="__codelineno-0-179" name="__codelineno-0-179"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">[</span><span class="n">key</span><span class="p">]</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">[</span><span class="n">key</span><span class="p">]</span>
+</span><span id="__span-0-180"><a id="__codelineno-0-180" name="__codelineno-0-180"></a>
+</span><span id="__span-0-181"><a id="__codelineno-0-181" name="__codelineno-0-181"></a>    <span class="c1"># Compute statistics.</span>
+</span><span id="__span-0-182"><a id="__codelineno-0-182" name="__codelineno-0-182"></a>    <span class="n">freq_counts</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="o">.</span><span class="n">values</span><span class="p">())</span>
+</span><span id="__span-0-183"><a id="__codelineno-0-183" name="__codelineno-0-183"></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">freq_counts</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-184"><a id="__codelineno-0-184" name="__codelineno-0-184"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">mean</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-185"><a id="__codelineno-0-185" name="__codelineno-0-185"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">std_dev</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-186"><a id="__codelineno-0-186" name="__codelineno-0-186"></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-187"><a id="__codelineno-0-187" name="__codelineno-0-187"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">mean</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">freq_counts</span><span class="p">)</span>
+</span><span id="__span-0-188"><a id="__codelineno-0-188" name="__codelineno-0-188"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">std_dev</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">freq_counts</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -2658,7 +2864,7 @@ <h3 id="logos.edge_occurrence_tree.EdgeOccurrenceTree.calculate_edge_expectancy"
           <tr class="doc-section-item">
             <td><code>totals</code></td>
             <td>
-                  <code>tuple[int, <span title="Types.EdgeCountDict">EdgeCountDict</span>]</code>
+                  <code>tuple[int, <a class="autorefs autorefs-internal" title="logos.types.Types.EdgeCountDict" href="../types/#logos.types.Types.EdgeCountDict">EdgeCountDict</a>]</code>
             </td>
             <td>
               <div class="doc-md-description">
@@ -2675,8 +2881,7 @@ <h3 id="logos.edge_occurrence_tree.EdgeOccurrenceTree.calculate_edge_expectancy"
 
             <details class="quote">
               <summary>Source code in <code>src/logos/edge_occurrence_tree.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-189">189</a></span>
-<span class="normal"><a href="#__codelineno-0-190">190</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-190">190</a></span>
 <span class="normal"><a href="#__codelineno-0-191">191</a></span>
 <span class="normal"><a href="#__codelineno-0-192">192</a></span>
 <span class="normal"><a href="#__codelineno-0-193">193</a></span>
@@ -2704,36 +2909,37 @@ <h3 id="logos.edge_occurrence_tree.EdgeOccurrenceTree.calculate_edge_expectancy"
 <span class="normal"><a href="#__codelineno-0-215">215</a></span>
 <span class="normal"><a href="#__codelineno-0-216">216</a></span>
 <span class="normal"><a href="#__codelineno-0-217">217</a></span>
-<span class="normal"><a href="#__codelineno-0-218">218</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-189"><a id="__codelineno-0-189" name="__codelineno-0-189"></a><span class="k">def</span> <span class="nf">calculate_edge_expectancy</span><span class="p">(</span>
-</span><span id="__span-0-190"><a id="__codelineno-0-190" name="__codelineno-0-190"></a>    <span class="bp">self</span><span class="p">,</span> <span class="n">totals</span><span class="p">:</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="n">Types</span><span class="o">.</span><span class="n">EdgeCountDict</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-191"><a id="__codelineno-0-191" name="__codelineno-0-191"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-192"><a id="__codelineno-0-192" name="__codelineno-0-192"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-193"><a id="__codelineno-0-193" name="__codelineno-0-193"></a><span class="sd">    For each edge at each node, calculate what percent over or under</span>
-</span><span id="__span-0-194"><a id="__codelineno-0-194" name="__codelineno-0-194"></a><span class="sd">    expectancy the edge is at in relationship to its parent.</span>
-</span><span id="__span-0-195"><a id="__codelineno-0-195" name="__codelineno-0-195"></a>
-</span><span id="__span-0-196"><a id="__codelineno-0-196" name="__codelineno-0-196"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-197"><a id="__codelineno-0-197" name="__codelineno-0-197"></a><span class="sd">        totals: A tuple containing the total number of DAGs and the mapping from</span>
-</span><span id="__span-0-198"><a id="__codelineno-0-198" name="__codelineno-0-198"></a><span class="sd">            edges to their counts for the parent of this node.</span>
-</span><span id="__span-0-199"><a id="__codelineno-0-199" name="__codelineno-0-199"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-200"><a id="__codelineno-0-200" name="__codelineno-0-200"></a>    <span class="c1"># At root node, calculate expectancy</span>
-</span><span id="__span-0-201"><a id="__codelineno-0-201" name="__codelineno-0-201"></a>    <span class="k">if</span> <span class="n">totals</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-202"><a id="__codelineno-0-202" name="__codelineno-0-202"></a>        <span class="n">totals</span> <span class="o">=</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">)</span>
-</span><span id="__span-0-203"><a id="__codelineno-0-203" name="__codelineno-0-203"></a>
-</span><span id="__span-0-204"><a id="__codelineno-0-204" name="__codelineno-0-204"></a>    <span class="c1"># Otherwise, calculate expectancy based on parent.</span>
-</span><span id="__span-0-205"><a id="__codelineno-0-205" name="__codelineno-0-205"></a>    <span class="n">total_dags</span><span class="p">,</span> <span class="n">total_edges</span> <span class="o">=</span> <span class="n">totals</span>
-</span><span id="__span-0-206"><a id="__codelineno-0-206" name="__codelineno-0-206"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">percent_expectancy</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">float</span><span class="p">)</span>
-</span><span id="__span-0-207"><a id="__codelineno-0-207" name="__codelineno-0-207"></a>
-</span><span id="__span-0-208"><a id="__codelineno-0-208" name="__codelineno-0-208"></a>    <span class="k">for</span> <span class="n">edge</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="o">.</span><span class="n">keys</span><span class="p">():</span>
-</span><span id="__span-0-209"><a id="__codelineno-0-209" name="__codelineno-0-209"></a>        <span class="n">expected</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span> <span class="o">/</span> <span class="n">total_dags</span> <span class="o">*</span> <span class="n">total_edges</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span>
-</span><span id="__span-0-210"><a id="__codelineno-0-210" name="__codelineno-0-210"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-211"><a id="__codelineno-0-211" name="__codelineno-0-211"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span> <span class="o">-</span> <span class="n">expected</span>
-</span><span id="__span-0-212"><a id="__codelineno-0-212" name="__codelineno-0-212"></a>        <span class="p">)</span> <span class="o">/</span> <span class="n">expected</span>
-</span><span id="__span-0-213"><a id="__codelineno-0-213" name="__codelineno-0-213"></a>
-</span><span id="__span-0-214"><a id="__codelineno-0-214" name="__codelineno-0-214"></a>    <span class="c1"># Recurse for children.</span>
-</span><span id="__span-0-215"><a id="__codelineno-0-215" name="__codelineno-0-215"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="p">:</span>
-</span><span id="__span-0-216"><a id="__codelineno-0-216" name="__codelineno-0-216"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">calculate_edge_expectancy</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">))</span>
-</span><span id="__span-0-217"><a id="__codelineno-0-217" name="__codelineno-0-217"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
-</span><span id="__span-0-218"><a id="__codelineno-0-218" name="__codelineno-0-218"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">calculate_edge_expectancy</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">))</span>
+<span class="normal"><a href="#__codelineno-0-218">218</a></span>
+<span class="normal"><a href="#__codelineno-0-219">219</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-190"><a id="__codelineno-0-190" name="__codelineno-0-190"></a><span class="k">def</span> <span class="nf">calculate_edge_expectancy</span><span class="p">(</span>
+</span><span id="__span-0-191"><a id="__codelineno-0-191" name="__codelineno-0-191"></a>    <span class="bp">self</span><span class="p">,</span> <span class="n">totals</span><span class="p">:</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="n">Types</span><span class="o">.</span><span class="n">EdgeCountDict</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-192"><a id="__codelineno-0-192" name="__codelineno-0-192"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-193"><a id="__codelineno-0-193" name="__codelineno-0-193"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-194"><a id="__codelineno-0-194" name="__codelineno-0-194"></a><span class="sd">    For each edge at each node, calculate what percent over or under</span>
+</span><span id="__span-0-195"><a id="__codelineno-0-195" name="__codelineno-0-195"></a><span class="sd">    expectancy the edge is at in relationship to its parent.</span>
+</span><span id="__span-0-196"><a id="__codelineno-0-196" name="__codelineno-0-196"></a>
+</span><span id="__span-0-197"><a id="__codelineno-0-197" name="__codelineno-0-197"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-198"><a id="__codelineno-0-198" name="__codelineno-0-198"></a><span class="sd">        totals: A tuple containing the total number of DAGs and the mapping from</span>
+</span><span id="__span-0-199"><a id="__codelineno-0-199" name="__codelineno-0-199"></a><span class="sd">            edges to their counts for the parent of this node.</span>
+</span><span id="__span-0-200"><a id="__codelineno-0-200" name="__codelineno-0-200"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-201"><a id="__codelineno-0-201" name="__codelineno-0-201"></a>    <span class="c1"># At root node, calculate expectancy</span>
+</span><span id="__span-0-202"><a id="__codelineno-0-202" name="__codelineno-0-202"></a>    <span class="k">if</span> <span class="n">totals</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-203"><a id="__codelineno-0-203" name="__codelineno-0-203"></a>        <span class="n">totals</span> <span class="o">=</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">)</span>
+</span><span id="__span-0-204"><a id="__codelineno-0-204" name="__codelineno-0-204"></a>
+</span><span id="__span-0-205"><a id="__codelineno-0-205" name="__codelineno-0-205"></a>    <span class="c1"># Otherwise, calculate expectancy based on parent.</span>
+</span><span id="__span-0-206"><a id="__codelineno-0-206" name="__codelineno-0-206"></a>    <span class="n">total_dags</span><span class="p">,</span> <span class="n">total_edges</span> <span class="o">=</span> <span class="n">totals</span>
+</span><span id="__span-0-207"><a id="__codelineno-0-207" name="__codelineno-0-207"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">percent_expectancy</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">float</span><span class="p">)</span>
+</span><span id="__span-0-208"><a id="__codelineno-0-208" name="__codelineno-0-208"></a>
+</span><span id="__span-0-209"><a id="__codelineno-0-209" name="__codelineno-0-209"></a>    <span class="k">for</span> <span class="n">edge</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="o">.</span><span class="n">keys</span><span class="p">():</span>
+</span><span id="__span-0-210"><a id="__codelineno-0-210" name="__codelineno-0-210"></a>        <span class="n">expected</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span> <span class="o">/</span> <span class="n">total_dags</span> <span class="o">*</span> <span class="n">total_edges</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span>
+</span><span id="__span-0-211"><a id="__codelineno-0-211" name="__codelineno-0-211"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-212"><a id="__codelineno-0-212" name="__codelineno-0-212"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span> <span class="o">-</span> <span class="n">expected</span>
+</span><span id="__span-0-213"><a id="__codelineno-0-213" name="__codelineno-0-213"></a>        <span class="p">)</span> <span class="o">/</span> <span class="n">expected</span>
+</span><span id="__span-0-214"><a id="__codelineno-0-214" name="__codelineno-0-214"></a>
+</span><span id="__span-0-215"><a id="__codelineno-0-215" name="__codelineno-0-215"></a>    <span class="c1"># Recurse for children.</span>
+</span><span id="__span-0-216"><a id="__codelineno-0-216" name="__codelineno-0-216"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="p">:</span>
+</span><span id="__span-0-217"><a id="__codelineno-0-217" name="__codelineno-0-217"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">calculate_edge_expectancy</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">))</span>
+</span><span id="__span-0-218"><a id="__codelineno-0-218" name="__codelineno-0-218"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
+</span><span id="__span-0-219"><a id="__codelineno-0-219" name="__codelineno-0-219"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">calculate_edge_expectancy</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">num_dags</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span><span class="p">))</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -2786,8 +2992,7 @@ <h3 id="logos.edge_occurrence_tree.EdgeOccurrenceTree.find_outliers_in_tree" cla
 
             <details class="quote">
               <summary>Source code in <code>src/logos/edge_occurrence_tree.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-220">220</a></span>
-<span class="normal"><a href="#__codelineno-0-221">221</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-221">221</a></span>
 <span class="normal"><a href="#__codelineno-0-222">222</a></span>
 <span class="normal"><a href="#__codelineno-0-223">223</a></span>
 <span class="normal"><a href="#__codelineno-0-224">224</a></span>
@@ -2817,38 +3022,39 @@ <h3 id="logos.edge_occurrence_tree.EdgeOccurrenceTree.find_outliers_in_tree" cla
 <span class="normal"><a href="#__codelineno-0-248">248</a></span>
 <span class="normal"><a href="#__codelineno-0-249">249</a></span>
 <span class="normal"><a href="#__codelineno-0-250">250</a></span>
-<span class="normal"><a href="#__codelineno-0-251">251</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-220"><a id="__codelineno-0-220" name="__codelineno-0-220"></a><span class="k">def</span> <span class="nf">find_outliers_in_tree</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">threshold</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">0</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-221"><a id="__codelineno-0-221" name="__codelineno-0-221"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-222"><a id="__codelineno-0-222" name="__codelineno-0-222"></a><span class="sd">    Find outlier edges, based on the percent expectancy of each edge. Define an outlier as an</span>
-</span><span id="__span-0-223"><a id="__codelineno-0-223" name="__codelineno-0-223"></a><span class="sd">    edge that is below expectancy on one side of the tree, and above on the other side, and</span>
-</span><span id="__span-0-224"><a id="__codelineno-0-224" name="__codelineno-0-224"></a><span class="sd">    optionally, over some threshold on both sides.</span>
-</span><span id="__span-0-225"><a id="__codelineno-0-225" name="__codelineno-0-225"></a>
-</span><span id="__span-0-226"><a id="__codelineno-0-226" name="__codelineno-0-226"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-227"><a id="__codelineno-0-227" name="__codelineno-0-227"></a><span class="sd">        threshold: The threshold for an edge to be considered an outlier.</span>
-</span><span id="__span-0-228"><a id="__codelineno-0-228" name="__codelineno-0-228"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-229"><a id="__codelineno-0-229" name="__codelineno-0-229"></a>
-</span><span id="__span-0-230"><a id="__codelineno-0-230" name="__codelineno-0-230"></a>    <span class="c1"># If able to compare, find outliers.</span>
-</span><span id="__span-0-231"><a id="__codelineno-0-231" name="__codelineno-0-231"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span> <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
-</span><span id="__span-0-232"><a id="__codelineno-0-232" name="__codelineno-0-232"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">outliers</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-233"><a id="__codelineno-0-233" name="__codelineno-0-233"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">outliers</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-234"><a id="__codelineno-0-234" name="__codelineno-0-234"></a>        <span class="n">edges</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">edge_counts</span><span class="o">.</span><span class="n">keys</span><span class="p">())</span><span class="o">.</span><span class="n">union</span><span class="p">(</span>
-</span><span id="__span-0-235"><a id="__codelineno-0-235" name="__codelineno-0-235"></a>            <span class="nb">set</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">edge_counts</span><span class="o">.</span><span class="n">keys</span><span class="p">())</span>
-</span><span id="__span-0-236"><a id="__codelineno-0-236" name="__codelineno-0-236"></a>        <span class="p">)</span>
-</span><span id="__span-0-237"><a id="__codelineno-0-237" name="__codelineno-0-237"></a>        <span class="k">for</span> <span class="n">edge</span> <span class="ow">in</span> <span class="n">edges</span><span class="p">:</span>
-</span><span id="__span-0-238"><a id="__codelineno-0-238" name="__codelineno-0-238"></a>            <span class="k">if</span> <span class="p">(</span>
-</span><span id="__span-0-239"><a id="__codelineno-0-239" name="__codelineno-0-239"></a>                <span class="n">np</span><span class="o">.</span><span class="n">sign</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">])</span>
-</span><span id="__span-0-240"><a id="__codelineno-0-240" name="__codelineno-0-240"></a>                <span class="o">!=</span> <span class="n">np</span><span class="o">.</span><span class="n">sign</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">])</span>
-</span><span id="__span-0-241"><a id="__codelineno-0-241" name="__codelineno-0-241"></a>                <span class="ow">and</span> <span class="nb">abs</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">])</span> <span class="o">&gt;</span> <span class="n">threshold</span>
-</span><span id="__span-0-242"><a id="__codelineno-0-242" name="__codelineno-0-242"></a>                <span class="ow">and</span> <span class="nb">abs</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">])</span> <span class="o">&gt;</span> <span class="n">threshold</span>
-</span><span id="__span-0-243"><a id="__codelineno-0-243" name="__codelineno-0-243"></a>            <span class="p">):</span>
-</span><span id="__span-0-244"><a id="__codelineno-0-244" name="__codelineno-0-244"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">outliers</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span>
-</span><span id="__span-0-245"><a id="__codelineno-0-245" name="__codelineno-0-245"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">outliers</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span>
-</span><span id="__span-0-246"><a id="__codelineno-0-246" name="__codelineno-0-246"></a>
-</span><span id="__span-0-247"><a id="__codelineno-0-247" name="__codelineno-0-247"></a>    <span class="c1"># Recurse for children.</span>
-</span><span id="__span-0-248"><a id="__codelineno-0-248" name="__codelineno-0-248"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="p">:</span>
-</span><span id="__span-0-249"><a id="__codelineno-0-249" name="__codelineno-0-249"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">find_outliers_in_tree</span><span class="p">(</span><span class="n">threshold</span><span class="p">)</span>
-</span><span id="__span-0-250"><a id="__codelineno-0-250" name="__codelineno-0-250"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
-</span><span id="__span-0-251"><a id="__codelineno-0-251" name="__codelineno-0-251"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">find_outliers_in_tree</span><span class="p">(</span><span class="n">threshold</span><span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-251">251</a></span>
+<span class="normal"><a href="#__codelineno-0-252">252</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-221"><a id="__codelineno-0-221" name="__codelineno-0-221"></a><span class="k">def</span> <span class="nf">find_outliers_in_tree</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">threshold</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">0</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-222"><a id="__codelineno-0-222" name="__codelineno-0-222"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-223"><a id="__codelineno-0-223" name="__codelineno-0-223"></a><span class="sd">    Find outlier edges, based on the percent expectancy of each edge. Define an outlier as an</span>
+</span><span id="__span-0-224"><a id="__codelineno-0-224" name="__codelineno-0-224"></a><span class="sd">    edge that is below expectancy on one side of the tree, and above on the other side, and</span>
+</span><span id="__span-0-225"><a id="__codelineno-0-225" name="__codelineno-0-225"></a><span class="sd">    optionally, over some threshold on both sides.</span>
+</span><span id="__span-0-226"><a id="__codelineno-0-226" name="__codelineno-0-226"></a>
+</span><span id="__span-0-227"><a id="__codelineno-0-227" name="__codelineno-0-227"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-228"><a id="__codelineno-0-228" name="__codelineno-0-228"></a><span class="sd">        threshold: The threshold for an edge to be considered an outlier.</span>
+</span><span id="__span-0-229"><a id="__codelineno-0-229" name="__codelineno-0-229"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-230"><a id="__codelineno-0-230" name="__codelineno-0-230"></a>
+</span><span id="__span-0-231"><a id="__codelineno-0-231" name="__codelineno-0-231"></a>    <span class="c1"># If able to compare, find outliers.</span>
+</span><span id="__span-0-232"><a id="__codelineno-0-232" name="__codelineno-0-232"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span> <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
+</span><span id="__span-0-233"><a id="__codelineno-0-233" name="__codelineno-0-233"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">outliers</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-234"><a id="__codelineno-0-234" name="__codelineno-0-234"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">outliers</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-235"><a id="__codelineno-0-235" name="__codelineno-0-235"></a>        <span class="n">edges</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">edge_counts</span><span class="o">.</span><span class="n">keys</span><span class="p">())</span><span class="o">.</span><span class="n">union</span><span class="p">(</span>
+</span><span id="__span-0-236"><a id="__codelineno-0-236" name="__codelineno-0-236"></a>            <span class="nb">set</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">edge_counts</span><span class="o">.</span><span class="n">keys</span><span class="p">())</span>
+</span><span id="__span-0-237"><a id="__codelineno-0-237" name="__codelineno-0-237"></a>        <span class="p">)</span>
+</span><span id="__span-0-238"><a id="__codelineno-0-238" name="__codelineno-0-238"></a>        <span class="k">for</span> <span class="n">edge</span> <span class="ow">in</span> <span class="n">edges</span><span class="p">:</span>
+</span><span id="__span-0-239"><a id="__codelineno-0-239" name="__codelineno-0-239"></a>            <span class="k">if</span> <span class="p">(</span>
+</span><span id="__span-0-240"><a id="__codelineno-0-240" name="__codelineno-0-240"></a>                <span class="n">np</span><span class="o">.</span><span class="n">sign</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">])</span>
+</span><span id="__span-0-241"><a id="__codelineno-0-241" name="__codelineno-0-241"></a>                <span class="o">!=</span> <span class="n">np</span><span class="o">.</span><span class="n">sign</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">])</span>
+</span><span id="__span-0-242"><a id="__codelineno-0-242" name="__codelineno-0-242"></a>                <span class="ow">and</span> <span class="nb">abs</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">])</span> <span class="o">&gt;</span> <span class="n">threshold</span>
+</span><span id="__span-0-243"><a id="__codelineno-0-243" name="__codelineno-0-243"></a>                <span class="ow">and</span> <span class="nb">abs</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">])</span> <span class="o">&gt;</span> <span class="n">threshold</span>
+</span><span id="__span-0-244"><a id="__codelineno-0-244" name="__codelineno-0-244"></a>            <span class="p">):</span>
+</span><span id="__span-0-245"><a id="__codelineno-0-245" name="__codelineno-0-245"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">outliers</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span>
+</span><span id="__span-0-246"><a id="__codelineno-0-246" name="__codelineno-0-246"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">outliers</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">percent_expectancy</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span>
+</span><span id="__span-0-247"><a id="__codelineno-0-247" name="__codelineno-0-247"></a>
+</span><span id="__span-0-248"><a id="__codelineno-0-248" name="__codelineno-0-248"></a>    <span class="c1"># Recurse for children.</span>
+</span><span id="__span-0-249"><a id="__codelineno-0-249" name="__codelineno-0-249"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="p">:</span>
+</span><span id="__span-0-250"><a id="__codelineno-0-250" name="__codelineno-0-250"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">find_outliers_in_tree</span><span class="p">(</span><span class="n">threshold</span><span class="p">)</span>
+</span><span id="__span-0-251"><a id="__codelineno-0-251" name="__codelineno-0-251"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
+</span><span id="__span-0-252"><a id="__codelineno-0-252" name="__codelineno-0-252"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">find_outliers_in_tree</span><span class="p">(</span><span class="n">threshold</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -2910,7 +3116,7 @@ <h3 id="logos.edge_occurrence_tree.EdgeOccurrenceTree.find_outliers_per_cluster"
       <tbody>
           <tr class="doc-section-item">
             <td>
-                  <code><span title="Types.EdgeCountDict">EdgeCountDict</span></code>
+                  <code><a class="autorefs autorefs-internal" title="logos.types.Types.EdgeCountDict" href="../types/#logos.types.Types.EdgeCountDict">EdgeCountDict</a></code>
             </td>
             <td>
               <div class="doc-md-description">
@@ -2920,7 +3126,7 @@ <h3 id="logos.edge_occurrence_tree.EdgeOccurrenceTree.find_outliers_per_cluster"
           </tr>
           <tr class="doc-section-item">
             <td>
-                  <code>dict[<span title="Types.Edge">Edge</span>, float]</code>
+                  <code>dict[<a class="autorefs autorefs-internal" title="logos.types.Types.Edge" href="../types/#logos.types.Types.Edge">Edge</a>, float]</code>
             </td>
             <td>
               <div class="doc-md-description">
@@ -2933,8 +3139,7 @@ <h3 id="logos.edge_occurrence_tree.EdgeOccurrenceTree.find_outliers_per_cluster"
 
             <details class="quote">
               <summary>Source code in <code>src/logos/edge_occurrence_tree.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-253">253</a></span>
-<span class="normal"><a href="#__codelineno-0-254">254</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-254">254</a></span>
 <span class="normal"><a href="#__codelineno-0-255">255</a></span>
 <span class="normal"><a href="#__codelineno-0-256">256</a></span>
 <span class="normal"><a href="#__codelineno-0-257">257</a></span>
@@ -2972,46 +3177,47 @@ <h3 id="logos.edge_occurrence_tree.EdgeOccurrenceTree.find_outliers_per_cluster"
 <span class="normal"><a href="#__codelineno-0-289">289</a></span>
 <span class="normal"><a href="#__codelineno-0-290">290</a></span>
 <span class="normal"><a href="#__codelineno-0-291">291</a></span>
-<span class="normal"><a href="#__codelineno-0-292">292</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-253"><a id="__codelineno-0-253" name="__codelineno-0-253"></a><span class="k">def</span> <span class="nf">find_outliers_per_cluster</span><span class="p">(</span>
-</span><span id="__span-0-254"><a id="__codelineno-0-254" name="__codelineno-0-254"></a>    <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-255"><a id="__codelineno-0-255" name="__codelineno-0-255"></a>    <span class="n">dag</span><span class="p">:</span> <span class="n">nx</span><span class="o">.</span><span class="n">DiGraph</span><span class="p">,</span>
-</span><span id="__span-0-256"><a id="__codelineno-0-256" name="__codelineno-0-256"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">Types</span><span class="o">.</span><span class="n">EdgeCountDict</span><span class="p">,</span> <span class="nb">dict</span><span class="p">[</span><span class="n">Types</span><span class="o">.</span><span class="n">Edge</span><span class="p">,</span> <span class="nb">float</span><span class="p">]]:</span>
-</span><span id="__span-0-257"><a id="__codelineno-0-257" name="__codelineno-0-257"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a><span class="sd">    Collect the edge counts and outliers found earlier into appropriate dictionaries</span>
-</span><span id="__span-0-259"><a id="__codelineno-0-259" name="__codelineno-0-259"></a><span class="sd">    per cluster.</span>
-</span><span id="__span-0-260"><a id="__codelineno-0-260" name="__codelineno-0-260"></a>
-</span><span id="__span-0-261"><a id="__codelineno-0-261" name="__codelineno-0-261"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-262"><a id="__codelineno-0-262" name="__codelineno-0-262"></a><span class="sd">        dag: The DAG to ignore when collecting outliers.</span>
-</span><span id="__span-0-263"><a id="__codelineno-0-263" name="__codelineno-0-263"></a>
-</span><span id="__span-0-264"><a id="__codelineno-0-264" name="__codelineno-0-264"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-265"><a id="__codelineno-0-265" name="__codelineno-0-265"></a><span class="sd">        A tuple containing the following: a dictionary mapping cluster id&#39;s to edge counts,</span>
-</span><span id="__span-0-266"><a id="__codelineno-0-266" name="__codelineno-0-266"></a><span class="sd">        and a dictionary mapping cluster id&#39;s to outlier edges.</span>
-</span><span id="__span-0-267"><a id="__codelineno-0-267" name="__codelineno-0-267"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-268"><a id="__codelineno-0-268" name="__codelineno-0-268"></a>
-</span><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a>    <span class="n">cluster_edge_count</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a>    <span class="n">cluster_outliers</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a>
-</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a>    <span class="c1"># If leaf, add to cluster counts.</span>
-</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a>        <span class="n">cluster_edge_count</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span>
-</span><span id="__span-0-275"><a id="__codelineno-0-275" name="__codelineno-0-275"></a>        <span class="n">edges_to_ignore</span> <span class="o">=</span> <span class="n">dag</span><span class="o">.</span><span class="n">edges</span> <span class="k">if</span> <span class="n">dag</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="k">else</span> <span class="p">[]</span>
-</span><span id="__span-0-276"><a id="__codelineno-0-276" name="__codelineno-0-276"></a>        <span class="n">cluster_outliers</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span><span class="p">]</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="__span-0-277"><a id="__codelineno-0-277" name="__codelineno-0-277"></a>            <span class="n">edge</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">outliers</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span>
-</span><span id="__span-0-278"><a id="__codelineno-0-278" name="__codelineno-0-278"></a>            <span class="k">for</span> <span class="n">edge</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">outliers</span>
-</span><span id="__span-0-279"><a id="__codelineno-0-279" name="__codelineno-0-279"></a>            <span class="k">if</span> <span class="n">edge</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">edges_to_ignore</span>
-</span><span id="__span-0-280"><a id="__codelineno-0-280" name="__codelineno-0-280"></a>        <span class="p">}</span>
-</span><span id="__span-0-281"><a id="__codelineno-0-281" name="__codelineno-0-281"></a>
-</span><span id="__span-0-282"><a id="__codelineno-0-282" name="__codelineno-0-282"></a>    <span class="c1"># Otherwise, recurse for children.</span>
-</span><span id="__span-0-283"><a id="__codelineno-0-283" name="__codelineno-0-283"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="p">:</span>
-</span><span id="__span-0-284"><a id="__codelineno-0-284" name="__codelineno-0-284"></a>        <span class="n">lec</span><span class="p">,</span> <span class="n">lo</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">find_outliers_per_cluster</span><span class="p">(</span><span class="n">dag</span><span class="p">)</span>
-</span><span id="__span-0-285"><a id="__codelineno-0-285" name="__codelineno-0-285"></a>        <span class="n">cluster_edge_count</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">lec</span><span class="p">)</span>
-</span><span id="__span-0-286"><a id="__codelineno-0-286" name="__codelineno-0-286"></a>        <span class="n">cluster_outliers</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">lo</span><span class="p">)</span>
-</span><span id="__span-0-287"><a id="__codelineno-0-287" name="__codelineno-0-287"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
-</span><span id="__span-0-288"><a id="__codelineno-0-288" name="__codelineno-0-288"></a>        <span class="n">rec</span><span class="p">,</span> <span class="n">ro</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">find_outliers_per_cluster</span><span class="p">(</span><span class="n">dag</span><span class="p">)</span>
-</span><span id="__span-0-289"><a id="__codelineno-0-289" name="__codelineno-0-289"></a>        <span class="n">cluster_edge_count</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">rec</span><span class="p">)</span>
-</span><span id="__span-0-290"><a id="__codelineno-0-290" name="__codelineno-0-290"></a>        <span class="n">cluster_outliers</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">ro</span><span class="p">)</span>
-</span><span id="__span-0-291"><a id="__codelineno-0-291" name="__codelineno-0-291"></a>
-</span><span id="__span-0-292"><a id="__codelineno-0-292" name="__codelineno-0-292"></a>    <span class="k">return</span> <span class="n">cluster_edge_count</span><span class="p">,</span> <span class="n">cluster_outliers</span>
+<span class="normal"><a href="#__codelineno-0-292">292</a></span>
+<span class="normal"><a href="#__codelineno-0-293">293</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-254"><a id="__codelineno-0-254" name="__codelineno-0-254"></a><span class="k">def</span> <span class="nf">find_outliers_per_cluster</span><span class="p">(</span>
+</span><span id="__span-0-255"><a id="__codelineno-0-255" name="__codelineno-0-255"></a>    <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-256"><a id="__codelineno-0-256" name="__codelineno-0-256"></a>    <span class="n">dag</span><span class="p">:</span> <span class="n">nx</span><span class="o">.</span><span class="n">DiGraph</span><span class="p">,</span>
+</span><span id="__span-0-257"><a id="__codelineno-0-257" name="__codelineno-0-257"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">Types</span><span class="o">.</span><span class="n">EdgeCountDict</span><span class="p">,</span> <span class="nb">dict</span><span class="p">[</span><span class="n">Types</span><span class="o">.</span><span class="n">Edge</span><span class="p">,</span> <span class="nb">float</span><span class="p">]]:</span>
+</span><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-259"><a id="__codelineno-0-259" name="__codelineno-0-259"></a><span class="sd">    Collect the edge counts and outliers found earlier into appropriate dictionaries</span>
+</span><span id="__span-0-260"><a id="__codelineno-0-260" name="__codelineno-0-260"></a><span class="sd">    per cluster.</span>
+</span><span id="__span-0-261"><a id="__codelineno-0-261" name="__codelineno-0-261"></a>
+</span><span id="__span-0-262"><a id="__codelineno-0-262" name="__codelineno-0-262"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-263"><a id="__codelineno-0-263" name="__codelineno-0-263"></a><span class="sd">        dag: The DAG to ignore when collecting outliers.</span>
+</span><span id="__span-0-264"><a id="__codelineno-0-264" name="__codelineno-0-264"></a>
+</span><span id="__span-0-265"><a id="__codelineno-0-265" name="__codelineno-0-265"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-266"><a id="__codelineno-0-266" name="__codelineno-0-266"></a><span class="sd">        A tuple containing the following: a dictionary mapping cluster id&#39;s to edge counts,</span>
+</span><span id="__span-0-267"><a id="__codelineno-0-267" name="__codelineno-0-267"></a><span class="sd">        and a dictionary mapping cluster id&#39;s to outlier edges.</span>
+</span><span id="__span-0-268"><a id="__codelineno-0-268" name="__codelineno-0-268"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a>
+</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a>    <span class="n">cluster_edge_count</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a>    <span class="n">cluster_outliers</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a>
+</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a>    <span class="c1"># If leaf, add to cluster counts.</span>
+</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-275"><a id="__codelineno-0-275" name="__codelineno-0-275"></a>        <span class="n">cluster_edge_count</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">edge_counts</span>
+</span><span id="__span-0-276"><a id="__codelineno-0-276" name="__codelineno-0-276"></a>        <span class="n">edges_to_ignore</span> <span class="o">=</span> <span class="n">dag</span><span class="o">.</span><span class="n">edges</span> <span class="k">if</span> <span class="n">dag</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="k">else</span> <span class="p">[]</span>
+</span><span id="__span-0-277"><a id="__codelineno-0-277" name="__codelineno-0-277"></a>        <span class="n">cluster_outliers</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">cluster_id</span><span class="p">]</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="__span-0-278"><a id="__codelineno-0-278" name="__codelineno-0-278"></a>            <span class="n">edge</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">outliers</span><span class="p">[</span><span class="n">edge</span><span class="p">]</span>
+</span><span id="__span-0-279"><a id="__codelineno-0-279" name="__codelineno-0-279"></a>            <span class="k">for</span> <span class="n">edge</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">outliers</span>
+</span><span id="__span-0-280"><a id="__codelineno-0-280" name="__codelineno-0-280"></a>            <span class="k">if</span> <span class="n">edge</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">edges_to_ignore</span>
+</span><span id="__span-0-281"><a id="__codelineno-0-281" name="__codelineno-0-281"></a>        <span class="p">}</span>
+</span><span id="__span-0-282"><a id="__codelineno-0-282" name="__codelineno-0-282"></a>
+</span><span id="__span-0-283"><a id="__codelineno-0-283" name="__codelineno-0-283"></a>    <span class="c1"># Otherwise, recurse for children.</span>
+</span><span id="__span-0-284"><a id="__codelineno-0-284" name="__codelineno-0-284"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="p">:</span>
+</span><span id="__span-0-285"><a id="__codelineno-0-285" name="__codelineno-0-285"></a>        <span class="n">lec</span><span class="p">,</span> <span class="n">lo</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">left</span><span class="o">.</span><span class="n">find_outliers_per_cluster</span><span class="p">(</span><span class="n">dag</span><span class="p">)</span>
+</span><span id="__span-0-286"><a id="__codelineno-0-286" name="__codelineno-0-286"></a>        <span class="n">cluster_edge_count</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">lec</span><span class="p">)</span>
+</span><span id="__span-0-287"><a id="__codelineno-0-287" name="__codelineno-0-287"></a>        <span class="n">cluster_outliers</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">lo</span><span class="p">)</span>
+</span><span id="__span-0-288"><a id="__codelineno-0-288" name="__codelineno-0-288"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="p">:</span>
+</span><span id="__span-0-289"><a id="__codelineno-0-289" name="__codelineno-0-289"></a>        <span class="n">rec</span><span class="p">,</span> <span class="n">ro</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">right</span><span class="o">.</span><span class="n">find_outliers_per_cluster</span><span class="p">(</span><span class="n">dag</span><span class="p">)</span>
+</span><span id="__span-0-290"><a id="__codelineno-0-290" name="__codelineno-0-290"></a>        <span class="n">cluster_edge_count</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">rec</span><span class="p">)</span>
+</span><span id="__span-0-291"><a id="__codelineno-0-291" name="__codelineno-0-291"></a>        <span class="n">cluster_outliers</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">ro</span><span class="p">)</span>
+</span><span id="__span-0-292"><a id="__codelineno-0-292" name="__codelineno-0-292"></a>
+</span><span id="__span-0-293"><a id="__codelineno-0-293" name="__codelineno-0-293"></a>    <span class="k">return</span> <span class="n">cluster_edge_count</span><span class="p">,</span> <span class="n">cluster_outliers</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
diff --git a/reference/logos/interactive_causal_graph_refiner/index.html b/reference/logos/interactive_causal_graph_refiner/index.html
index 9a355b4..d62e4a5 100644
--- a/reference/logos/interactive_causal_graph_refiner/index.html
+++ b/reference/logos/interactive_causal_graph_refiner/index.html
@@ -1453,8 +1453,7 @@ <h2 id="logos.interactive_causal_graph_refiner.InteractiveCausalGraphRefiner" cl
 <span class="normal"><a href="#__codelineno-0-271">271</a></span>
 <span class="normal"><a href="#__codelineno-0-272">272</a></span>
 <span class="normal"><a href="#__codelineno-0-273">273</a></span>
-<span class="normal"><a href="#__codelineno-0-274">274</a></span>
-<span class="normal"><a href="#__codelineno-0-275">275</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-41"><a id="__codelineno-0-41" name="__codelineno-0-41"></a><span class="k">class</span> <span class="nc">InteractiveCausalGraphRefiner</span><span class="p">:</span>
+<span class="normal"><a href="#__codelineno-0-274">274</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-41"><a id="__codelineno-0-41" name="__codelineno-0-41"></a><span class="k">class</span> <span class="nc">InteractiveCausalGraphRefiner</span><span class="p">:</span>
 </span><span id="__span-0-42"><a id="__codelineno-0-42" name="__codelineno-0-42"></a>
 </span><span id="__span-0-43"><a id="__codelineno-0-43" name="__codelineno-0-43"></a>    <span class="nd">@staticmethod</span>
 </span><span id="__span-0-44"><a id="__codelineno-0-44" name="__codelineno-0-44"></a>    <span class="k">def</span> <span class="nf">get_suggestion</span><span class="p">(</span>
@@ -1664,31 +1663,30 @@ <h2 id="logos.interactive_causal_graph_refiner.InteractiveCausalGraphRefiner" cl
 </span><span id="__span-0-248"><a id="__codelineno-0-248" name="__codelineno-0-248"></a>            <span class="p">[</span><span class="n">v</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span> <span class="k">for</span> <span class="n">v</span> <span class="ow">in</span> <span class="s2">&quot;.&quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">row</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;.&quot;</span><span class="p">)[</span><span class="mi">1</span><span class="p">:])</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;,&quot;</span><span class="p">)]</span>
 </span><span id="__span-0-249"><a id="__codelineno-0-249" name="__codelineno-0-249"></a>            <span class="k">for</span> <span class="n">row</span> <span class="ow">in</span> <span class="n">reply_rows</span>
 </span><span id="__span-0-250"><a id="__codelineno-0-250" name="__codelineno-0-250"></a>        <span class="p">]</span>
-</span><span id="__span-0-251"><a id="__codelineno-0-251" name="__codelineno-0-251"></a>        <span class="nb">print</span><span class="p">(</span><span class="n">possibly_ranked_edges</span><span class="p">)</span>
-</span><span id="__span-0-252"><a id="__codelineno-0-252" name="__codelineno-0-252"></a>        <span class="n">ranked_edges</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-253"><a id="__codelineno-0-253" name="__codelineno-0-253"></a>        <span class="n">tags</span> <span class="o">=</span> <span class="n">data_tags</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span>
-</span><span id="__span-0-254"><a id="__codelineno-0-254" name="__codelineno-0-254"></a>        <span class="k">for</span> <span class="n">edge</span> <span class="ow">in</span> <span class="n">possibly_ranked_edges</span><span class="p">:</span>
-</span><span id="__span-0-255"><a id="__codelineno-0-255" name="__codelineno-0-255"></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">edge</span><span class="p">)</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="__span-0-256"><a id="__codelineno-0-256" name="__codelineno-0-256"></a>                <span class="k">continue</span>
-</span><span id="__span-0-257"><a id="__codelineno-0-257" name="__codelineno-0-257"></a>
-</span><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a>            <span class="n">left</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-259"><a id="__codelineno-0-259" name="__codelineno-0-259"></a>            <span class="n">right</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-260"><a id="__codelineno-0-260" name="__codelineno-0-260"></a>
-</span><span id="__span-0-261"><a id="__codelineno-0-261" name="__codelineno-0-261"></a>            <span class="k">if</span> <span class="n">edge</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="ow">in</span> <span class="n">tags</span><span class="p">:</span>
-</span><span id="__span-0-262"><a id="__codelineno-0-262" name="__codelineno-0-262"></a>                <span class="n">left</span> <span class="o">=</span> <span class="n">edge</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-263"><a id="__codelineno-0-263" name="__codelineno-0-263"></a>            <span class="k">elif</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">edge</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="si">}</span><span class="s2"> mean&quot;</span> <span class="ow">in</span> <span class="n">tags</span><span class="p">:</span>
-</span><span id="__span-0-264"><a id="__codelineno-0-264" name="__codelineno-0-264"></a>                <span class="n">left</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">edge</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="si">}</span><span class="s2"> mean&quot;</span>
-</span><span id="__span-0-265"><a id="__codelineno-0-265" name="__codelineno-0-265"></a>
-</span><span id="__span-0-266"><a id="__codelineno-0-266" name="__codelineno-0-266"></a>            <span class="k">if</span> <span class="n">edge</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="ow">in</span> <span class="n">tags</span><span class="p">:</span>
-</span><span id="__span-0-267"><a id="__codelineno-0-267" name="__codelineno-0-267"></a>                <span class="n">right</span> <span class="o">=</span> <span class="n">edge</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
-</span><span id="__span-0-268"><a id="__codelineno-0-268" name="__codelineno-0-268"></a>            <span class="k">elif</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">edge</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span><span class="si">}</span><span class="s2"> mean&quot;</span> <span class="ow">in</span> <span class="n">tags</span><span class="p">:</span>
-</span><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a>                <span class="n">right</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">edge</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span><span class="si">}</span><span class="s2"> mean&quot;</span>
-</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a>
-</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a>            <span class="k">if</span> <span class="n">left</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">right</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a>                <span class="n">ranked_edges</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">Edge</span><span class="p">((</span><span class="n">left</span><span class="p">,</span> <span class="n">right</span><span class="p">)))</span>
-</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a>
-</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a>        <span class="bp">cls</span><span class="o">.</span><span class="n">cache</span> <span class="o">=</span> <span class="n">ranked_edges</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
-</span><span id="__span-0-275"><a id="__codelineno-0-275" name="__codelineno-0-275"></a>        <span class="k">return</span> <span class="n">ranked_edges</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-251"><a id="__codelineno-0-251" name="__codelineno-0-251"></a>        <span class="n">ranked_edges</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-252"><a id="__codelineno-0-252" name="__codelineno-0-252"></a>        <span class="n">tags</span> <span class="o">=</span> <span class="n">data_tags</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span>
+</span><span id="__span-0-253"><a id="__codelineno-0-253" name="__codelineno-0-253"></a>        <span class="k">for</span> <span class="n">edge</span> <span class="ow">in</span> <span class="n">possibly_ranked_edges</span><span class="p">:</span>
+</span><span id="__span-0-254"><a id="__codelineno-0-254" name="__codelineno-0-254"></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">edge</span><span class="p">)</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="__span-0-255"><a id="__codelineno-0-255" name="__codelineno-0-255"></a>                <span class="k">continue</span>
+</span><span id="__span-0-256"><a id="__codelineno-0-256" name="__codelineno-0-256"></a>
+</span><span id="__span-0-257"><a id="__codelineno-0-257" name="__codelineno-0-257"></a>            <span class="n">left</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a>            <span class="n">right</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-259"><a id="__codelineno-0-259" name="__codelineno-0-259"></a>
+</span><span id="__span-0-260"><a id="__codelineno-0-260" name="__codelineno-0-260"></a>            <span class="k">if</span> <span class="n">edge</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="ow">in</span> <span class="n">tags</span><span class="p">:</span>
+</span><span id="__span-0-261"><a id="__codelineno-0-261" name="__codelineno-0-261"></a>                <span class="n">left</span> <span class="o">=</span> <span class="n">edge</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-262"><a id="__codelineno-0-262" name="__codelineno-0-262"></a>            <span class="k">elif</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">edge</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="si">}</span><span class="s2"> mean&quot;</span> <span class="ow">in</span> <span class="n">tags</span><span class="p">:</span>
+</span><span id="__span-0-263"><a id="__codelineno-0-263" name="__codelineno-0-263"></a>                <span class="n">left</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">edge</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="si">}</span><span class="s2"> mean&quot;</span>
+</span><span id="__span-0-264"><a id="__codelineno-0-264" name="__codelineno-0-264"></a>
+</span><span id="__span-0-265"><a id="__codelineno-0-265" name="__codelineno-0-265"></a>            <span class="k">if</span> <span class="n">edge</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="ow">in</span> <span class="n">tags</span><span class="p">:</span>
+</span><span id="__span-0-266"><a id="__codelineno-0-266" name="__codelineno-0-266"></a>                <span class="n">right</span> <span class="o">=</span> <span class="n">edge</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="__span-0-267"><a id="__codelineno-0-267" name="__codelineno-0-267"></a>            <span class="k">elif</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">edge</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span><span class="si">}</span><span class="s2"> mean&quot;</span> <span class="ow">in</span> <span class="n">tags</span><span class="p">:</span>
+</span><span id="__span-0-268"><a id="__codelineno-0-268" name="__codelineno-0-268"></a>                <span class="n">right</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">edge</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span><span class="si">}</span><span class="s2"> mean&quot;</span>
+</span><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a>
+</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a>            <span class="k">if</span> <span class="n">left</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">right</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a>                <span class="n">ranked_edges</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">Edge</span><span class="p">((</span><span class="n">left</span><span class="p">,</span> <span class="n">right</span><span class="p">)))</span>
+</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a>
+</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a>        <span class="bp">cls</span><span class="o">.</span><span class="n">cache</span> <span class="o">=</span> <span class="n">ranked_edges</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
+</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a>        <span class="k">return</span> <span class="n">ranked_edges</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
 </span></code></pre></div></td></tr></table></div>
               </details>
 
@@ -2539,8 +2537,7 @@ <h3 id="logos.interactive_causal_graph_refiner.InteractiveCausalGraphRefiner._ge
 <span class="normal"><a href="#__codelineno-0-271">271</a></span>
 <span class="normal"><a href="#__codelineno-0-272">272</a></span>
 <span class="normal"><a href="#__codelineno-0-273">273</a></span>
-<span class="normal"><a href="#__codelineno-0-274">274</a></span>
-<span class="normal"><a href="#__codelineno-0-275">275</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-157"><a id="__codelineno-0-157" name="__codelineno-0-157"></a><span class="nd">@classmethod</span>
+<span class="normal"><a href="#__codelineno-0-274">274</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-157"><a id="__codelineno-0-157" name="__codelineno-0-157"></a><span class="nd">@classmethod</span>
 </span><span id="__span-0-158"><a id="__codelineno-0-158" name="__codelineno-0-158"></a><span class="k">def</span> <span class="nf">_get_suggestion_langmodel</span><span class="p">(</span>
 </span><span id="__span-0-159"><a id="__codelineno-0-159" name="__codelineno-0-159"></a>    <span class="bp">cls</span><span class="p">,</span>
 </span><span id="__span-0-160"><a id="__codelineno-0-160" name="__codelineno-0-160"></a>    <span class="n">data</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span>
@@ -2634,31 +2631,30 @@ <h3 id="logos.interactive_causal_graph_refiner.InteractiveCausalGraphRefiner._ge
 </span><span id="__span-0-248"><a id="__codelineno-0-248" name="__codelineno-0-248"></a>        <span class="p">[</span><span class="n">v</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span> <span class="k">for</span> <span class="n">v</span> <span class="ow">in</span> <span class="s2">&quot;.&quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">row</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;.&quot;</span><span class="p">)[</span><span class="mi">1</span><span class="p">:])</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;,&quot;</span><span class="p">)]</span>
 </span><span id="__span-0-249"><a id="__codelineno-0-249" name="__codelineno-0-249"></a>        <span class="k">for</span> <span class="n">row</span> <span class="ow">in</span> <span class="n">reply_rows</span>
 </span><span id="__span-0-250"><a id="__codelineno-0-250" name="__codelineno-0-250"></a>    <span class="p">]</span>
-</span><span id="__span-0-251"><a id="__codelineno-0-251" name="__codelineno-0-251"></a>    <span class="nb">print</span><span class="p">(</span><span class="n">possibly_ranked_edges</span><span class="p">)</span>
-</span><span id="__span-0-252"><a id="__codelineno-0-252" name="__codelineno-0-252"></a>    <span class="n">ranked_edges</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-253"><a id="__codelineno-0-253" name="__codelineno-0-253"></a>    <span class="n">tags</span> <span class="o">=</span> <span class="n">data_tags</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span>
-</span><span id="__span-0-254"><a id="__codelineno-0-254" name="__codelineno-0-254"></a>    <span class="k">for</span> <span class="n">edge</span> <span class="ow">in</span> <span class="n">possibly_ranked_edges</span><span class="p">:</span>
-</span><span id="__span-0-255"><a id="__codelineno-0-255" name="__codelineno-0-255"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">edge</span><span class="p">)</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="__span-0-256"><a id="__codelineno-0-256" name="__codelineno-0-256"></a>            <span class="k">continue</span>
-</span><span id="__span-0-257"><a id="__codelineno-0-257" name="__codelineno-0-257"></a>
-</span><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a>        <span class="n">left</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-259"><a id="__codelineno-0-259" name="__codelineno-0-259"></a>        <span class="n">right</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-260"><a id="__codelineno-0-260" name="__codelineno-0-260"></a>
-</span><span id="__span-0-261"><a id="__codelineno-0-261" name="__codelineno-0-261"></a>        <span class="k">if</span> <span class="n">edge</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="ow">in</span> <span class="n">tags</span><span class="p">:</span>
-</span><span id="__span-0-262"><a id="__codelineno-0-262" name="__codelineno-0-262"></a>            <span class="n">left</span> <span class="o">=</span> <span class="n">edge</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-263"><a id="__codelineno-0-263" name="__codelineno-0-263"></a>        <span class="k">elif</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">edge</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="si">}</span><span class="s2"> mean&quot;</span> <span class="ow">in</span> <span class="n">tags</span><span class="p">:</span>
-</span><span id="__span-0-264"><a id="__codelineno-0-264" name="__codelineno-0-264"></a>            <span class="n">left</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">edge</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="si">}</span><span class="s2"> mean&quot;</span>
-</span><span id="__span-0-265"><a id="__codelineno-0-265" name="__codelineno-0-265"></a>
-</span><span id="__span-0-266"><a id="__codelineno-0-266" name="__codelineno-0-266"></a>        <span class="k">if</span> <span class="n">edge</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="ow">in</span> <span class="n">tags</span><span class="p">:</span>
-</span><span id="__span-0-267"><a id="__codelineno-0-267" name="__codelineno-0-267"></a>            <span class="n">right</span> <span class="o">=</span> <span class="n">edge</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
-</span><span id="__span-0-268"><a id="__codelineno-0-268" name="__codelineno-0-268"></a>        <span class="k">elif</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">edge</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span><span class="si">}</span><span class="s2"> mean&quot;</span> <span class="ow">in</span> <span class="n">tags</span><span class="p">:</span>
-</span><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a>            <span class="n">right</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">edge</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span><span class="si">}</span><span class="s2"> mean&quot;</span>
-</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a>
-</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a>        <span class="k">if</span> <span class="n">left</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">right</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a>            <span class="n">ranked_edges</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">Edge</span><span class="p">((</span><span class="n">left</span><span class="p">,</span> <span class="n">right</span><span class="p">)))</span>
-</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a>
-</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a>    <span class="bp">cls</span><span class="o">.</span><span class="n">cache</span> <span class="o">=</span> <span class="n">ranked_edges</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
-</span><span id="__span-0-275"><a id="__codelineno-0-275" name="__codelineno-0-275"></a>    <span class="k">return</span> <span class="n">ranked_edges</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-251"><a id="__codelineno-0-251" name="__codelineno-0-251"></a>    <span class="n">ranked_edges</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-252"><a id="__codelineno-0-252" name="__codelineno-0-252"></a>    <span class="n">tags</span> <span class="o">=</span> <span class="n">data_tags</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span>
+</span><span id="__span-0-253"><a id="__codelineno-0-253" name="__codelineno-0-253"></a>    <span class="k">for</span> <span class="n">edge</span> <span class="ow">in</span> <span class="n">possibly_ranked_edges</span><span class="p">:</span>
+</span><span id="__span-0-254"><a id="__codelineno-0-254" name="__codelineno-0-254"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">edge</span><span class="p">)</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="__span-0-255"><a id="__codelineno-0-255" name="__codelineno-0-255"></a>            <span class="k">continue</span>
+</span><span id="__span-0-256"><a id="__codelineno-0-256" name="__codelineno-0-256"></a>
+</span><span id="__span-0-257"><a id="__codelineno-0-257" name="__codelineno-0-257"></a>        <span class="n">left</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a>        <span class="n">right</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-259"><a id="__codelineno-0-259" name="__codelineno-0-259"></a>
+</span><span id="__span-0-260"><a id="__codelineno-0-260" name="__codelineno-0-260"></a>        <span class="k">if</span> <span class="n">edge</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="ow">in</span> <span class="n">tags</span><span class="p">:</span>
+</span><span id="__span-0-261"><a id="__codelineno-0-261" name="__codelineno-0-261"></a>            <span class="n">left</span> <span class="o">=</span> <span class="n">edge</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-262"><a id="__codelineno-0-262" name="__codelineno-0-262"></a>        <span class="k">elif</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">edge</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="si">}</span><span class="s2"> mean&quot;</span> <span class="ow">in</span> <span class="n">tags</span><span class="p">:</span>
+</span><span id="__span-0-263"><a id="__codelineno-0-263" name="__codelineno-0-263"></a>            <span class="n">left</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">edge</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="si">}</span><span class="s2"> mean&quot;</span>
+</span><span id="__span-0-264"><a id="__codelineno-0-264" name="__codelineno-0-264"></a>
+</span><span id="__span-0-265"><a id="__codelineno-0-265" name="__codelineno-0-265"></a>        <span class="k">if</span> <span class="n">edge</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="ow">in</span> <span class="n">tags</span><span class="p">:</span>
+</span><span id="__span-0-266"><a id="__codelineno-0-266" name="__codelineno-0-266"></a>            <span class="n">right</span> <span class="o">=</span> <span class="n">edge</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="__span-0-267"><a id="__codelineno-0-267" name="__codelineno-0-267"></a>        <span class="k">elif</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">edge</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span><span class="si">}</span><span class="s2"> mean&quot;</span> <span class="ow">in</span> <span class="n">tags</span><span class="p">:</span>
+</span><span id="__span-0-268"><a id="__codelineno-0-268" name="__codelineno-0-268"></a>            <span class="n">right</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">edge</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span><span class="si">}</span><span class="s2"> mean&quot;</span>
+</span><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a>
+</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a>        <span class="k">if</span> <span class="n">left</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">right</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a>            <span class="n">ranked_edges</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">Edge</span><span class="p">((</span><span class="n">left</span><span class="p">,</span> <span class="n">right</span><span class="p">)))</span>
+</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a>
+</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a>    <span class="bp">cls</span><span class="o">.</span><span class="n">cache</span> <span class="o">=</span> <span class="n">ranked_edges</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
+</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a>    <span class="k">return</span> <span class="n">ranked_edges</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
diff --git a/reference/logos/logos/index.html b/reference/logos/logos/index.html
index 30ba8da..aae001f 100644
--- a/reference/logos/logos/index.html
+++ b/reference/logos/logos/index.html
@@ -576,6 +576,15 @@
     </span>
   </a>
   
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#logos.logos.LOGos.set_verbose_to" class="md-nav__link">
+    <span class="md-ellipsis">
+      set_verbose_to
+    </span>
+  </a>
+  
 </li>
         
           <li class="md-nav__item">
@@ -1573,6 +1582,15 @@
     </span>
   </a>
   
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#logos.logos.LOGos.set_verbose_to" class="md-nav__link">
+    <span class="md-ellipsis">
+      set_verbose_to
+    </span>
+  </a>
+  
 </li>
         
           <li class="md-nav__item">
@@ -3538,7 +3556,19 @@ <h2 id="logos.logos.LOGos" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-1675">1675</a></span>
 <span class="normal"><a href="#__codelineno-0-1676">1676</a></span>
 <span class="normal"><a href="#__codelineno-0-1677">1677</a></span>
-<span class="normal"><a href="#__codelineno-0-1678">1678</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-46"><a id="__codelineno-0-46" name="__codelineno-0-46"></a><span class="k">class</span> <span class="nc">LOGos</span><span class="p">:</span>
+<span class="normal"><a href="#__codelineno-0-1678">1678</a></span>
+<span class="normal"><a href="#__codelineno-0-1679">1679</a></span>
+<span class="normal"><a href="#__codelineno-0-1680">1680</a></span>
+<span class="normal"><a href="#__codelineno-0-1681">1681</a></span>
+<span class="normal"><a href="#__codelineno-0-1682">1682</a></span>
+<span class="normal"><a href="#__codelineno-0-1683">1683</a></span>
+<span class="normal"><a href="#__codelineno-0-1684">1684</a></span>
+<span class="normal"><a href="#__codelineno-0-1685">1685</a></span>
+<span class="normal"><a href="#__codelineno-0-1686">1686</a></span>
+<span class="normal"><a href="#__codelineno-0-1687">1687</a></span>
+<span class="normal"><a href="#__codelineno-0-1688">1688</a></span>
+<span class="normal"><a href="#__codelineno-0-1689">1689</a></span>
+<span class="normal"><a href="#__codelineno-0-1690">1690</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-46"><a id="__codelineno-0-46" name="__codelineno-0-46"></a><span class="k">class</span> <span class="nc">LOGos</span><span class="p">:</span>
 </span><span id="__span-0-47"><a id="__codelineno-0-47" name="__codelineno-0-47"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
 </span><span id="__span-0-48"><a id="__codelineno-0-48" name="__codelineno-0-48"></a><span class="sd">    LOGos provides a high-level interface for causal analysis of event logs.</span>
 </span><span id="__span-0-49"><a id="__codelineno-0-49" name="__codelineno-0-49"></a><span class="sd">    &quot;&quot;&quot;</span>
@@ -3674,1503 +3704,1515 @@ <h2 id="logos.logos.LOGos" class="doc doc-heading">
 </span><span id="__span-0-179"><a id="__codelineno-0-179" name="__codelineno-0-179"></a>
 </span><span id="__span-0-180"><a id="__codelineno-0-180" name="__codelineno-0-180"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_set_vars_to_defaults</span><span class="p">()</span>
 </span><span id="__span-0-181"><a id="__codelineno-0-181" name="__codelineno-0-181"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_filename</span> <span class="o">=</span> <span class="n">filename</span>
-</span><span id="__span-0-182"><a id="__codelineno-0-182" name="__codelineno-0-182"></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Initialized LOGos with log file </span><span class="si">{</span><span class="n">filename</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-182"><a id="__codelineno-0-182" name="__codelineno-0-182"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Initialized LOGos with log file </span><span class="si">{</span><span class="n">filename</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
 </span><span id="__span-0-183"><a id="__codelineno-0-183" name="__codelineno-0-183"></a>
 </span><span id="__span-0-184"><a id="__codelineno-0-184" name="__codelineno-0-184"></a>        <span class="c1"># Set and create working directory</span>
 </span><span id="__span-0-185"><a id="__codelineno-0-185" name="__codelineno-0-185"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_workdir</span> <span class="o">=</span> <span class="n">workdir</span>
 </span><span id="__span-0-186"><a id="__codelineno-0-186" name="__codelineno-0-186"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">exists</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_workdir</span><span class="p">):</span>
 </span><span id="__span-0-187"><a id="__codelineno-0-187" name="__codelineno-0-187"></a>            <span class="n">os</span><span class="o">.</span><span class="n">makedirs</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_workdir</span><span class="p">,</span> <span class="n">exist_ok</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-188"><a id="__codelineno-0-188" name="__codelineno-0-188"></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Work directory set to </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_workdir</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-188"><a id="__codelineno-0-188" name="__codelineno-0-188"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Work directory set to </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_workdir</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
 </span><span id="__span-0-189"><a id="__codelineno-0-189" name="__codelineno-0-189"></a>
 </span><span id="__span-0-190"><a id="__codelineno-0-190" name="__codelineno-0-190"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_skip_writeout</span> <span class="o">=</span> <span class="n">skip_writeout</span>
 </span><span id="__span-0-191"><a id="__codelineno-0-191" name="__codelineno-0-191"></a>
-</span><span id="__span-0-192"><a id="__codelineno-0-192" name="__codelineno-0-192"></a>    <span class="k">def</span> <span class="nf">_get_filename</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">var_name</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-192"><a id="__codelineno-0-192" name="__codelineno-0-192"></a>    <span class="k">def</span> <span class="nf">set_verbose_to</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">val</span><span class="p">:</span> <span class="nb">bool</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
 </span><span id="__span-0-193"><a id="__codelineno-0-193" name="__codelineno-0-193"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-194"><a id="__codelineno-0-194" name="__codelineno-0-194"></a><span class="sd">        Create the file name string for dumping/loading pkl files.</span>
+</span><span id="__span-0-194"><a id="__codelineno-0-194" name="__codelineno-0-194"></a><span class="sd">        Set the verbosity of the printer.</span>
 </span><span id="__span-0-195"><a id="__codelineno-0-195" name="__codelineno-0-195"></a>
 </span><span id="__span-0-196"><a id="__codelineno-0-196" name="__codelineno-0-196"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-197"><a id="__codelineno-0-197" name="__codelineno-0-197"></a><span class="sd">            var_name: The name of the variable to be dumped/loaded.</span>
-</span><span id="__span-0-198"><a id="__codelineno-0-198" name="__codelineno-0-198"></a>
-</span><span id="__span-0-199"><a id="__codelineno-0-199" name="__codelineno-0-199"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-200"><a id="__codelineno-0-200" name="__codelineno-0-200"></a><span class="sd">            The file name string.</span>
-</span><span id="__span-0-201"><a id="__codelineno-0-201" name="__codelineno-0-201"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-202"><a id="__codelineno-0-202" name="__codelineno-0-202"></a>        <span class="k">return</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span>
-</span><span id="__span-0-203"><a id="__codelineno-0-203" name="__codelineno-0-203"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_workdir</span><span class="p">,</span>
-</span><span id="__span-0-204"><a id="__codelineno-0-204" name="__codelineno-0-204"></a>            <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">basename</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_filename</span><span class="p">)</span>
-</span><span id="__span-0-205"><a id="__codelineno-0-205" name="__codelineno-0-205"></a>            <span class="o">+</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">var_name</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span><span class="si">}</span><span class="s2">.pkl&quot;</span><span class="p">,</span>
-</span><span id="__span-0-206"><a id="__codelineno-0-206" name="__codelineno-0-206"></a>        <span class="p">)</span>
-</span><span id="__span-0-207"><a id="__codelineno-0-207" name="__codelineno-0-207"></a>
-</span><span id="__span-0-208"><a id="__codelineno-0-208" name="__codelineno-0-208"></a>    <span class="k">def</span> <span class="nf">_find_type</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">row</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-</span><span id="__span-0-209"><a id="__codelineno-0-209" name="__codelineno-0-209"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-210"><a id="__codelineno-0-210" name="__codelineno-0-210"></a><span class="sd">        Identify the type of a parsed variable.</span>
-</span><span id="__span-0-211"><a id="__codelineno-0-211" name="__codelineno-0-211"></a>
-</span><span id="__span-0-212"><a id="__codelineno-0-212" name="__codelineno-0-212"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-213"><a id="__codelineno-0-213" name="__codelineno-0-213"></a><span class="sd">            row: A row of the parsed variables dataframe.</span>
-</span><span id="__span-0-214"><a id="__codelineno-0-214" name="__codelineno-0-214"></a>
-</span><span id="__span-0-215"><a id="__codelineno-0-215" name="__codelineno-0-215"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-216"><a id="__codelineno-0-216" name="__codelineno-0-216"></a><span class="sd">            The type of the parsed variable as a string. Options are &quot;date&quot;, &quot;time&quot;, &quot;num&quot; and &quot;str&quot;.</span>
-</span><span id="__span-0-217"><a id="__codelineno-0-217" name="__codelineno-0-217"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-197"><a id="__codelineno-0-197" name="__codelineno-0-197"></a><span class="sd">            val: The new verbosity value.</span>
+</span><span id="__span-0-198"><a id="__codelineno-0-198" name="__codelineno-0-198"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-199"><a id="__codelineno-0-199" name="__codelineno-0-199"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">set_verbose</span><span class="p">(</span><span class="n">val</span><span class="p">)</span>
+</span><span id="__span-0-200"><a id="__codelineno-0-200" name="__codelineno-0-200"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="p">:</span>
+</span><span id="__span-0-201"><a id="__codelineno-0-201" name="__codelineno-0-201"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">set_verbose_to</span><span class="p">(</span><span class="n">val</span><span class="p">)</span>
+</span><span id="__span-0-202"><a id="__codelineno-0-202" name="__codelineno-0-202"></a>
+</span><span id="__span-0-203"><a id="__codelineno-0-203" name="__codelineno-0-203"></a>    <span class="k">def</span> <span class="nf">_get_filename</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">var_name</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-204"><a id="__codelineno-0-204" name="__codelineno-0-204"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-205"><a id="__codelineno-0-205" name="__codelineno-0-205"></a><span class="sd">        Create the file name string for dumping/loading pkl files.</span>
+</span><span id="__span-0-206"><a id="__codelineno-0-206" name="__codelineno-0-206"></a>
+</span><span id="__span-0-207"><a id="__codelineno-0-207" name="__codelineno-0-207"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-208"><a id="__codelineno-0-208" name="__codelineno-0-208"></a><span class="sd">            var_name: The name of the variable to be dumped/loaded.</span>
+</span><span id="__span-0-209"><a id="__codelineno-0-209" name="__codelineno-0-209"></a>
+</span><span id="__span-0-210"><a id="__codelineno-0-210" name="__codelineno-0-210"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-211"><a id="__codelineno-0-211" name="__codelineno-0-211"></a><span class="sd">            The file name string.</span>
+</span><span id="__span-0-212"><a id="__codelineno-0-212" name="__codelineno-0-212"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-213"><a id="__codelineno-0-213" name="__codelineno-0-213"></a>        <span class="k">return</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span>
+</span><span id="__span-0-214"><a id="__codelineno-0-214" name="__codelineno-0-214"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_workdir</span><span class="p">,</span>
+</span><span id="__span-0-215"><a id="__codelineno-0-215" name="__codelineno-0-215"></a>            <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">basename</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_filename</span><span class="p">)</span>
+</span><span id="__span-0-216"><a id="__codelineno-0-216" name="__codelineno-0-216"></a>            <span class="o">+</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">var_name</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span><span class="si">}</span><span class="s2">.pkl&quot;</span><span class="p">,</span>
+</span><span id="__span-0-217"><a id="__codelineno-0-217" name="__codelineno-0-217"></a>        <span class="p">)</span>
 </span><span id="__span-0-218"><a id="__codelineno-0-218" name="__codelineno-0-218"></a>
-</span><span id="__span-0-219"><a id="__codelineno-0-219" name="__codelineno-0-219"></a>        <span class="k">with</span> <span class="n">warnings</span><span class="o">.</span><span class="n">catch_warnings</span><span class="p">():</span>
-</span><span id="__span-0-220"><a id="__codelineno-0-220" name="__codelineno-0-220"></a>            <span class="n">warnings</span><span class="o">.</span><span class="n">filterwarnings</span><span class="p">(</span><span class="s2">&quot;error&quot;</span><span class="p">,</span> <span class="n">category</span><span class="o">=</span><span class="ne">UserWarning</span><span class="p">)</span>
-</span><span id="__span-0-221"><a id="__codelineno-0-221" name="__codelineno-0-221"></a>
-</span><span id="__span-0-222"><a id="__codelineno-0-222" name="__codelineno-0-222"></a>            <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-223"><a id="__codelineno-0-223" name="__codelineno-0-223"></a>                <span class="n">y</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">to_numeric</span><span class="p">(</span><span class="n">row</span><span class="p">[</span><span class="s2">&quot;Examples&quot;</span><span class="p">],</span> <span class="n">errors</span><span class="o">=</span><span class="s2">&quot;raise&quot;</span><span class="p">)</span>
-</span><span id="__span-0-224"><a id="__codelineno-0-224" name="__codelineno-0-224"></a>                <span class="k">return</span> <span class="s2">&quot;num&quot;</span>
-</span><span id="__span-0-225"><a id="__codelineno-0-225" name="__codelineno-0-225"></a>            <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
-</span><span id="__span-0-226"><a id="__codelineno-0-226" name="__codelineno-0-226"></a>                <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-227"><a id="__codelineno-0-227" name="__codelineno-0-227"></a>                    <span class="n">y</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">to_timedelta</span><span class="p">(</span><span class="n">row</span><span class="p">[</span><span class="s2">&quot;Examples&quot;</span><span class="p">],</span> <span class="n">errors</span><span class="o">=</span><span class="s2">&quot;raise&quot;</span><span class="p">)</span>
-</span><span id="__span-0-228"><a id="__codelineno-0-228" name="__codelineno-0-228"></a>                    <span class="k">return</span> <span class="s2">&quot;time&quot;</span>
-</span><span id="__span-0-229"><a id="__codelineno-0-229" name="__codelineno-0-229"></a>                <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
-</span><span id="__span-0-230"><a id="__codelineno-0-230" name="__codelineno-0-230"></a>                    <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-231"><a id="__codelineno-0-231" name="__codelineno-0-231"></a>                        <span class="n">y</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">to_datetime</span><span class="p">(</span><span class="n">row</span><span class="p">[</span><span class="s2">&quot;Examples&quot;</span><span class="p">],</span> <span class="n">errors</span><span class="o">=</span><span class="s2">&quot;raise&quot;</span><span class="p">)</span>
-</span><span id="__span-0-232"><a id="__codelineno-0-232" name="__codelineno-0-232"></a>                        <span class="k">return</span> <span class="s2">&quot;date&quot;</span>
-</span><span id="__span-0-233"><a id="__codelineno-0-233" name="__codelineno-0-233"></a>                    <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
-</span><span id="__span-0-234"><a id="__codelineno-0-234" name="__codelineno-0-234"></a>                        <span class="k">return</span> <span class="s2">&quot;str&quot;</span>
-</span><span id="__span-0-235"><a id="__codelineno-0-235" name="__codelineno-0-235"></a>
-</span><span id="__span-0-236"><a id="__codelineno-0-236" name="__codelineno-0-236"></a>    <span class="k">def</span> <span class="nf">_find_uninteresting</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">row</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">bool</span><span class="p">:</span>
-</span><span id="__span-0-237"><a id="__codelineno-0-237" name="__codelineno-0-237"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-238"><a id="__codelineno-0-238" name="__codelineno-0-238"></a><span class="sd">        Identify whether a parsed variable is likely to be uninteresting.</span>
-</span><span id="__span-0-239"><a id="__codelineno-0-239" name="__codelineno-0-239"></a>
-</span><span id="__span-0-240"><a id="__codelineno-0-240" name="__codelineno-0-240"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-241"><a id="__codelineno-0-241" name="__codelineno-0-241"></a><span class="sd">            row: A row of the parsed variables dataframe.</span>
-</span><span id="__span-0-242"><a id="__codelineno-0-242" name="__codelineno-0-242"></a>
-</span><span id="__span-0-243"><a id="__codelineno-0-243" name="__codelineno-0-243"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-244"><a id="__codelineno-0-244" name="__codelineno-0-244"></a><span class="sd">            True if the variable is likely to be uninteresting, False otherwise.</span>
-</span><span id="__span-0-245"><a id="__codelineno-0-245" name="__codelineno-0-245"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-246"><a id="__codelineno-0-246" name="__codelineno-0-246"></a>        <span class="k">return</span> <span class="p">(</span>
-</span><span id="__span-0-247"><a id="__codelineno-0-247" name="__codelineno-0-247"></a>            <span class="n">row</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;num&quot;</span>
-</span><span id="__span-0-248"><a id="__codelineno-0-248" name="__codelineno-0-248"></a>            <span class="ow">and</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]]</span><span class="o">.</span><span class="n">nunique</span><span class="p">()</span> <span class="o">&gt;=</span> <span class="mf">0.15</span> <span class="o">*</span> <span class="n">row</span><span class="p">[</span><span class="s2">&quot;Occurrences&quot;</span><span class="p">])</span>
-</span><span id="__span-0-249"><a id="__codelineno-0-249" name="__codelineno-0-249"></a>        <span class="p">)</span> <span class="ow">or</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]]</span><span class="o">.</span><span class="n">nunique</span><span class="p">()</span> <span class="o">==</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="__span-0-219"><a id="__codelineno-0-219" name="__codelineno-0-219"></a>    <span class="k">def</span> <span class="nf">_find_type</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">row</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-220"><a id="__codelineno-0-220" name="__codelineno-0-220"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-221"><a id="__codelineno-0-221" name="__codelineno-0-221"></a><span class="sd">        Identify the type of a parsed variable.</span>
+</span><span id="__span-0-222"><a id="__codelineno-0-222" name="__codelineno-0-222"></a>
+</span><span id="__span-0-223"><a id="__codelineno-0-223" name="__codelineno-0-223"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-224"><a id="__codelineno-0-224" name="__codelineno-0-224"></a><span class="sd">            row: A row of the parsed variables dataframe.</span>
+</span><span id="__span-0-225"><a id="__codelineno-0-225" name="__codelineno-0-225"></a>
+</span><span id="__span-0-226"><a id="__codelineno-0-226" name="__codelineno-0-226"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-227"><a id="__codelineno-0-227" name="__codelineno-0-227"></a><span class="sd">            The type of the parsed variable as a string. Options are &quot;date&quot;, &quot;time&quot;, &quot;num&quot; and &quot;str&quot;.</span>
+</span><span id="__span-0-228"><a id="__codelineno-0-228" name="__codelineno-0-228"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-229"><a id="__codelineno-0-229" name="__codelineno-0-229"></a>
+</span><span id="__span-0-230"><a id="__codelineno-0-230" name="__codelineno-0-230"></a>        <span class="k">with</span> <span class="n">warnings</span><span class="o">.</span><span class="n">catch_warnings</span><span class="p">():</span>
+</span><span id="__span-0-231"><a id="__codelineno-0-231" name="__codelineno-0-231"></a>            <span class="n">warnings</span><span class="o">.</span><span class="n">filterwarnings</span><span class="p">(</span><span class="s2">&quot;error&quot;</span><span class="p">,</span> <span class="n">category</span><span class="o">=</span><span class="ne">UserWarning</span><span class="p">)</span>
+</span><span id="__span-0-232"><a id="__codelineno-0-232" name="__codelineno-0-232"></a>
+</span><span id="__span-0-233"><a id="__codelineno-0-233" name="__codelineno-0-233"></a>            <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-234"><a id="__codelineno-0-234" name="__codelineno-0-234"></a>                <span class="n">y</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">to_numeric</span><span class="p">(</span><span class="n">row</span><span class="p">[</span><span class="s2">&quot;Examples&quot;</span><span class="p">],</span> <span class="n">errors</span><span class="o">=</span><span class="s2">&quot;raise&quot;</span><span class="p">)</span>
+</span><span id="__span-0-235"><a id="__codelineno-0-235" name="__codelineno-0-235"></a>                <span class="k">return</span> <span class="s2">&quot;num&quot;</span>
+</span><span id="__span-0-236"><a id="__codelineno-0-236" name="__codelineno-0-236"></a>            <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-237"><a id="__codelineno-0-237" name="__codelineno-0-237"></a>                <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-238"><a id="__codelineno-0-238" name="__codelineno-0-238"></a>                    <span class="n">y</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">to_timedelta</span><span class="p">(</span><span class="n">row</span><span class="p">[</span><span class="s2">&quot;Examples&quot;</span><span class="p">],</span> <span class="n">errors</span><span class="o">=</span><span class="s2">&quot;raise&quot;</span><span class="p">)</span>
+</span><span id="__span-0-239"><a id="__codelineno-0-239" name="__codelineno-0-239"></a>                    <span class="k">return</span> <span class="s2">&quot;time&quot;</span>
+</span><span id="__span-0-240"><a id="__codelineno-0-240" name="__codelineno-0-240"></a>                <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-241"><a id="__codelineno-0-241" name="__codelineno-0-241"></a>                    <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-242"><a id="__codelineno-0-242" name="__codelineno-0-242"></a>                        <span class="n">y</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">to_datetime</span><span class="p">(</span><span class="n">row</span><span class="p">[</span><span class="s2">&quot;Examples&quot;</span><span class="p">],</span> <span class="n">errors</span><span class="o">=</span><span class="s2">&quot;raise&quot;</span><span class="p">)</span>
+</span><span id="__span-0-243"><a id="__codelineno-0-243" name="__codelineno-0-243"></a>                        <span class="k">return</span> <span class="s2">&quot;date&quot;</span>
+</span><span id="__span-0-244"><a id="__codelineno-0-244" name="__codelineno-0-244"></a>                    <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-245"><a id="__codelineno-0-245" name="__codelineno-0-245"></a>                        <span class="k">return</span> <span class="s2">&quot;str&quot;</span>
+</span><span id="__span-0-246"><a id="__codelineno-0-246" name="__codelineno-0-246"></a>
+</span><span id="__span-0-247"><a id="__codelineno-0-247" name="__codelineno-0-247"></a>    <span class="k">def</span> <span class="nf">_find_uninteresting</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">row</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">bool</span><span class="p">:</span>
+</span><span id="__span-0-248"><a id="__codelineno-0-248" name="__codelineno-0-248"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-249"><a id="__codelineno-0-249" name="__codelineno-0-249"></a><span class="sd">        Identify whether a parsed variable is likely to be uninteresting.</span>
 </span><span id="__span-0-250"><a id="__codelineno-0-250" name="__codelineno-0-250"></a>
-</span><span id="__span-0-251"><a id="__codelineno-0-251" name="__codelineno-0-251"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-252"><a id="__codelineno-0-252" name="__codelineno-0-252"></a><span class="sd">    A default dictionary of regular expressions to be used for parsing the log.</span>
-</span><span id="__span-0-253"><a id="__codelineno-0-253" name="__codelineno-0-253"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-254"><a id="__codelineno-0-254" name="__codelineno-0-254"></a>    <span class="n">DEFAULT_REGEX_DICT</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="__span-0-255"><a id="__codelineno-0-255" name="__codelineno-0-255"></a>        <span class="s2">&quot;Timestamp&quot;</span><span class="p">:</span> <span class="sa">r</span><span class="s2">&quot;\d</span><span class="si">{4}</span><span class="s2">\-\d</span><span class="si">{2}</span><span class="s2">\-\d</span><span class="si">{2}</span><span class="s2">T\d</span><span class="si">{2}</span><span class="s2">:\d</span><span class="si">{2}</span><span class="s2">:\d</span><span class="si">{2}</span><span class="s2">\.\d</span><span class="si">{6}</span><span class="s2">Z&quot;</span><span class="p">,</span>
-</span><span id="__span-0-256"><a id="__codelineno-0-256" name="__codelineno-0-256"></a>    <span class="p">}</span>
-</span><span id="__span-0-257"><a id="__codelineno-0-257" name="__codelineno-0-257"></a>
-</span><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a>    <span class="k">def</span> <span class="nf">parse</span><span class="p">(</span>
-</span><span id="__span-0-259"><a id="__codelineno-0-259" name="__codelineno-0-259"></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-260"><a id="__codelineno-0-260" name="__codelineno-0-260"></a>        <span class="n">regex_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="n">DEFAULT_REGEX_DICT</span><span class="p">,</span>
-</span><span id="__span-0-261"><a id="__codelineno-0-261" name="__codelineno-0-261"></a>        <span class="n">sim_thresh</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.65</span><span class="p">,</span>
-</span><span id="__span-0-262"><a id="__codelineno-0-262" name="__codelineno-0-262"></a>        <span class="n">depth</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">5</span><span class="p">,</span>
-</span><span id="__span-0-263"><a id="__codelineno-0-263" name="__codelineno-0-263"></a>        <span class="n">force</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="__span-0-264"><a id="__codelineno-0-264" name="__codelineno-0-264"></a>        <span class="n">message_prefix</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="sa">r</span><span class="s2">&quot;.*&quot;</span><span class="p">,</span>
-</span><span id="__span-0-265"><a id="__codelineno-0-265" name="__codelineno-0-265"></a>        <span class="n">enable_gpt_tagging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="__span-0-266"><a id="__codelineno-0-266" name="__codelineno-0-266"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-</span><span id="__span-0-267"><a id="__codelineno-0-267" name="__codelineno-0-267"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-268"><a id="__codelineno-0-268" name="__codelineno-0-268"></a><span class="sd">        Parse the log file into a dataframe.</span>
-</span><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a>
-</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a><span class="sd">            regex_dict: (for Drain) A dictionary of regular expressions to be used for parsing.</span>
-</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a><span class="sd">            sim_thresh: (for Drain) The similarity threshold to be used for parsing.</span>
-</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a><span class="sd">            depth: (for Drain) The parse tree depth to be used for parsing.</span>
-</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a><span class="sd">            force: Whether to force re-parsing of the log file.</span>
-</span><span id="__span-0-275"><a id="__codelineno-0-275" name="__codelineno-0-275"></a><span class="sd">            message_prefix: A prefix used to identify the beginning of each log message.</span>
-</span><span id="__span-0-276"><a id="__codelineno-0-276" name="__codelineno-0-276"></a><span class="sd">                Can be used to collapse multiple lines into a single message. Each line that doesn&#39;t start with this</span>
-</span><span id="__span-0-277"><a id="__codelineno-0-277" name="__codelineno-0-277"></a><span class="sd">                prefix will be concatenated to the previous log message.</span>
-</span><span id="__span-0-278"><a id="__codelineno-0-278" name="__codelineno-0-278"></a><span class="sd">            enable_gpt_tagging: A boolean indicating whether GPT tagging should be enabled.</span>
-</span><span id="__span-0-279"><a id="__codelineno-0-279" name="__codelineno-0-279"></a>
-</span><span id="__span-0-280"><a id="__codelineno-0-280" name="__codelineno-0-280"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-281"><a id="__codelineno-0-281" name="__codelineno-0-281"></a><span class="sd">            The time elapsed for parsing, as a string.</span>
-</span><span id="__span-0-282"><a id="__codelineno-0-282" name="__codelineno-0-282"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-283"><a id="__codelineno-0-283" name="__codelineno-0-283"></a>        <span class="n">start_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
-</span><span id="__span-0-284"><a id="__codelineno-0-284" name="__codelineno-0-284"></a>        <span class="n">parser</span> <span class="o">=</span> <span class="n">Drain</span><span class="p">(</span>
-</span><span id="__span-0-285"><a id="__codelineno-0-285" name="__codelineno-0-285"></a>            <span class="n">indir</span><span class="o">=</span><span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">dirname</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_filename</span><span class="p">),</span>
-</span><span id="__span-0-286"><a id="__codelineno-0-286" name="__codelineno-0-286"></a>            <span class="n">depth</span><span class="o">=</span><span class="n">depth</span><span class="p">,</span>
-</span><span id="__span-0-287"><a id="__codelineno-0-287" name="__codelineno-0-287"></a>            <span class="n">st</span><span class="o">=</span><span class="n">sim_thresh</span><span class="p">,</span>
-</span><span id="__span-0-288"><a id="__codelineno-0-288" name="__codelineno-0-288"></a>            <span class="n">rex</span><span class="o">=</span><span class="n">regex_dict</span><span class="p">,</span>
-</span><span id="__span-0-289"><a id="__codelineno-0-289" name="__codelineno-0-289"></a>            <span class="n">skip_writeout</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_skip_writeout</span><span class="p">,</span>
-</span><span id="__span-0-290"><a id="__codelineno-0-290" name="__codelineno-0-290"></a>            <span class="n">message_prefix</span><span class="o">=</span><span class="n">message_prefix</span><span class="p">,</span>
-</span><span id="__span-0-291"><a id="__codelineno-0-291" name="__codelineno-0-291"></a>        <span class="p">)</span>
-</span><span id="__span-0-292"><a id="__codelineno-0-292" name="__codelineno-0-292"></a>
-</span><span id="__span-0-293"><a id="__codelineno-0-293" name="__codelineno-0-293"></a>        <span class="c1"># Check if the parsed files already exist.</span>
-</span><span id="__span-0-294"><a id="__codelineno-0-294" name="__codelineno-0-294"></a>        <span class="n">files_exist</span> <span class="o">=</span> <span class="ow">not</span> <span class="n">force</span>
-</span><span id="__span-0-295"><a id="__codelineno-0-295" name="__codelineno-0-295"></a>        <span class="n">parsed_df_names</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="__span-0-296"><a id="__codelineno-0-296" name="__codelineno-0-296"></a>            <span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">),</span>
-</span><span id="__span-0-297"><a id="__codelineno-0-297" name="__codelineno-0-297"></a>            <span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">),</span>
-</span><span id="__span-0-298"><a id="__codelineno-0-298" name="__codelineno-0-298"></a>            <span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">),</span>
-</span><span id="__span-0-299"><a id="__codelineno-0-299" name="__codelineno-0-299"></a>        <span class="p">]</span>
-</span><span id="__span-0-300"><a id="__codelineno-0-300" name="__codelineno-0-300"></a>        <span class="k">for</span> <span class="n">var_name</span> <span class="ow">in</span> <span class="n">parsed_df_names</span><span class="p">:</span>
-</span><span id="__span-0-301"><a id="__codelineno-0-301" name="__codelineno-0-301"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">isfile</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">var_name</span><span class="p">)):</span>
-</span><span id="__span-0-302"><a id="__codelineno-0-302" name="__codelineno-0-302"></a>                <span class="n">files_exist</span> <span class="o">=</span> <span class="kc">False</span>
-</span><span id="__span-0-303"><a id="__codelineno-0-303" name="__codelineno-0-303"></a>                <span class="k">break</span>
-</span><span id="__span-0-304"><a id="__codelineno-0-304" name="__codelineno-0-304"></a>
-</span><span id="__span-0-305"><a id="__codelineno-0-305" name="__codelineno-0-305"></a>        <span class="k">if</span> <span class="n">files_exist</span><span class="p">:</span>
-</span><span id="__span-0-306"><a id="__codelineno-0-306" name="__codelineno-0-306"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span> <span class="o">=</span> <span class="n">Pickler</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">parsed_df_names</span><span class="p">[</span><span class="mi">0</span><span class="p">]))</span>
-</span><span id="__span-0-307"><a id="__codelineno-0-307" name="__codelineno-0-307"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span> <span class="o">=</span> <span class="n">Pickler</span><span class="o">.</span><span class="n">load</span><span class="p">(</span>
-</span><span id="__span-0-308"><a id="__codelineno-0-308" name="__codelineno-0-308"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">parsed_df_names</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
-</span><span id="__span-0-309"><a id="__codelineno-0-309" name="__codelineno-0-309"></a>            <span class="p">)</span>
-</span><span id="__span-0-310"><a id="__codelineno-0-310" name="__codelineno-0-310"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span> <span class="o">=</span> <span class="n">Pickler</span><span class="o">.</span><span class="n">load</span><span class="p">(</span>
-</span><span id="__span-0-311"><a id="__codelineno-0-311" name="__codelineno-0-311"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">parsed_df_names</span><span class="p">[</span><span class="mi">2</span><span class="p">])</span>
-</span><span id="__span-0-312"><a id="__codelineno-0-312" name="__codelineno-0-312"></a>            <span class="p">)</span>
-</span><span id="__span-0-313"><a id="__codelineno-0-313" name="__codelineno-0-313"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-314"><a id="__codelineno-0-314" name="__codelineno-0-314"></a>            <span class="p">(</span>
-</span><span id="__span-0-315"><a id="__codelineno-0-315" name="__codelineno-0-315"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">,</span>
-</span><span id="__span-0-316"><a id="__codelineno-0-316" name="__codelineno-0-316"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">,</span>
-</span><span id="__span-0-317"><a id="__codelineno-0-317" name="__codelineno-0-317"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span>
-</span><span id="__span-0-318"><a id="__codelineno-0-318" name="__codelineno-0-318"></a>            <span class="p">)</span> <span class="o">=</span> <span class="n">parser</span><span class="o">.</span><span class="n">parse</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_filename</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;/&quot;</span><span class="p">)[</span><span class="o">-</span><span class="mi">1</span><span class="p">])</span>
-</span><span id="__span-0-319"><a id="__codelineno-0-319" name="__codelineno-0-319"></a>            <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Determining variable types...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-320"><a id="__codelineno-0-320" name="__codelineno-0-320"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span>
-</span><span id="__span-0-321"><a id="__codelineno-0-321" name="__codelineno-0-321"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_find_type</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span>
-</span><span id="__span-0-322"><a id="__codelineno-0-322" name="__codelineno-0-322"></a>            <span class="p">)</span>
-</span><span id="__span-0-323"><a id="__codelineno-0-323" name="__codelineno-0-323"></a>
-</span><span id="__span-0-324"><a id="__codelineno-0-324" name="__codelineno-0-324"></a>            <span class="c1"># Cast and convert date columns</span>
-</span><span id="__span-0-325"><a id="__codelineno-0-325" name="__codelineno-0-325"></a>            <span class="n">is_date</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="s2">&quot;date&quot;</span>
-</span><span id="__span-0-326"><a id="__codelineno-0-326" name="__codelineno-0-326"></a>            <span class="n">date_cols</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">is_date</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span><span class="p">]</span>
-</span><span id="__span-0-327"><a id="__codelineno-0-327" name="__codelineno-0-327"></a>            <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Casting date variables...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-328"><a id="__codelineno-0-328" name="__codelineno-0-328"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">date_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">date_cols</span><span class="p">]</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span>
-</span><span id="__span-0-329"><a id="__codelineno-0-329" name="__codelineno-0-329"></a>                <span class="n">pd</span><span class="o">.</span><span class="n">to_datetime</span><span class="p">,</span> <span class="n">errors</span><span class="o">=</span><span class="s2">&quot;coerce&quot;</span>
-</span><span id="__span-0-330"><a id="__codelineno-0-330" name="__codelineno-0-330"></a>            <span class="p">)</span>
-</span><span id="__span-0-331"><a id="__codelineno-0-331" name="__codelineno-0-331"></a>            <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Casting date variables round 2...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-332"><a id="__codelineno-0-332" name="__codelineno-0-332"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">date_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">date_cols</span><span class="p">]</span><span class="o">.</span><span class="n">progress_applymap</span><span class="p">(</span>
-</span><span id="__span-0-333"><a id="__codelineno-0-333" name="__codelineno-0-333"></a>                <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">x</span><span class="o">.</span><span class="n">timestamp</span><span class="p">()</span> <span class="k">if</span> <span class="ow">not</span> <span class="n">pd</span><span class="o">.</span><span class="n">isnull</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="k">else</span> <span class="kc">None</span>
-</span><span id="__span-0-334"><a id="__codelineno-0-334" name="__codelineno-0-334"></a>            <span class="p">)</span>
-</span><span id="__span-0-335"><a id="__codelineno-0-335" name="__codelineno-0-335"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">is_date</span><span class="p">,</span> <span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;num&quot;</span>
-</span><span id="__span-0-336"><a id="__codelineno-0-336" name="__codelineno-0-336"></a>
-</span><span id="__span-0-337"><a id="__codelineno-0-337" name="__codelineno-0-337"></a>            <span class="c1"># Cast and convert time columns</span>
-</span><span id="__span-0-338"><a id="__codelineno-0-338" name="__codelineno-0-338"></a>            <span class="n">is_time</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="s2">&quot;time&quot;</span>
-</span><span id="__span-0-339"><a id="__codelineno-0-339" name="__codelineno-0-339"></a>            <span class="n">time_cols</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">is_time</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span><span class="p">]</span>
-</span><span id="__span-0-340"><a id="__codelineno-0-340" name="__codelineno-0-340"></a>            <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Casting time variables...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-341"><a id="__codelineno-0-341" name="__codelineno-0-341"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">time_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">time_cols</span><span class="p">]</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span>
-</span><span id="__span-0-342"><a id="__codelineno-0-342" name="__codelineno-0-342"></a>                <span class="n">pd</span><span class="o">.</span><span class="n">to_timedelta</span><span class="p">,</span> <span class="n">errors</span><span class="o">=</span><span class="s2">&quot;coerce&quot;</span>
-</span><span id="__span-0-343"><a id="__codelineno-0-343" name="__codelineno-0-343"></a>            <span class="p">)</span>
-</span><span id="__span-0-344"><a id="__codelineno-0-344" name="__codelineno-0-344"></a>            <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Casting time variables round 2...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-345"><a id="__codelineno-0-345" name="__codelineno-0-345"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">time_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">time_cols</span><span class="p">]</span><span class="o">.</span><span class="n">progress_applymap</span><span class="p">(</span>
-</span><span id="__span-0-346"><a id="__codelineno-0-346" name="__codelineno-0-346"></a>                <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">x</span><span class="o">.</span><span class="n">total_seconds</span><span class="p">()</span> <span class="k">if</span> <span class="ow">not</span> <span class="n">pd</span><span class="o">.</span><span class="n">isnull</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="k">else</span> <span class="kc">None</span>
-</span><span id="__span-0-347"><a id="__codelineno-0-347" name="__codelineno-0-347"></a>            <span class="p">)</span>
-</span><span id="__span-0-348"><a id="__codelineno-0-348" name="__codelineno-0-348"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">is_time</span><span class="p">,</span> <span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;num&quot;</span>
-</span><span id="__span-0-349"><a id="__codelineno-0-349" name="__codelineno-0-349"></a>
-</span><span id="__span-0-350"><a id="__codelineno-0-350" name="__codelineno-0-350"></a>            <span class="c1"># Cast numeric columns</span>
-</span><span id="__span-0-351"><a id="__codelineno-0-351" name="__codelineno-0-351"></a>            <span class="n">is_num</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="s2">&quot;num&quot;</span>
-</span><span id="__span-0-352"><a id="__codelineno-0-352" name="__codelineno-0-352"></a>            <span class="n">numeric_cols</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">is_num</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span><span class="p">]</span>
-</span><span id="__span-0-353"><a id="__codelineno-0-353" name="__codelineno-0-353"></a>            <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Casting numerical variables...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-354"><a id="__codelineno-0-354" name="__codelineno-0-354"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">numeric_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span>
-</span><span id="__span-0-355"><a id="__codelineno-0-355" name="__codelineno-0-355"></a>                <span class="n">numeric_cols</span>
-</span><span id="__span-0-356"><a id="__codelineno-0-356" name="__codelineno-0-356"></a>            <span class="p">]</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span><span class="n">pd</span><span class="o">.</span><span class="n">to_numeric</span><span class="p">,</span> <span class="n">errors</span><span class="o">=</span><span class="s2">&quot;coerce&quot;</span><span class="p">)</span>
-</span><span id="__span-0-357"><a id="__codelineno-0-357" name="__codelineno-0-357"></a>
-</span><span id="__span-0-358"><a id="__codelineno-0-358" name="__codelineno-0-358"></a>            <span class="c1"># Tag variables.</span>
-</span><span id="__span-0-359"><a id="__codelineno-0-359" name="__codelineno-0-359"></a>            <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Tagging variables...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-360"><a id="__codelineno-0-360" name="__codelineno-0-360"></a>            <span class="k">if</span> <span class="n">enable_gpt_tagging</span><span class="p">:</span>
-</span><span id="__span-0-361"><a id="__codelineno-0-361" name="__codelineno-0-361"></a>                <span class="n">tag</span><span class="p">,</span> <span class="n">tag_origin</span> <span class="o">=</span> <span class="nb">zip</span><span class="p">(</span>
-</span><span id="__span-0-362"><a id="__codelineno-0-362" name="__codelineno-0-362"></a>                    <span class="o">*</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span>
-</span><span id="__span-0-363"><a id="__codelineno-0-363" name="__codelineno-0-363"></a>                        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">waterfall_tag</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="p">,</span> <span class="n">x</span><span class="p">),</span>
-</span><span id="__span-0-364"><a id="__codelineno-0-364" name="__codelineno-0-364"></a>                        <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-</span><span id="__span-0-365"><a id="__codelineno-0-365" name="__codelineno-0-365"></a>                    <span class="p">)</span>
-</span><span id="__span-0-366"><a id="__codelineno-0-366" name="__codelineno-0-366"></a>                <span class="p">)</span>
-</span><span id="__span-0-367"><a id="__codelineno-0-367" name="__codelineno-0-367"></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-368"><a id="__codelineno-0-368" name="__codelineno-0-368"></a>                <span class="n">tag</span><span class="p">,</span> <span class="n">tag_origin</span> <span class="o">=</span> <span class="nb">zip</span><span class="p">(</span>
-</span><span id="__span-0-369"><a id="__codelineno-0-369" name="__codelineno-0-369"></a>                    <span class="o">*</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span>
-</span><span id="__span-0-370"><a id="__codelineno-0-370" name="__codelineno-0-370"></a>                        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">preceding_tokens_tag</span><span class="p">(</span><span class="n">x</span><span class="p">),</span>
-</span><span id="__span-0-371"><a id="__codelineno-0-371" name="__codelineno-0-371"></a>                        <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-</span><span id="__span-0-372"><a id="__codelineno-0-372" name="__codelineno-0-372"></a>                    <span class="p">)</span>
-</span><span id="__span-0-373"><a id="__codelineno-0-373" name="__codelineno-0-373"></a>                <span class="p">)</span>
-</span><span id="__span-0-374"><a id="__codelineno-0-374" name="__codelineno-0-374"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">tag</span>
-</span><span id="__span-0-375"><a id="__codelineno-0-375" name="__codelineno-0-375"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;TagOrigin&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">tag_origin</span>
-</span><span id="__span-0-376"><a id="__codelineno-0-376" name="__codelineno-0-376"></a>            <span class="n">TagUtils</span><span class="o">.</span><span class="n">deduplicate_tags</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">)</span>
-</span><span id="__span-0-377"><a id="__codelineno-0-377" name="__codelineno-0-377"></a>
-</span><span id="__span-0-378"><a id="__codelineno-0-378" name="__codelineno-0-378"></a>            <span class="c1"># Detect identifiers.</span>
-</span><span id="__span-0-379"><a id="__codelineno-0-379" name="__codelineno-0-379"></a>            <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Detecting identifiers...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-380"><a id="__codelineno-0-380" name="__codelineno-0-380"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;IsUninteresting&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-381"><a id="__codelineno-0-381" name="__codelineno-0-381"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_find_uninteresting</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="__span-0-382"><a id="__codelineno-0-382" name="__codelineno-0-382"></a>            <span class="p">)</span>
-</span><span id="__span-0-383"><a id="__codelineno-0-383" name="__codelineno-0-383"></a>
-</span><span id="__span-0-384"><a id="__codelineno-0-384" name="__codelineno-0-384"></a>            <span class="c1"># Reorder columns.</span>
-</span><span id="__span-0-385"><a id="__codelineno-0-385" name="__codelineno-0-385"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span>
-</span><span id="__span-0-386"><a id="__codelineno-0-386" name="__codelineno-0-386"></a>                <span class="p">[</span>
-</span><span id="__span-0-387"><a id="__codelineno-0-387" name="__codelineno-0-387"></a>                    <span class="s2">&quot;Name&quot;</span><span class="p">,</span>
-</span><span id="__span-0-388"><a id="__codelineno-0-388" name="__codelineno-0-388"></a>                    <span class="s2">&quot;Tag&quot;</span><span class="p">,</span>
-</span><span id="__span-0-389"><a id="__codelineno-0-389" name="__codelineno-0-389"></a>                    <span class="s2">&quot;TagOrigin&quot;</span><span class="p">,</span>
-</span><span id="__span-0-390"><a id="__codelineno-0-390" name="__codelineno-0-390"></a>                    <span class="s2">&quot;Type&quot;</span><span class="p">,</span>
-</span><span id="__span-0-391"><a id="__codelineno-0-391" name="__codelineno-0-391"></a>                    <span class="s2">&quot;IsUninteresting&quot;</span><span class="p">,</span>
-</span><span id="__span-0-392"><a id="__codelineno-0-392" name="__codelineno-0-392"></a>                    <span class="s2">&quot;Occurrences&quot;</span><span class="p">,</span>
-</span><span id="__span-0-393"><a id="__codelineno-0-393" name="__codelineno-0-393"></a>                    <span class="s2">&quot;Preceding 3 tokens&quot;</span><span class="p">,</span>
-</span><span id="__span-0-394"><a id="__codelineno-0-394" name="__codelineno-0-394"></a>                    <span class="s2">&quot;Examples&quot;</span><span class="p">,</span>
-</span><span id="__span-0-395"><a id="__codelineno-0-395" name="__codelineno-0-395"></a>                    <span class="s2">&quot;From regex&quot;</span><span class="p">,</span>
-</span><span id="__span-0-396"><a id="__codelineno-0-396" name="__codelineno-0-396"></a>                <span class="p">]</span>
-</span><span id="__span-0-397"><a id="__codelineno-0-397" name="__codelineno-0-397"></a>            <span class="p">]</span>
-</span><span id="__span-0-398"><a id="__codelineno-0-398" name="__codelineno-0-398"></a>
-</span><span id="__span-0-399"><a id="__codelineno-0-399" name="__codelineno-0-399"></a>        <span class="c1"># Write out files if appropriate.</span>
-</span><span id="__span-0-400"><a id="__codelineno-0-400" name="__codelineno-0-400"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_skip_writeout</span> <span class="ow">and</span> <span class="ow">not</span> <span class="n">files_exist</span><span class="p">:</span>
-</span><span id="__span-0-401"><a id="__codelineno-0-401" name="__codelineno-0-401"></a>            <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">parsed_df_names</span><span class="p">[</span><span class="mi">0</span><span class="p">]))</span>
-</span><span id="__span-0-402"><a id="__codelineno-0-402" name="__codelineno-0-402"></a>            <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">parsed_df_names</span><span class="p">[</span><span class="mi">1</span><span class="p">]))</span>
-</span><span id="__span-0-403"><a id="__codelineno-0-403" name="__codelineno-0-403"></a>            <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">parsed_df_names</span><span class="p">[</span><span class="mi">2</span><span class="p">]))</span>
-</span><span id="__span-0-404"><a id="__codelineno-0-404" name="__codelineno-0-404"></a>
-</span><span id="__span-0-405"><a id="__codelineno-0-405" name="__codelineno-0-405"></a>        <span class="n">end_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
-</span><span id="__span-0-406"><a id="__codelineno-0-406" name="__codelineno-0-406"></a>        <span class="n">elapsed</span> <span class="o">=</span> <span class="s2">&quot;</span><span class="si">{:.6f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">((</span><span class="n">end_time</span> <span class="o">-</span> <span class="n">start_time</span><span class="p">)</span><span class="o">.</span><span class="n">total_seconds</span><span class="p">())</span>
-</span><span id="__span-0-407"><a id="__codelineno-0-407" name="__codelineno-0-407"></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Parsing complete in </span><span class="si">{</span><span class="n">elapsed</span><span class="si">}</span><span class="s2"> seconds!&quot;</span><span class="p">)</span>
-</span><span id="__span-0-408"><a id="__codelineno-0-408" name="__codelineno-0-408"></a>        <span class="k">return</span> <span class="n">elapsed</span>
+</span><span id="__span-0-251"><a id="__codelineno-0-251" name="__codelineno-0-251"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-252"><a id="__codelineno-0-252" name="__codelineno-0-252"></a><span class="sd">            row: A row of the parsed variables dataframe.</span>
+</span><span id="__span-0-253"><a id="__codelineno-0-253" name="__codelineno-0-253"></a>
+</span><span id="__span-0-254"><a id="__codelineno-0-254" name="__codelineno-0-254"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-255"><a id="__codelineno-0-255" name="__codelineno-0-255"></a><span class="sd">            True if the variable is likely to be uninteresting, False otherwise.</span>
+</span><span id="__span-0-256"><a id="__codelineno-0-256" name="__codelineno-0-256"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-257"><a id="__codelineno-0-257" name="__codelineno-0-257"></a>        <span class="k">return</span> <span class="p">(</span>
+</span><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a>            <span class="n">row</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;num&quot;</span>
+</span><span id="__span-0-259"><a id="__codelineno-0-259" name="__codelineno-0-259"></a>            <span class="ow">and</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]]</span><span class="o">.</span><span class="n">nunique</span><span class="p">()</span> <span class="o">&gt;=</span> <span class="mf">0.15</span> <span class="o">*</span> <span class="n">row</span><span class="p">[</span><span class="s2">&quot;Occurrences&quot;</span><span class="p">])</span>
+</span><span id="__span-0-260"><a id="__codelineno-0-260" name="__codelineno-0-260"></a>        <span class="p">)</span> <span class="ow">or</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]]</span><span class="o">.</span><span class="n">nunique</span><span class="p">()</span> <span class="o">==</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="__span-0-261"><a id="__codelineno-0-261" name="__codelineno-0-261"></a>
+</span><span id="__span-0-262"><a id="__codelineno-0-262" name="__codelineno-0-262"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-263"><a id="__codelineno-0-263" name="__codelineno-0-263"></a><span class="sd">    A default dictionary of regular expressions to be used for parsing the log.</span>
+</span><span id="__span-0-264"><a id="__codelineno-0-264" name="__codelineno-0-264"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-265"><a id="__codelineno-0-265" name="__codelineno-0-265"></a>    <span class="n">DEFAULT_REGEX_DICT</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="__span-0-266"><a id="__codelineno-0-266" name="__codelineno-0-266"></a>        <span class="s2">&quot;Timestamp&quot;</span><span class="p">:</span> <span class="sa">r</span><span class="s2">&quot;\d</span><span class="si">{4}</span><span class="s2">\-\d</span><span class="si">{2}</span><span class="s2">\-\d</span><span class="si">{2}</span><span class="s2">T\d</span><span class="si">{2}</span><span class="s2">:\d</span><span class="si">{2}</span><span class="s2">:\d</span><span class="si">{2}</span><span class="s2">\.\d</span><span class="si">{6}</span><span class="s2">Z&quot;</span><span class="p">,</span>
+</span><span id="__span-0-267"><a id="__codelineno-0-267" name="__codelineno-0-267"></a>    <span class="p">}</span>
+</span><span id="__span-0-268"><a id="__codelineno-0-268" name="__codelineno-0-268"></a>
+</span><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a>    <span class="k">def</span> <span class="nf">parse</span><span class="p">(</span>
+</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a>        <span class="n">regex_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="n">DEFAULT_REGEX_DICT</span><span class="p">,</span>
+</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a>        <span class="n">sim_thresh</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.65</span><span class="p">,</span>
+</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a>        <span class="n">depth</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">5</span><span class="p">,</span>
+</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a>        <span class="n">force</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-275"><a id="__codelineno-0-275" name="__codelineno-0-275"></a>        <span class="n">message_prefix</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="sa">r</span><span class="s2">&quot;.*&quot;</span><span class="p">,</span>
+</span><span id="__span-0-276"><a id="__codelineno-0-276" name="__codelineno-0-276"></a>        <span class="n">enable_gpt_tagging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-277"><a id="__codelineno-0-277" name="__codelineno-0-277"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-278"><a id="__codelineno-0-278" name="__codelineno-0-278"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-279"><a id="__codelineno-0-279" name="__codelineno-0-279"></a><span class="sd">        Parse the log file into a dataframe.</span>
+</span><span id="__span-0-280"><a id="__codelineno-0-280" name="__codelineno-0-280"></a>
+</span><span id="__span-0-281"><a id="__codelineno-0-281" name="__codelineno-0-281"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-282"><a id="__codelineno-0-282" name="__codelineno-0-282"></a><span class="sd">            regex_dict: (for Drain) A dictionary of regular expressions to be used for parsing.</span>
+</span><span id="__span-0-283"><a id="__codelineno-0-283" name="__codelineno-0-283"></a><span class="sd">            sim_thresh: (for Drain) The similarity threshold to be used for parsing.</span>
+</span><span id="__span-0-284"><a id="__codelineno-0-284" name="__codelineno-0-284"></a><span class="sd">            depth: (for Drain) The parse tree depth to be used for parsing.</span>
+</span><span id="__span-0-285"><a id="__codelineno-0-285" name="__codelineno-0-285"></a><span class="sd">            force: Whether to force re-parsing of the log file.</span>
+</span><span id="__span-0-286"><a id="__codelineno-0-286" name="__codelineno-0-286"></a><span class="sd">            message_prefix: A prefix used to identify the beginning of each log message.</span>
+</span><span id="__span-0-287"><a id="__codelineno-0-287" name="__codelineno-0-287"></a><span class="sd">                Can be used to collapse multiple lines into a single message. Each line that doesn&#39;t start with this</span>
+</span><span id="__span-0-288"><a id="__codelineno-0-288" name="__codelineno-0-288"></a><span class="sd">                prefix will be concatenated to the previous log message.</span>
+</span><span id="__span-0-289"><a id="__codelineno-0-289" name="__codelineno-0-289"></a><span class="sd">            enable_gpt_tagging: A boolean indicating whether GPT tagging should be enabled.</span>
+</span><span id="__span-0-290"><a id="__codelineno-0-290" name="__codelineno-0-290"></a>
+</span><span id="__span-0-291"><a id="__codelineno-0-291" name="__codelineno-0-291"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-292"><a id="__codelineno-0-292" name="__codelineno-0-292"></a><span class="sd">            The time elapsed for parsing, as a string.</span>
+</span><span id="__span-0-293"><a id="__codelineno-0-293" name="__codelineno-0-293"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-294"><a id="__codelineno-0-294" name="__codelineno-0-294"></a>        <span class="n">start_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
+</span><span id="__span-0-295"><a id="__codelineno-0-295" name="__codelineno-0-295"></a>        <span class="n">parser</span> <span class="o">=</span> <span class="n">Drain</span><span class="p">(</span>
+</span><span id="__span-0-296"><a id="__codelineno-0-296" name="__codelineno-0-296"></a>            <span class="n">indir</span><span class="o">=</span><span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">dirname</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_filename</span><span class="p">),</span>
+</span><span id="__span-0-297"><a id="__codelineno-0-297" name="__codelineno-0-297"></a>            <span class="n">depth</span><span class="o">=</span><span class="n">depth</span><span class="p">,</span>
+</span><span id="__span-0-298"><a id="__codelineno-0-298" name="__codelineno-0-298"></a>            <span class="n">st</span><span class="o">=</span><span class="n">sim_thresh</span><span class="p">,</span>
+</span><span id="__span-0-299"><a id="__codelineno-0-299" name="__codelineno-0-299"></a>            <span class="n">rex</span><span class="o">=</span><span class="n">regex_dict</span><span class="p">,</span>
+</span><span id="__span-0-300"><a id="__codelineno-0-300" name="__codelineno-0-300"></a>            <span class="n">skip_writeout</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_skip_writeout</span><span class="p">,</span>
+</span><span id="__span-0-301"><a id="__codelineno-0-301" name="__codelineno-0-301"></a>            <span class="n">message_prefix</span><span class="o">=</span><span class="n">message_prefix</span><span class="p">,</span>
+</span><span id="__span-0-302"><a id="__codelineno-0-302" name="__codelineno-0-302"></a>        <span class="p">)</span>
+</span><span id="__span-0-303"><a id="__codelineno-0-303" name="__codelineno-0-303"></a>
+</span><span id="__span-0-304"><a id="__codelineno-0-304" name="__codelineno-0-304"></a>        <span class="c1"># Check if the parsed files already exist.</span>
+</span><span id="__span-0-305"><a id="__codelineno-0-305" name="__codelineno-0-305"></a>        <span class="n">files_exist</span> <span class="o">=</span> <span class="ow">not</span> <span class="n">force</span>
+</span><span id="__span-0-306"><a id="__codelineno-0-306" name="__codelineno-0-306"></a>        <span class="n">parsed_df_names</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="__span-0-307"><a id="__codelineno-0-307" name="__codelineno-0-307"></a>            <span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">),</span>
+</span><span id="__span-0-308"><a id="__codelineno-0-308" name="__codelineno-0-308"></a>            <span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">),</span>
+</span><span id="__span-0-309"><a id="__codelineno-0-309" name="__codelineno-0-309"></a>            <span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">),</span>
+</span><span id="__span-0-310"><a id="__codelineno-0-310" name="__codelineno-0-310"></a>        <span class="p">]</span>
+</span><span id="__span-0-311"><a id="__codelineno-0-311" name="__codelineno-0-311"></a>        <span class="k">for</span> <span class="n">var_name</span> <span class="ow">in</span> <span class="n">parsed_df_names</span><span class="p">:</span>
+</span><span id="__span-0-312"><a id="__codelineno-0-312" name="__codelineno-0-312"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">isfile</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">var_name</span><span class="p">)):</span>
+</span><span id="__span-0-313"><a id="__codelineno-0-313" name="__codelineno-0-313"></a>                <span class="n">files_exist</span> <span class="o">=</span> <span class="kc">False</span>
+</span><span id="__span-0-314"><a id="__codelineno-0-314" name="__codelineno-0-314"></a>                <span class="k">break</span>
+</span><span id="__span-0-315"><a id="__codelineno-0-315" name="__codelineno-0-315"></a>
+</span><span id="__span-0-316"><a id="__codelineno-0-316" name="__codelineno-0-316"></a>        <span class="k">if</span> <span class="n">files_exist</span><span class="p">:</span>
+</span><span id="__span-0-317"><a id="__codelineno-0-317" name="__codelineno-0-317"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span> <span class="o">=</span> <span class="n">Pickler</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">parsed_df_names</span><span class="p">[</span><span class="mi">0</span><span class="p">]))</span>
+</span><span id="__span-0-318"><a id="__codelineno-0-318" name="__codelineno-0-318"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span> <span class="o">=</span> <span class="n">Pickler</span><span class="o">.</span><span class="n">load</span><span class="p">(</span>
+</span><span id="__span-0-319"><a id="__codelineno-0-319" name="__codelineno-0-319"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">parsed_df_names</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+</span><span id="__span-0-320"><a id="__codelineno-0-320" name="__codelineno-0-320"></a>            <span class="p">)</span>
+</span><span id="__span-0-321"><a id="__codelineno-0-321" name="__codelineno-0-321"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span> <span class="o">=</span> <span class="n">Pickler</span><span class="o">.</span><span class="n">load</span><span class="p">(</span>
+</span><span id="__span-0-322"><a id="__codelineno-0-322" name="__codelineno-0-322"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">parsed_df_names</span><span class="p">[</span><span class="mi">2</span><span class="p">])</span>
+</span><span id="__span-0-323"><a id="__codelineno-0-323" name="__codelineno-0-323"></a>            <span class="p">)</span>
+</span><span id="__span-0-324"><a id="__codelineno-0-324" name="__codelineno-0-324"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-325"><a id="__codelineno-0-325" name="__codelineno-0-325"></a>            <span class="p">(</span>
+</span><span id="__span-0-326"><a id="__codelineno-0-326" name="__codelineno-0-326"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">,</span>
+</span><span id="__span-0-327"><a id="__codelineno-0-327" name="__codelineno-0-327"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">,</span>
+</span><span id="__span-0-328"><a id="__codelineno-0-328" name="__codelineno-0-328"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span>
+</span><span id="__span-0-329"><a id="__codelineno-0-329" name="__codelineno-0-329"></a>            <span class="p">)</span> <span class="o">=</span> <span class="n">parser</span><span class="o">.</span><span class="n">parse</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_filename</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;/&quot;</span><span class="p">)[</span><span class="o">-</span><span class="mi">1</span><span class="p">])</span>
+</span><span id="__span-0-330"><a id="__codelineno-0-330" name="__codelineno-0-330"></a>            <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Determining variable types...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-331"><a id="__codelineno-0-331" name="__codelineno-0-331"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span>
+</span><span id="__span-0-332"><a id="__codelineno-0-332" name="__codelineno-0-332"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_find_type</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span>
+</span><span id="__span-0-333"><a id="__codelineno-0-333" name="__codelineno-0-333"></a>            <span class="p">)</span>
+</span><span id="__span-0-334"><a id="__codelineno-0-334" name="__codelineno-0-334"></a>
+</span><span id="__span-0-335"><a id="__codelineno-0-335" name="__codelineno-0-335"></a>            <span class="c1"># Cast and convert date columns</span>
+</span><span id="__span-0-336"><a id="__codelineno-0-336" name="__codelineno-0-336"></a>            <span class="n">is_date</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="s2">&quot;date&quot;</span>
+</span><span id="__span-0-337"><a id="__codelineno-0-337" name="__codelineno-0-337"></a>            <span class="n">date_cols</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">is_date</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span><span class="p">]</span>
+</span><span id="__span-0-338"><a id="__codelineno-0-338" name="__codelineno-0-338"></a>            <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Casting date variables...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-339"><a id="__codelineno-0-339" name="__codelineno-0-339"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">date_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">date_cols</span><span class="p">]</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span>
+</span><span id="__span-0-340"><a id="__codelineno-0-340" name="__codelineno-0-340"></a>                <span class="n">pd</span><span class="o">.</span><span class="n">to_datetime</span><span class="p">,</span> <span class="n">errors</span><span class="o">=</span><span class="s2">&quot;coerce&quot;</span>
+</span><span id="__span-0-341"><a id="__codelineno-0-341" name="__codelineno-0-341"></a>            <span class="p">)</span>
+</span><span id="__span-0-342"><a id="__codelineno-0-342" name="__codelineno-0-342"></a>            <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Casting date variables round 2...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-343"><a id="__codelineno-0-343" name="__codelineno-0-343"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">date_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">date_cols</span><span class="p">]</span><span class="o">.</span><span class="n">progress_applymap</span><span class="p">(</span>
+</span><span id="__span-0-344"><a id="__codelineno-0-344" name="__codelineno-0-344"></a>                <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">x</span><span class="o">.</span><span class="n">timestamp</span><span class="p">()</span> <span class="k">if</span> <span class="ow">not</span> <span class="n">pd</span><span class="o">.</span><span class="n">isnull</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="k">else</span> <span class="kc">None</span>
+</span><span id="__span-0-345"><a id="__codelineno-0-345" name="__codelineno-0-345"></a>            <span class="p">)</span>
+</span><span id="__span-0-346"><a id="__codelineno-0-346" name="__codelineno-0-346"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">is_date</span><span class="p">,</span> <span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;num&quot;</span>
+</span><span id="__span-0-347"><a id="__codelineno-0-347" name="__codelineno-0-347"></a>
+</span><span id="__span-0-348"><a id="__codelineno-0-348" name="__codelineno-0-348"></a>            <span class="c1"># Cast and convert time columns</span>
+</span><span id="__span-0-349"><a id="__codelineno-0-349" name="__codelineno-0-349"></a>            <span class="n">is_time</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="s2">&quot;time&quot;</span>
+</span><span id="__span-0-350"><a id="__codelineno-0-350" name="__codelineno-0-350"></a>            <span class="n">time_cols</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">is_time</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span><span class="p">]</span>
+</span><span id="__span-0-351"><a id="__codelineno-0-351" name="__codelineno-0-351"></a>            <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Casting time variables...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-352"><a id="__codelineno-0-352" name="__codelineno-0-352"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">time_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">time_cols</span><span class="p">]</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span>
+</span><span id="__span-0-353"><a id="__codelineno-0-353" name="__codelineno-0-353"></a>                <span class="n">pd</span><span class="o">.</span><span class="n">to_timedelta</span><span class="p">,</span> <span class="n">errors</span><span class="o">=</span><span class="s2">&quot;coerce&quot;</span>
+</span><span id="__span-0-354"><a id="__codelineno-0-354" name="__codelineno-0-354"></a>            <span class="p">)</span>
+</span><span id="__span-0-355"><a id="__codelineno-0-355" name="__codelineno-0-355"></a>            <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Casting time variables round 2...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-356"><a id="__codelineno-0-356" name="__codelineno-0-356"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">time_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">time_cols</span><span class="p">]</span><span class="o">.</span><span class="n">progress_applymap</span><span class="p">(</span>
+</span><span id="__span-0-357"><a id="__codelineno-0-357" name="__codelineno-0-357"></a>                <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">x</span><span class="o">.</span><span class="n">total_seconds</span><span class="p">()</span> <span class="k">if</span> <span class="ow">not</span> <span class="n">pd</span><span class="o">.</span><span class="n">isnull</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="k">else</span> <span class="kc">None</span>
+</span><span id="__span-0-358"><a id="__codelineno-0-358" name="__codelineno-0-358"></a>            <span class="p">)</span>
+</span><span id="__span-0-359"><a id="__codelineno-0-359" name="__codelineno-0-359"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">is_time</span><span class="p">,</span> <span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;num&quot;</span>
+</span><span id="__span-0-360"><a id="__codelineno-0-360" name="__codelineno-0-360"></a>
+</span><span id="__span-0-361"><a id="__codelineno-0-361" name="__codelineno-0-361"></a>            <span class="c1"># Cast numeric columns</span>
+</span><span id="__span-0-362"><a id="__codelineno-0-362" name="__codelineno-0-362"></a>            <span class="n">is_num</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="s2">&quot;num&quot;</span>
+</span><span id="__span-0-363"><a id="__codelineno-0-363" name="__codelineno-0-363"></a>            <span class="n">numeric_cols</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">is_num</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span><span class="p">]</span>
+</span><span id="__span-0-364"><a id="__codelineno-0-364" name="__codelineno-0-364"></a>            <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Casting numerical variables...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-365"><a id="__codelineno-0-365" name="__codelineno-0-365"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">numeric_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span>
+</span><span id="__span-0-366"><a id="__codelineno-0-366" name="__codelineno-0-366"></a>                <span class="n">numeric_cols</span>
+</span><span id="__span-0-367"><a id="__codelineno-0-367" name="__codelineno-0-367"></a>            <span class="p">]</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span><span class="n">pd</span><span class="o">.</span><span class="n">to_numeric</span><span class="p">,</span> <span class="n">errors</span><span class="o">=</span><span class="s2">&quot;coerce&quot;</span><span class="p">)</span>
+</span><span id="__span-0-368"><a id="__codelineno-0-368" name="__codelineno-0-368"></a>
+</span><span id="__span-0-369"><a id="__codelineno-0-369" name="__codelineno-0-369"></a>            <span class="c1"># Tag variables.</span>
+</span><span id="__span-0-370"><a id="__codelineno-0-370" name="__codelineno-0-370"></a>            <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Tagging variables...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-371"><a id="__codelineno-0-371" name="__codelineno-0-371"></a>            <span class="k">if</span> <span class="n">enable_gpt_tagging</span><span class="p">:</span>
+</span><span id="__span-0-372"><a id="__codelineno-0-372" name="__codelineno-0-372"></a>                <span class="n">tag</span><span class="p">,</span> <span class="n">tag_origin</span> <span class="o">=</span> <span class="nb">zip</span><span class="p">(</span>
+</span><span id="__span-0-373"><a id="__codelineno-0-373" name="__codelineno-0-373"></a>                    <span class="o">*</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span>
+</span><span id="__span-0-374"><a id="__codelineno-0-374" name="__codelineno-0-374"></a>                        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">waterfall_tag</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="p">,</span> <span class="n">x</span><span class="p">),</span>
+</span><span id="__span-0-375"><a id="__codelineno-0-375" name="__codelineno-0-375"></a>                        <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+</span><span id="__span-0-376"><a id="__codelineno-0-376" name="__codelineno-0-376"></a>                    <span class="p">)</span>
+</span><span id="__span-0-377"><a id="__codelineno-0-377" name="__codelineno-0-377"></a>                <span class="p">)</span>
+</span><span id="__span-0-378"><a id="__codelineno-0-378" name="__codelineno-0-378"></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-379"><a id="__codelineno-0-379" name="__codelineno-0-379"></a>                <span class="n">tag</span><span class="p">,</span> <span class="n">tag_origin</span> <span class="o">=</span> <span class="nb">zip</span><span class="p">(</span>
+</span><span id="__span-0-380"><a id="__codelineno-0-380" name="__codelineno-0-380"></a>                    <span class="o">*</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span>
+</span><span id="__span-0-381"><a id="__codelineno-0-381" name="__codelineno-0-381"></a>                        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">preceding_tokens_tag</span><span class="p">(</span><span class="n">x</span><span class="p">),</span>
+</span><span id="__span-0-382"><a id="__codelineno-0-382" name="__codelineno-0-382"></a>                        <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+</span><span id="__span-0-383"><a id="__codelineno-0-383" name="__codelineno-0-383"></a>                    <span class="p">)</span>
+</span><span id="__span-0-384"><a id="__codelineno-0-384" name="__codelineno-0-384"></a>                <span class="p">)</span>
+</span><span id="__span-0-385"><a id="__codelineno-0-385" name="__codelineno-0-385"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">tag</span>
+</span><span id="__span-0-386"><a id="__codelineno-0-386" name="__codelineno-0-386"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;TagOrigin&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">tag_origin</span>
+</span><span id="__span-0-387"><a id="__codelineno-0-387" name="__codelineno-0-387"></a>            <span class="n">TagUtils</span><span class="o">.</span><span class="n">deduplicate_tags</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">)</span>
+</span><span id="__span-0-388"><a id="__codelineno-0-388" name="__codelineno-0-388"></a>
+</span><span id="__span-0-389"><a id="__codelineno-0-389" name="__codelineno-0-389"></a>            <span class="c1"># Detect identifiers.</span>
+</span><span id="__span-0-390"><a id="__codelineno-0-390" name="__codelineno-0-390"></a>            <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Detecting identifiers...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-391"><a id="__codelineno-0-391" name="__codelineno-0-391"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;IsUninteresting&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-392"><a id="__codelineno-0-392" name="__codelineno-0-392"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_find_uninteresting</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="__span-0-393"><a id="__codelineno-0-393" name="__codelineno-0-393"></a>            <span class="p">)</span>
+</span><span id="__span-0-394"><a id="__codelineno-0-394" name="__codelineno-0-394"></a>
+</span><span id="__span-0-395"><a id="__codelineno-0-395" name="__codelineno-0-395"></a>            <span class="c1"># Reorder columns.</span>
+</span><span id="__span-0-396"><a id="__codelineno-0-396" name="__codelineno-0-396"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span>
+</span><span id="__span-0-397"><a id="__codelineno-0-397" name="__codelineno-0-397"></a>                <span class="p">[</span>
+</span><span id="__span-0-398"><a id="__codelineno-0-398" name="__codelineno-0-398"></a>                    <span class="s2">&quot;Name&quot;</span><span class="p">,</span>
+</span><span id="__span-0-399"><a id="__codelineno-0-399" name="__codelineno-0-399"></a>                    <span class="s2">&quot;Tag&quot;</span><span class="p">,</span>
+</span><span id="__span-0-400"><a id="__codelineno-0-400" name="__codelineno-0-400"></a>                    <span class="s2">&quot;TagOrigin&quot;</span><span class="p">,</span>
+</span><span id="__span-0-401"><a id="__codelineno-0-401" name="__codelineno-0-401"></a>                    <span class="s2">&quot;Type&quot;</span><span class="p">,</span>
+</span><span id="__span-0-402"><a id="__codelineno-0-402" name="__codelineno-0-402"></a>                    <span class="s2">&quot;IsUninteresting&quot;</span><span class="p">,</span>
+</span><span id="__span-0-403"><a id="__codelineno-0-403" name="__codelineno-0-403"></a>                    <span class="s2">&quot;Occurrences&quot;</span><span class="p">,</span>
+</span><span id="__span-0-404"><a id="__codelineno-0-404" name="__codelineno-0-404"></a>                    <span class="s2">&quot;Preceding 3 tokens&quot;</span><span class="p">,</span>
+</span><span id="__span-0-405"><a id="__codelineno-0-405" name="__codelineno-0-405"></a>                    <span class="s2">&quot;Examples&quot;</span><span class="p">,</span>
+</span><span id="__span-0-406"><a id="__codelineno-0-406" name="__codelineno-0-406"></a>                    <span class="s2">&quot;From regex&quot;</span><span class="p">,</span>
+</span><span id="__span-0-407"><a id="__codelineno-0-407" name="__codelineno-0-407"></a>                <span class="p">]</span>
+</span><span id="__span-0-408"><a id="__codelineno-0-408" name="__codelineno-0-408"></a>            <span class="p">]</span>
 </span><span id="__span-0-409"><a id="__codelineno-0-409" name="__codelineno-0-409"></a>
-</span><span id="__span-0-410"><a id="__codelineno-0-410" name="__codelineno-0-410"></a>    <span class="k">def</span> <span class="nf">include_in_template</span><span class="p">(</span>
-</span><span id="__span-0-411"><a id="__codelineno-0-411" name="__codelineno-0-411"></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-412"><a id="__codelineno-0-412" name="__codelineno-0-412"></a>        <span class="n">var</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="__span-0-413"><a id="__codelineno-0-413" name="__codelineno-0-413"></a>        <span class="n">enable_gpt_tagging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="__span-0-414"><a id="__codelineno-0-414" name="__codelineno-0-414"></a>        <span class="n">skip_writeout</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">bool</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-415"><a id="__codelineno-0-415" name="__codelineno-0-415"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-416"><a id="__codelineno-0-416" name="__codelineno-0-416"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-417"><a id="__codelineno-0-417" name="__codelineno-0-417"></a><span class="sd">        Treat a certain parsed variable as part of its template and regenerate parsed dataframes.</span>
-</span><span id="__span-0-418"><a id="__codelineno-0-418" name="__codelineno-0-418"></a>
-</span><span id="__span-0-419"><a id="__codelineno-0-419" name="__codelineno-0-419"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-420"><a id="__codelineno-0-420" name="__codelineno-0-420"></a><span class="sd">            var: The name or tag of the variable to be included in its template.</span>
-</span><span id="__span-0-421"><a id="__codelineno-0-421" name="__codelineno-0-421"></a><span class="sd">            enable_gpt_tagging: A boolean indicating whether GPT-3.5 tagging should be enabled.</span>
-</span><span id="__span-0-422"><a id="__codelineno-0-422" name="__codelineno-0-422"></a><span class="sd">            skip_writeout: Whether to skip writing out the regenerated parsed dataframes. Defaults</span>
-</span><span id="__span-0-423"><a id="__codelineno-0-423" name="__codelineno-0-423"></a><span class="sd">                to the value of self._skip_writeout.</span>
-</span><span id="__span-0-424"><a id="__codelineno-0-424" name="__codelineno-0-424"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-425"><a id="__codelineno-0-425" name="__codelineno-0-425"></a>        <span class="n">name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="n">var</span><span class="p">,</span> <span class="s2">&quot;parsed&quot;</span><span class="p">)</span>
-</span><span id="__span-0-426"><a id="__codelineno-0-426" name="__codelineno-0-426"></a>
-</span><span id="__span-0-427"><a id="__codelineno-0-427" name="__codelineno-0-427"></a>        <span class="n">old_template_id</span> <span class="o">=</span> <span class="n">ParsedVariableName</span><span class="p">(</span><span class="n">name</span><span class="p">)</span><span class="o">.</span><span class="n">template_id</span><span class="p">()</span>
-</span><span id="__span-0-428"><a id="__codelineno-0-428" name="__codelineno-0-428"></a>        <span class="n">idx</span> <span class="o">=</span> <span class="n">ParsedVariableName</span><span class="p">(</span><span class="n">name</span><span class="p">)</span><span class="o">.</span><span class="n">index</span><span class="p">()</span>
-</span><span id="__span-0-429"><a id="__codelineno-0-429" name="__codelineno-0-429"></a>        <span class="n">value_counts</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">name</span><span class="p">]</span><span class="o">.</span><span class="n">value_counts</span><span class="p">()</span><span class="o">.</span><span class="n">to_dict</span><span class="p">()</span>
-</span><span id="__span-0-430"><a id="__codelineno-0-430" name="__codelineno-0-430"></a>
-</span><span id="__span-0-431"><a id="__codelineno-0-431" name="__codelineno-0-431"></a>        <span class="c1">### Modify _parsed_templates</span>
-</span><span id="__span-0-432"><a id="__codelineno-0-432" name="__codelineno-0-432"></a>        <span class="n">old_template_row</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-433"><a id="__codelineno-0-433" name="__codelineno-0-433"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-434"><a id="__codelineno-0-434" name="__codelineno-0-434"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">old_template_id</span>
-</span><span id="__span-0-435"><a id="__codelineno-0-435" name="__codelineno-0-435"></a>            <span class="p">]</span>
-</span><span id="__span-0-436"><a id="__codelineno-0-436" name="__codelineno-0-436"></a>            <span class="o">.</span><span class="n">iloc</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-437"><a id="__codelineno-0-437" name="__codelineno-0-437"></a>            <span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-</span><span id="__span-0-438"><a id="__codelineno-0-438" name="__codelineno-0-438"></a>        <span class="p">)</span>
-</span><span id="__span-0-439"><a id="__codelineno-0-439" name="__codelineno-0-439"></a>        <span class="n">toks</span> <span class="o">=</span> <span class="n">old_template_row</span><span class="p">[</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot; &quot;</span><span class="p">)</span>
-</span><span id="__span-0-440"><a id="__codelineno-0-440" name="__codelineno-0-440"></a>        <span class="n">new_template_ids</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-441"><a id="__codelineno-0-441" name="__codelineno-0-441"></a>        <span class="n">new_variable_indices</span> <span class="o">=</span> <span class="n">old_template_row</span><span class="p">[</span><span class="s2">&quot;VariableIndices&quot;</span><span class="p">]</span>
-</span><span id="__span-0-442"><a id="__codelineno-0-442" name="__codelineno-0-442"></a>        <span class="n">new_variable_indices</span><span class="o">.</span><span class="n">remove</span><span class="p">(</span><span class="n">idx</span><span class="p">)</span>
-</span><span id="__span-0-443"><a id="__codelineno-0-443" name="__codelineno-0-443"></a>
-</span><span id="__span-0-444"><a id="__codelineno-0-444" name="__codelineno-0-444"></a>        <span class="k">for</span> <span class="n">value</span><span class="p">,</span> <span class="n">occurences</span> <span class="ow">in</span> <span class="n">value_counts</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="__span-0-445"><a id="__codelineno-0-445" name="__codelineno-0-445"></a>            <span class="n">new_template_row</span> <span class="o">=</span> <span class="n">old_template_row</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-</span><span id="__span-0-446"><a id="__codelineno-0-446" name="__codelineno-0-446"></a>            <span class="n">toks</span><span class="p">[</span><span class="n">idx</span><span class="p">]</span> <span class="o">=</span> <span class="n">value</span>
-</span><span id="__span-0-447"><a id="__codelineno-0-447" name="__codelineno-0-447"></a>
-</span><span id="__span-0-448"><a id="__codelineno-0-448" name="__codelineno-0-448"></a>            <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot; &quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">toks</span><span class="p">)</span>
-</span><span id="__span-0-449"><a id="__codelineno-0-449" name="__codelineno-0-449"></a>            <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">hashlib</span><span class="o">.</span><span class="n">md5</span><span class="p">(</span>
-</span><span id="__span-0-450"><a id="__codelineno-0-450" name="__codelineno-0-450"></a>                <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">encode</span><span class="p">(</span><span class="s2">&quot;utf-8&quot;</span><span class="p">)</span>
-</span><span id="__span-0-451"><a id="__codelineno-0-451" name="__codelineno-0-451"></a>            <span class="p">)</span><span class="o">.</span><span class="n">hexdigest</span><span class="p">()[</span><span class="mi">0</span><span class="p">:</span><span class="mi">8</span><span class="p">]</span>
-</span><span id="__span-0-452"><a id="__codelineno-0-452" name="__codelineno-0-452"></a>            <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;Occurrences&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">occurences</span>
-</span><span id="__span-0-453"><a id="__codelineno-0-453" name="__codelineno-0-453"></a>            <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;VariableIndices&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_variable_indices</span>
-</span><span id="__span-0-454"><a id="__codelineno-0-454" name="__codelineno-0-454"></a>            <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;RegexIndices&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">old_template_row</span><span class="p">[</span><span class="s2">&quot;RegexIndices&quot;</span><span class="p">]</span>
-</span><span id="__span-0-455"><a id="__codelineno-0-455" name="__codelineno-0-455"></a>
-</span><span id="__span-0-456"><a id="__codelineno-0-456" name="__codelineno-0-456"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">)]</span> <span class="o">=</span> <span class="n">new_template_row</span>
-</span><span id="__span-0-457"><a id="__codelineno-0-457" name="__codelineno-0-457"></a>            <span class="n">new_template_ids</span><span class="p">[</span><span class="n">value</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span>
+</span><span id="__span-0-410"><a id="__codelineno-0-410" name="__codelineno-0-410"></a>        <span class="c1"># Write out files if appropriate.</span>
+</span><span id="__span-0-411"><a id="__codelineno-0-411" name="__codelineno-0-411"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_skip_writeout</span> <span class="ow">and</span> <span class="ow">not</span> <span class="n">files_exist</span><span class="p">:</span>
+</span><span id="__span-0-412"><a id="__codelineno-0-412" name="__codelineno-0-412"></a>            <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">parsed_df_names</span><span class="p">[</span><span class="mi">0</span><span class="p">]))</span>
+</span><span id="__span-0-413"><a id="__codelineno-0-413" name="__codelineno-0-413"></a>            <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">parsed_df_names</span><span class="p">[</span><span class="mi">1</span><span class="p">]))</span>
+</span><span id="__span-0-414"><a id="__codelineno-0-414" name="__codelineno-0-414"></a>            <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">parsed_df_names</span><span class="p">[</span><span class="mi">2</span><span class="p">]))</span>
+</span><span id="__span-0-415"><a id="__codelineno-0-415" name="__codelineno-0-415"></a>
+</span><span id="__span-0-416"><a id="__codelineno-0-416" name="__codelineno-0-416"></a>        <span class="n">end_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
+</span><span id="__span-0-417"><a id="__codelineno-0-417" name="__codelineno-0-417"></a>        <span class="n">elapsed</span> <span class="o">=</span> <span class="s2">&quot;</span><span class="si">{:.6f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">((</span><span class="n">end_time</span> <span class="o">-</span> <span class="n">start_time</span><span class="p">)</span><span class="o">.</span><span class="n">total_seconds</span><span class="p">())</span>
+</span><span id="__span-0-418"><a id="__codelineno-0-418" name="__codelineno-0-418"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Parsing complete in </span><span class="si">{</span><span class="n">elapsed</span><span class="si">}</span><span class="s2"> seconds!&quot;</span><span class="p">)</span>
+</span><span id="__span-0-419"><a id="__codelineno-0-419" name="__codelineno-0-419"></a>        <span class="k">return</span> <span class="n">elapsed</span>
+</span><span id="__span-0-420"><a id="__codelineno-0-420" name="__codelineno-0-420"></a>
+</span><span id="__span-0-421"><a id="__codelineno-0-421" name="__codelineno-0-421"></a>    <span class="k">def</span> <span class="nf">include_in_template</span><span class="p">(</span>
+</span><span id="__span-0-422"><a id="__codelineno-0-422" name="__codelineno-0-422"></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-423"><a id="__codelineno-0-423" name="__codelineno-0-423"></a>        <span class="n">var</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-424"><a id="__codelineno-0-424" name="__codelineno-0-424"></a>        <span class="n">enable_gpt_tagging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-425"><a id="__codelineno-0-425" name="__codelineno-0-425"></a>        <span class="n">skip_writeout</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">bool</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-426"><a id="__codelineno-0-426" name="__codelineno-0-426"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-427"><a id="__codelineno-0-427" name="__codelineno-0-427"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-428"><a id="__codelineno-0-428" name="__codelineno-0-428"></a><span class="sd">        Treat a certain parsed variable as part of its template and regenerate parsed dataframes.</span>
+</span><span id="__span-0-429"><a id="__codelineno-0-429" name="__codelineno-0-429"></a>
+</span><span id="__span-0-430"><a id="__codelineno-0-430" name="__codelineno-0-430"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-431"><a id="__codelineno-0-431" name="__codelineno-0-431"></a><span class="sd">            var: The name or tag of the variable to be included in its template.</span>
+</span><span id="__span-0-432"><a id="__codelineno-0-432" name="__codelineno-0-432"></a><span class="sd">            enable_gpt_tagging: A boolean indicating whether GPT-3.5 tagging should be enabled.</span>
+</span><span id="__span-0-433"><a id="__codelineno-0-433" name="__codelineno-0-433"></a><span class="sd">            skip_writeout: Whether to skip writing out the regenerated parsed dataframes. Defaults</span>
+</span><span id="__span-0-434"><a id="__codelineno-0-434" name="__codelineno-0-434"></a><span class="sd">                to the value of self._skip_writeout.</span>
+</span><span id="__span-0-435"><a id="__codelineno-0-435" name="__codelineno-0-435"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-436"><a id="__codelineno-0-436" name="__codelineno-0-436"></a>        <span class="n">name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="n">var</span><span class="p">,</span> <span class="s2">&quot;parsed&quot;</span><span class="p">)</span>
+</span><span id="__span-0-437"><a id="__codelineno-0-437" name="__codelineno-0-437"></a>
+</span><span id="__span-0-438"><a id="__codelineno-0-438" name="__codelineno-0-438"></a>        <span class="n">old_template_id</span> <span class="o">=</span> <span class="n">ParsedVariableName</span><span class="p">(</span><span class="n">name</span><span class="p">)</span><span class="o">.</span><span class="n">template_id</span><span class="p">()</span>
+</span><span id="__span-0-439"><a id="__codelineno-0-439" name="__codelineno-0-439"></a>        <span class="n">idx</span> <span class="o">=</span> <span class="n">ParsedVariableName</span><span class="p">(</span><span class="n">name</span><span class="p">)</span><span class="o">.</span><span class="n">index</span><span class="p">()</span>
+</span><span id="__span-0-440"><a id="__codelineno-0-440" name="__codelineno-0-440"></a>        <span class="n">value_counts</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">name</span><span class="p">]</span><span class="o">.</span><span class="n">value_counts</span><span class="p">()</span><span class="o">.</span><span class="n">to_dict</span><span class="p">()</span>
+</span><span id="__span-0-441"><a id="__codelineno-0-441" name="__codelineno-0-441"></a>
+</span><span id="__span-0-442"><a id="__codelineno-0-442" name="__codelineno-0-442"></a>        <span class="c1">### Modify _parsed_templates</span>
+</span><span id="__span-0-443"><a id="__codelineno-0-443" name="__codelineno-0-443"></a>        <span class="n">old_template_row</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-444"><a id="__codelineno-0-444" name="__codelineno-0-444"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-445"><a id="__codelineno-0-445" name="__codelineno-0-445"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">old_template_id</span>
+</span><span id="__span-0-446"><a id="__codelineno-0-446" name="__codelineno-0-446"></a>            <span class="p">]</span>
+</span><span id="__span-0-447"><a id="__codelineno-0-447" name="__codelineno-0-447"></a>            <span class="o">.</span><span class="n">iloc</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-448"><a id="__codelineno-0-448" name="__codelineno-0-448"></a>            <span class="o">.</span><span class="n">copy</span><span class="p">()</span>
+</span><span id="__span-0-449"><a id="__codelineno-0-449" name="__codelineno-0-449"></a>        <span class="p">)</span>
+</span><span id="__span-0-450"><a id="__codelineno-0-450" name="__codelineno-0-450"></a>        <span class="n">toks</span> <span class="o">=</span> <span class="n">old_template_row</span><span class="p">[</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot; &quot;</span><span class="p">)</span>
+</span><span id="__span-0-451"><a id="__codelineno-0-451" name="__codelineno-0-451"></a>        <span class="n">new_template_ids</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-452"><a id="__codelineno-0-452" name="__codelineno-0-452"></a>        <span class="n">new_variable_indices</span> <span class="o">=</span> <span class="n">old_template_row</span><span class="p">[</span><span class="s2">&quot;VariableIndices&quot;</span><span class="p">]</span>
+</span><span id="__span-0-453"><a id="__codelineno-0-453" name="__codelineno-0-453"></a>        <span class="n">new_variable_indices</span><span class="o">.</span><span class="n">remove</span><span class="p">(</span><span class="n">idx</span><span class="p">)</span>
+</span><span id="__span-0-454"><a id="__codelineno-0-454" name="__codelineno-0-454"></a>
+</span><span id="__span-0-455"><a id="__codelineno-0-455" name="__codelineno-0-455"></a>        <span class="k">for</span> <span class="n">value</span><span class="p">,</span> <span class="n">occurences</span> <span class="ow">in</span> <span class="n">value_counts</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="__span-0-456"><a id="__codelineno-0-456" name="__codelineno-0-456"></a>            <span class="n">new_template_row</span> <span class="o">=</span> <span class="n">old_template_row</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
+</span><span id="__span-0-457"><a id="__codelineno-0-457" name="__codelineno-0-457"></a>            <span class="n">toks</span><span class="p">[</span><span class="n">idx</span><span class="p">]</span> <span class="o">=</span> <span class="n">value</span>
 </span><span id="__span-0-458"><a id="__codelineno-0-458" name="__codelineno-0-458"></a>
-</span><span id="__span-0-459"><a id="__codelineno-0-459" name="__codelineno-0-459"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span>
-</span><span id="__span-0-460"><a id="__codelineno-0-460" name="__codelineno-0-460"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">!=</span> <span class="n">old_template_id</span>
-</span><span id="__span-0-461"><a id="__codelineno-0-461" name="__codelineno-0-461"></a>        <span class="p">]</span><span class="o">.</span><span class="n">reset_index</span><span class="p">(</span><span class="n">drop</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-462"><a id="__codelineno-0-462" name="__codelineno-0-462"></a>
-</span><span id="__span-0-463"><a id="__codelineno-0-463" name="__codelineno-0-463"></a>        <span class="c1">### Modify _parsed_log</span>
-</span><span id="__span-0-464"><a id="__codelineno-0-464" name="__codelineno-0-464"></a>
-</span><span id="__span-0-465"><a id="__codelineno-0-465" name="__codelineno-0-465"></a>        <span class="c1"># Update the template ids of all rows that belonged to the old template</span>
-</span><span id="__span-0-466"><a id="__codelineno-0-466" name="__codelineno-0-466"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
-</span><span id="__span-0-467"><a id="__codelineno-0-467" name="__codelineno-0-467"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="__span-0-468"><a id="__codelineno-0-468" name="__codelineno-0-468"></a>                <span class="n">new_template_ids</span><span class="p">[</span><span class="n">x</span><span class="p">[</span><span class="n">name</span><span class="p">]]</span>
-</span><span id="__span-0-469"><a id="__codelineno-0-469" name="__codelineno-0-469"></a>                <span class="k">if</span> <span class="p">(</span><span class="n">x</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">old_template_id</span><span class="p">)</span>
-</span><span id="__span-0-470"><a id="__codelineno-0-470" name="__codelineno-0-470"></a>                <span class="k">else</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span>
-</span><span id="__span-0-471"><a id="__codelineno-0-471" name="__codelineno-0-471"></a>            <span class="p">),</span>
-</span><span id="__span-0-472"><a id="__codelineno-0-472" name="__codelineno-0-472"></a>            <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-</span><span id="__span-0-473"><a id="__codelineno-0-473" name="__codelineno-0-473"></a>        <span class="p">)</span>
-</span><span id="__span-0-474"><a id="__codelineno-0-474" name="__codelineno-0-474"></a>
-</span><span id="__span-0-475"><a id="__codelineno-0-475" name="__codelineno-0-475"></a>        <span class="c1"># Create new variables for each new template id and assign the value of the old variables to them</span>
-</span><span id="__span-0-476"><a id="__codelineno-0-476" name="__codelineno-0-476"></a>        <span class="n">new_variables</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-477"><a id="__codelineno-0-477" name="__codelineno-0-477"></a>        <span class="k">for</span> <span class="n">new_template_id</span> <span class="ow">in</span> <span class="n">new_template_ids</span><span class="o">.</span><span class="n">values</span><span class="p">():</span>
-</span><span id="__span-0-478"><a id="__codelineno-0-478" name="__codelineno-0-478"></a>            <span class="k">for</span> <span class="n">other_idx</span> <span class="ow">in</span> <span class="n">new_variable_indices</span><span class="p">:</span>
-</span><span id="__span-0-479"><a id="__codelineno-0-479" name="__codelineno-0-479"></a>                <span class="n">new_var_name</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">new_template_id</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="nb">str</span><span class="p">(</span><span class="n">other_idx</span><span class="p">)</span><span class="si">}</span><span class="s2">&quot;</span>
-</span><span id="__span-0-480"><a id="__codelineno-0-480" name="__codelineno-0-480"></a>                <span class="n">new_variables</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">new_var_name</span><span class="p">)</span>
-</span><span id="__span-0-481"><a id="__codelineno-0-481" name="__codelineno-0-481"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">new_var_name</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
-</span><span id="__span-0-482"><a id="__codelineno-0-482" name="__codelineno-0-482"></a>                    <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="__span-0-483"><a id="__codelineno-0-483" name="__codelineno-0-483"></a>                        <span class="n">x</span><span class="p">[</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">old_template_id</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="n">other_idx</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">]</span>
-</span><span id="__span-0-484"><a id="__codelineno-0-484" name="__codelineno-0-484"></a>                        <span class="k">if</span> <span class="p">(</span><span class="n">x</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">new_template_id</span><span class="p">)</span>
-</span><span id="__span-0-485"><a id="__codelineno-0-485" name="__codelineno-0-485"></a>                        <span class="k">else</span> <span class="kc">None</span>
-</span><span id="__span-0-486"><a id="__codelineno-0-486" name="__codelineno-0-486"></a>                    <span class="p">),</span>
-</span><span id="__span-0-487"><a id="__codelineno-0-487" name="__codelineno-0-487"></a>                    <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-</span><span id="__span-0-488"><a id="__codelineno-0-488" name="__codelineno-0-488"></a>                <span class="p">)</span>
-</span><span id="__span-0-489"><a id="__codelineno-0-489" name="__codelineno-0-489"></a>
-</span><span id="__span-0-490"><a id="__codelineno-0-490" name="__codelineno-0-490"></a>        <span class="c1"># Drop variable columns associated with old template id</span>
-</span><span id="__span-0-491"><a id="__codelineno-0-491" name="__codelineno-0-491"></a>        <span class="n">variables_to_drop</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="__span-0-492"><a id="__codelineno-0-492" name="__codelineno-0-492"></a>            <span class="n">v</span> <span class="k">for</span> <span class="n">v</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="o">.</span><span class="n">columns</span> <span class="k">if</span> <span class="n">v</span><span class="o">.</span><span class="n">startswith</span><span class="p">(</span><span class="n">old_template_id</span><span class="p">)</span>
-</span><span id="__span-0-493"><a id="__codelineno-0-493" name="__codelineno-0-493"></a>        <span class="p">]</span>
-</span><span id="__span-0-494"><a id="__codelineno-0-494" name="__codelineno-0-494"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">columns</span><span class="o">=</span><span class="n">variables_to_drop</span><span class="p">,</span> <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-495"><a id="__codelineno-0-495" name="__codelineno-0-495"></a>
-</span><span id="__span-0-496"><a id="__codelineno-0-496" name="__codelineno-0-496"></a>        <span class="c1">### Modify _parsed_variables</span>
-</span><span id="__span-0-497"><a id="__codelineno-0-497" name="__codelineno-0-497"></a>
-</span><span id="__span-0-498"><a id="__codelineno-0-498" name="__codelineno-0-498"></a>        <span class="c1"># Add variable rows for each new variable</span>
-</span><span id="__span-0-499"><a id="__codelineno-0-499" name="__codelineno-0-499"></a>        <span class="k">for</span> <span class="n">value</span><span class="p">,</span> <span class="n">occurrences</span> <span class="ow">in</span> <span class="n">value_counts</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="__span-0-500"><a id="__codelineno-0-500" name="__codelineno-0-500"></a>            <span class="k">for</span> <span class="n">other_idx</span> <span class="ow">in</span> <span class="n">new_variable_indices</span><span class="p">:</span>
-</span><span id="__span-0-501"><a id="__codelineno-0-501" name="__codelineno-0-501"></a>                <span class="n">new_template_id</span> <span class="o">=</span> <span class="n">new_template_ids</span><span class="p">[</span><span class="n">value</span><span class="p">]</span>
-</span><span id="__span-0-502"><a id="__codelineno-0-502" name="__codelineno-0-502"></a>                <span class="n">new_var_name</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">new_template_id</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="nb">str</span><span class="p">(</span><span class="n">other_idx</span><span class="p">)</span><span class="si">}</span><span class="s2">&quot;</span>
-</span><span id="__span-0-503"><a id="__codelineno-0-503" name="__codelineno-0-503"></a>
-</span><span id="__span-0-504"><a id="__codelineno-0-504" name="__codelineno-0-504"></a>                <span class="n">x</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-505"><a id="__codelineno-0-505" name="__codelineno-0-505"></a>                <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_var_name</span>
-</span><span id="__span-0-506"><a id="__codelineno-0-506" name="__codelineno-0-506"></a>                <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Occurrences&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">occurrences</span>
-</span><span id="__span-0-507"><a id="__codelineno-0-507" name="__codelineno-0-507"></a>                <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Preceding 3 tokens&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-508"><a id="__codelineno-0-508" name="__codelineno-0-508"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span>
-</span><span id="__span-0-509"><a id="__codelineno-0-509" name="__codelineno-0-509"></a>                        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">new_template_id</span>
-</span><span id="__span-0-510"><a id="__codelineno-0-510" name="__codelineno-0-510"></a>                    <span class="p">][</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span>
-</span><span id="__span-0-511"><a id="__codelineno-0-511" name="__codelineno-0-511"></a>                    <span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-512"><a id="__codelineno-0-512" name="__codelineno-0-512"></a>                    <span class="o">.</span><span class="n">split</span><span class="p">()[</span><span class="nb">max</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">other_idx</span> <span class="o">-</span> <span class="mi">3</span><span class="p">)</span> <span class="p">:</span> <span class="n">other_idx</span><span class="p">]</span>
-</span><span id="__span-0-513"><a id="__codelineno-0-513" name="__codelineno-0-513"></a>                <span class="p">)</span>
-</span><span id="__span-0-514"><a id="__codelineno-0-514" name="__codelineno-0-514"></a>                <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Examples&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-515"><a id="__codelineno-0-515" name="__codelineno-0-515"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">new_var_name</span><span class="p">]</span>
-</span><span id="__span-0-516"><a id="__codelineno-0-516" name="__codelineno-0-516"></a>                    <span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">new_var_name</span><span class="p">]</span><span class="o">.</span><span class="n">notna</span><span class="p">()]</span>
-</span><span id="__span-0-517"><a id="__codelineno-0-517" name="__codelineno-0-517"></a>                    <span class="o">.</span><span class="n">unique</span><span class="p">()[:</span><span class="mi">5</span><span class="p">]</span>
-</span><span id="__span-0-518"><a id="__codelineno-0-518" name="__codelineno-0-518"></a>                    <span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
-</span><span id="__span-0-519"><a id="__codelineno-0-519" name="__codelineno-0-519"></a>                <span class="p">)</span>
-</span><span id="__span-0-520"><a id="__codelineno-0-520" name="__codelineno-0-520"></a>                <span class="n">x</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="kc">False</span>
-</span><span id="__span-0-521"><a id="__codelineno-0-521" name="__codelineno-0-521"></a>                <span class="k">if</span> <span class="n">enable_gpt_tagging</span><span class="p">:</span>
-</span><span id="__span-0-522"><a id="__codelineno-0-522" name="__codelineno-0-522"></a>                    <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">],</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;TagOrigin&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">waterfall_tag</span><span class="p">(</span>
-</span><span id="__span-0-523"><a id="__codelineno-0-523" name="__codelineno-0-523"></a>                        <span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="p">,</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
-</span><span id="__span-0-524"><a id="__codelineno-0-524" name="__codelineno-0-524"></a>                    <span class="p">)</span>
-</span><span id="__span-0-525"><a id="__codelineno-0-525" name="__codelineno-0-525"></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-526"><a id="__codelineno-0-526" name="__codelineno-0-526"></a>                    <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">],</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;TagOrigin&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">preceding_tokens_tag</span><span class="p">(</span>
-</span><span id="__span-0-527"><a id="__codelineno-0-527" name="__codelineno-0-527"></a>                        <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
-</span><span id="__span-0-528"><a id="__codelineno-0-528" name="__codelineno-0-528"></a>                    <span class="p">)</span>
-</span><span id="__span-0-529"><a id="__codelineno-0-529" name="__codelineno-0-529"></a>                <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_find_type</span><span class="p">(</span><span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">(</span><span class="n">x</span><span class="p">))</span>
-</span><span id="__span-0-530"><a id="__codelineno-0-530" name="__codelineno-0-530"></a>                <span class="n">x</span><span class="p">[</span><span class="s2">&quot;IsUninteresting&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_find_uninteresting</span><span class="p">(</span><span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">(</span><span class="n">x</span><span class="p">))</span>
-</span><span id="__span-0-531"><a id="__codelineno-0-531" name="__codelineno-0-531"></a>
-</span><span id="__span-0-532"><a id="__codelineno-0-532" name="__codelineno-0-532"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">)]</span> <span class="o">=</span> <span class="n">x</span>
-</span><span id="__span-0-533"><a id="__codelineno-0-533" name="__codelineno-0-533"></a>
-</span><span id="__span-0-534"><a id="__codelineno-0-534" name="__codelineno-0-534"></a>        <span class="c1"># Drop variable rows associated with old template id</span>
-</span><span id="__span-0-535"><a id="__codelineno-0-535" name="__codelineno-0-535"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span>
-</span><span id="__span-0-536"><a id="__codelineno-0-536" name="__codelineno-0-536"></a>            <span class="o">~</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="n">variables_to_drop</span><span class="p">)</span>
-</span><span id="__span-0-537"><a id="__codelineno-0-537" name="__codelineno-0-537"></a>        <span class="p">]</span><span class="o">.</span><span class="n">reset_index</span><span class="p">(</span><span class="n">drop</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-538"><a id="__codelineno-0-538" name="__codelineno-0-538"></a>
-</span><span id="__span-0-539"><a id="__codelineno-0-539" name="__codelineno-0-539"></a>        <span class="c1"># Deduplicate tags again</span>
-</span><span id="__span-0-540"><a id="__codelineno-0-540" name="__codelineno-0-540"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">deduplicate_tags</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">)</span>
-</span><span id="__span-0-541"><a id="__codelineno-0-541" name="__codelineno-0-541"></a>
-</span><span id="__span-0-542"><a id="__codelineno-0-542" name="__codelineno-0-542"></a>        <span class="c1"># Write out files if appropriate.</span>
-</span><span id="__span-0-543"><a id="__codelineno-0-543" name="__codelineno-0-543"></a>        <span class="k">if</span> <span class="n">skip_writeout</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-544"><a id="__codelineno-0-544" name="__codelineno-0-544"></a>            <span class="n">skip_writeout</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_skip_writeout</span>
-</span><span id="__span-0-545"><a id="__codelineno-0-545" name="__codelineno-0-545"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">skip_writeout</span><span class="p">:</span>
-</span><span id="__span-0-546"><a id="__codelineno-0-546" name="__codelineno-0-546"></a>            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;about to write stuff out&quot;</span><span class="p">)</span>
-</span><span id="__span-0-547"><a id="__codelineno-0-547" name="__codelineno-0-547"></a>            <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">)))</span>
-</span><span id="__span-0-548"><a id="__codelineno-0-548" name="__codelineno-0-548"></a>            <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span>
-</span><span id="__span-0-549"><a id="__codelineno-0-549" name="__codelineno-0-549"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">,</span>
-</span><span id="__span-0-550"><a id="__codelineno-0-550" name="__codelineno-0-550"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">)),</span>
-</span><span id="__span-0-551"><a id="__codelineno-0-551" name="__codelineno-0-551"></a>            <span class="p">)</span>
-</span><span id="__span-0-552"><a id="__codelineno-0-552" name="__codelineno-0-552"></a>            <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span>
-</span><span id="__span-0-553"><a id="__codelineno-0-553" name="__codelineno-0-553"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span>
-</span><span id="__span-0-554"><a id="__codelineno-0-554" name="__codelineno-0-554"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">)),</span>
-</span><span id="__span-0-555"><a id="__codelineno-0-555" name="__codelineno-0-555"></a>            <span class="p">)</span>
-</span><span id="__span-0-556"><a id="__codelineno-0-556" name="__codelineno-0-556"></a>
-</span><span id="__span-0-557"><a id="__codelineno-0-557" name="__codelineno-0-557"></a>    <span class="k">def</span> <span class="nf">tag_parsed_variable</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">tag</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-558"><a id="__codelineno-0-558" name="__codelineno-0-558"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-559"><a id="__codelineno-0-559" name="__codelineno-0-559"></a><span class="sd">        Tag a parsed variable.</span>
-</span><span id="__span-0-560"><a id="__codelineno-0-560" name="__codelineno-0-560"></a>
-</span><span id="__span-0-561"><a id="__codelineno-0-561" name="__codelineno-0-561"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-562"><a id="__codelineno-0-562" name="__codelineno-0-562"></a><span class="sd">            name: The name of the variable to be tagged.</span>
-</span><span id="__span-0-563"><a id="__codelineno-0-563" name="__codelineno-0-563"></a><span class="sd">            tag: The tag to be assigned to the variable.</span>
-</span><span id="__span-0-564"><a id="__codelineno-0-564" name="__codelineno-0-564"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-565"><a id="__codelineno-0-565" name="__codelineno-0-565"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">set_tag</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="n">name</span><span class="p">,</span> <span class="n">tag</span><span class="p">,</span> <span class="s2">&quot;parsed&quot;</span><span class="p">)</span>
-</span><span id="__span-0-566"><a id="__codelineno-0-566" name="__codelineno-0-566"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">deduplicate_tags</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">)</span>
-</span><span id="__span-0-567"><a id="__codelineno-0-567" name="__codelineno-0-567"></a>
-</span><span id="__span-0-568"><a id="__codelineno-0-568" name="__codelineno-0-568"></a>    <span class="k">def</span> <span class="nf">get_tag_of_parsed</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-</span><span id="__span-0-569"><a id="__codelineno-0-569" name="__codelineno-0-569"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-570"><a id="__codelineno-0-570" name="__codelineno-0-570"></a><span class="sd">        Get the tag of a parsed variable.</span>
-</span><span id="__span-0-571"><a id="__codelineno-0-571" name="__codelineno-0-571"></a>
-</span><span id="__span-0-572"><a id="__codelineno-0-572" name="__codelineno-0-572"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-573"><a id="__codelineno-0-573" name="__codelineno-0-573"></a><span class="sd">            name: The name of the variable.</span>
-</span><span id="__span-0-574"><a id="__codelineno-0-574" name="__codelineno-0-574"></a>
-</span><span id="__span-0-575"><a id="__codelineno-0-575" name="__codelineno-0-575"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-576"><a id="__codelineno-0-576" name="__codelineno-0-576"></a><span class="sd">            The tag of the variable.</span>
-</span><span id="__span-0-577"><a id="__codelineno-0-577" name="__codelineno-0-577"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-578"><a id="__codelineno-0-578" name="__codelineno-0-578"></a>        <span class="k">return</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">get_tag</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="n">name</span><span class="p">,</span> <span class="s2">&quot;parsed&quot;</span><span class="p">)</span>
-</span><span id="__span-0-579"><a id="__codelineno-0-579" name="__codelineno-0-579"></a>
-</span><span id="__span-0-580"><a id="__codelineno-0-580" name="__codelineno-0-580"></a>    <span class="k">def</span> <span class="nf">tag_prepared_variable</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">tag</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-581"><a id="__codelineno-0-581" name="__codelineno-0-581"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-582"><a id="__codelineno-0-582" name="__codelineno-0-582"></a><span class="sd">        Tag a prepared variable.</span>
-</span><span id="__span-0-583"><a id="__codelineno-0-583" name="__codelineno-0-583"></a>
-</span><span id="__span-0-584"><a id="__codelineno-0-584" name="__codelineno-0-584"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-585"><a id="__codelineno-0-585" name="__codelineno-0-585"></a><span class="sd">            name: The name of the variable to be tagged.</span>
-</span><span id="__span-0-586"><a id="__codelineno-0-586" name="__codelineno-0-586"></a><span class="sd">            tag: The tag to be assigned to the variable.</span>
+</span><span id="__span-0-459"><a id="__codelineno-0-459" name="__codelineno-0-459"></a>            <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot; &quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">toks</span><span class="p">)</span>
+</span><span id="__span-0-460"><a id="__codelineno-0-460" name="__codelineno-0-460"></a>            <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">hashlib</span><span class="o">.</span><span class="n">md5</span><span class="p">(</span>
+</span><span id="__span-0-461"><a id="__codelineno-0-461" name="__codelineno-0-461"></a>                <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">encode</span><span class="p">(</span><span class="s2">&quot;utf-8&quot;</span><span class="p">)</span>
+</span><span id="__span-0-462"><a id="__codelineno-0-462" name="__codelineno-0-462"></a>            <span class="p">)</span><span class="o">.</span><span class="n">hexdigest</span><span class="p">()[</span><span class="mi">0</span><span class="p">:</span><span class="mi">8</span><span class="p">]</span>
+</span><span id="__span-0-463"><a id="__codelineno-0-463" name="__codelineno-0-463"></a>            <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;Occurrences&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">occurences</span>
+</span><span id="__span-0-464"><a id="__codelineno-0-464" name="__codelineno-0-464"></a>            <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;VariableIndices&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_variable_indices</span>
+</span><span id="__span-0-465"><a id="__codelineno-0-465" name="__codelineno-0-465"></a>            <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;RegexIndices&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">old_template_row</span><span class="p">[</span><span class="s2">&quot;RegexIndices&quot;</span><span class="p">]</span>
+</span><span id="__span-0-466"><a id="__codelineno-0-466" name="__codelineno-0-466"></a>
+</span><span id="__span-0-467"><a id="__codelineno-0-467" name="__codelineno-0-467"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">)]</span> <span class="o">=</span> <span class="n">new_template_row</span>
+</span><span id="__span-0-468"><a id="__codelineno-0-468" name="__codelineno-0-468"></a>            <span class="n">new_template_ids</span><span class="p">[</span><span class="n">value</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span>
+</span><span id="__span-0-469"><a id="__codelineno-0-469" name="__codelineno-0-469"></a>
+</span><span id="__span-0-470"><a id="__codelineno-0-470" name="__codelineno-0-470"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span>
+</span><span id="__span-0-471"><a id="__codelineno-0-471" name="__codelineno-0-471"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">!=</span> <span class="n">old_template_id</span>
+</span><span id="__span-0-472"><a id="__codelineno-0-472" name="__codelineno-0-472"></a>        <span class="p">]</span><span class="o">.</span><span class="n">reset_index</span><span class="p">(</span><span class="n">drop</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-473"><a id="__codelineno-0-473" name="__codelineno-0-473"></a>
+</span><span id="__span-0-474"><a id="__codelineno-0-474" name="__codelineno-0-474"></a>        <span class="c1">### Modify _parsed_log</span>
+</span><span id="__span-0-475"><a id="__codelineno-0-475" name="__codelineno-0-475"></a>
+</span><span id="__span-0-476"><a id="__codelineno-0-476" name="__codelineno-0-476"></a>        <span class="c1"># Update the template ids of all rows that belonged to the old template</span>
+</span><span id="__span-0-477"><a id="__codelineno-0-477" name="__codelineno-0-477"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
+</span><span id="__span-0-478"><a id="__codelineno-0-478" name="__codelineno-0-478"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="__span-0-479"><a id="__codelineno-0-479" name="__codelineno-0-479"></a>                <span class="n">new_template_ids</span><span class="p">[</span><span class="n">x</span><span class="p">[</span><span class="n">name</span><span class="p">]]</span>
+</span><span id="__span-0-480"><a id="__codelineno-0-480" name="__codelineno-0-480"></a>                <span class="k">if</span> <span class="p">(</span><span class="n">x</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">old_template_id</span><span class="p">)</span>
+</span><span id="__span-0-481"><a id="__codelineno-0-481" name="__codelineno-0-481"></a>                <span class="k">else</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span>
+</span><span id="__span-0-482"><a id="__codelineno-0-482" name="__codelineno-0-482"></a>            <span class="p">),</span>
+</span><span id="__span-0-483"><a id="__codelineno-0-483" name="__codelineno-0-483"></a>            <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+</span><span id="__span-0-484"><a id="__codelineno-0-484" name="__codelineno-0-484"></a>        <span class="p">)</span>
+</span><span id="__span-0-485"><a id="__codelineno-0-485" name="__codelineno-0-485"></a>
+</span><span id="__span-0-486"><a id="__codelineno-0-486" name="__codelineno-0-486"></a>        <span class="c1"># Create new variables for each new template id and assign the value of the old variables to them</span>
+</span><span id="__span-0-487"><a id="__codelineno-0-487" name="__codelineno-0-487"></a>        <span class="n">new_variables</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-488"><a id="__codelineno-0-488" name="__codelineno-0-488"></a>        <span class="k">for</span> <span class="n">new_template_id</span> <span class="ow">in</span> <span class="n">new_template_ids</span><span class="o">.</span><span class="n">values</span><span class="p">():</span>
+</span><span id="__span-0-489"><a id="__codelineno-0-489" name="__codelineno-0-489"></a>            <span class="k">for</span> <span class="n">other_idx</span> <span class="ow">in</span> <span class="n">new_variable_indices</span><span class="p">:</span>
+</span><span id="__span-0-490"><a id="__codelineno-0-490" name="__codelineno-0-490"></a>                <span class="n">new_var_name</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">new_template_id</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="nb">str</span><span class="p">(</span><span class="n">other_idx</span><span class="p">)</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="__span-0-491"><a id="__codelineno-0-491" name="__codelineno-0-491"></a>                <span class="n">new_variables</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">new_var_name</span><span class="p">)</span>
+</span><span id="__span-0-492"><a id="__codelineno-0-492" name="__codelineno-0-492"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">new_var_name</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
+</span><span id="__span-0-493"><a id="__codelineno-0-493" name="__codelineno-0-493"></a>                    <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="__span-0-494"><a id="__codelineno-0-494" name="__codelineno-0-494"></a>                        <span class="n">x</span><span class="p">[</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">old_template_id</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="n">other_idx</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">]</span>
+</span><span id="__span-0-495"><a id="__codelineno-0-495" name="__codelineno-0-495"></a>                        <span class="k">if</span> <span class="p">(</span><span class="n">x</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">new_template_id</span><span class="p">)</span>
+</span><span id="__span-0-496"><a id="__codelineno-0-496" name="__codelineno-0-496"></a>                        <span class="k">else</span> <span class="kc">None</span>
+</span><span id="__span-0-497"><a id="__codelineno-0-497" name="__codelineno-0-497"></a>                    <span class="p">),</span>
+</span><span id="__span-0-498"><a id="__codelineno-0-498" name="__codelineno-0-498"></a>                    <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+</span><span id="__span-0-499"><a id="__codelineno-0-499" name="__codelineno-0-499"></a>                <span class="p">)</span>
+</span><span id="__span-0-500"><a id="__codelineno-0-500" name="__codelineno-0-500"></a>
+</span><span id="__span-0-501"><a id="__codelineno-0-501" name="__codelineno-0-501"></a>        <span class="c1"># Drop variable columns associated with old template id</span>
+</span><span id="__span-0-502"><a id="__codelineno-0-502" name="__codelineno-0-502"></a>        <span class="n">variables_to_drop</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="__span-0-503"><a id="__codelineno-0-503" name="__codelineno-0-503"></a>            <span class="n">v</span> <span class="k">for</span> <span class="n">v</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="o">.</span><span class="n">columns</span> <span class="k">if</span> <span class="n">v</span><span class="o">.</span><span class="n">startswith</span><span class="p">(</span><span class="n">old_template_id</span><span class="p">)</span>
+</span><span id="__span-0-504"><a id="__codelineno-0-504" name="__codelineno-0-504"></a>        <span class="p">]</span>
+</span><span id="__span-0-505"><a id="__codelineno-0-505" name="__codelineno-0-505"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">columns</span><span class="o">=</span><span class="n">variables_to_drop</span><span class="p">,</span> <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-506"><a id="__codelineno-0-506" name="__codelineno-0-506"></a>
+</span><span id="__span-0-507"><a id="__codelineno-0-507" name="__codelineno-0-507"></a>        <span class="c1">### Modify _parsed_variables</span>
+</span><span id="__span-0-508"><a id="__codelineno-0-508" name="__codelineno-0-508"></a>
+</span><span id="__span-0-509"><a id="__codelineno-0-509" name="__codelineno-0-509"></a>        <span class="c1"># Add variable rows for each new variable</span>
+</span><span id="__span-0-510"><a id="__codelineno-0-510" name="__codelineno-0-510"></a>        <span class="k">for</span> <span class="n">value</span><span class="p">,</span> <span class="n">occurrences</span> <span class="ow">in</span> <span class="n">value_counts</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="__span-0-511"><a id="__codelineno-0-511" name="__codelineno-0-511"></a>            <span class="k">for</span> <span class="n">other_idx</span> <span class="ow">in</span> <span class="n">new_variable_indices</span><span class="p">:</span>
+</span><span id="__span-0-512"><a id="__codelineno-0-512" name="__codelineno-0-512"></a>                <span class="n">new_template_id</span> <span class="o">=</span> <span class="n">new_template_ids</span><span class="p">[</span><span class="n">value</span><span class="p">]</span>
+</span><span id="__span-0-513"><a id="__codelineno-0-513" name="__codelineno-0-513"></a>                <span class="n">new_var_name</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">new_template_id</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="nb">str</span><span class="p">(</span><span class="n">other_idx</span><span class="p">)</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="__span-0-514"><a id="__codelineno-0-514" name="__codelineno-0-514"></a>
+</span><span id="__span-0-515"><a id="__codelineno-0-515" name="__codelineno-0-515"></a>                <span class="n">x</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-516"><a id="__codelineno-0-516" name="__codelineno-0-516"></a>                <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_var_name</span>
+</span><span id="__span-0-517"><a id="__codelineno-0-517" name="__codelineno-0-517"></a>                <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Occurrences&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">occurrences</span>
+</span><span id="__span-0-518"><a id="__codelineno-0-518" name="__codelineno-0-518"></a>                <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Preceding 3 tokens&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-519"><a id="__codelineno-0-519" name="__codelineno-0-519"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span>
+</span><span id="__span-0-520"><a id="__codelineno-0-520" name="__codelineno-0-520"></a>                        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">new_template_id</span>
+</span><span id="__span-0-521"><a id="__codelineno-0-521" name="__codelineno-0-521"></a>                    <span class="p">][</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span>
+</span><span id="__span-0-522"><a id="__codelineno-0-522" name="__codelineno-0-522"></a>                    <span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-523"><a id="__codelineno-0-523" name="__codelineno-0-523"></a>                    <span class="o">.</span><span class="n">split</span><span class="p">()[</span><span class="nb">max</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">other_idx</span> <span class="o">-</span> <span class="mi">3</span><span class="p">)</span> <span class="p">:</span> <span class="n">other_idx</span><span class="p">]</span>
+</span><span id="__span-0-524"><a id="__codelineno-0-524" name="__codelineno-0-524"></a>                <span class="p">)</span>
+</span><span id="__span-0-525"><a id="__codelineno-0-525" name="__codelineno-0-525"></a>                <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Examples&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-526"><a id="__codelineno-0-526" name="__codelineno-0-526"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">new_var_name</span><span class="p">]</span>
+</span><span id="__span-0-527"><a id="__codelineno-0-527" name="__codelineno-0-527"></a>                    <span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">new_var_name</span><span class="p">]</span><span class="o">.</span><span class="n">notna</span><span class="p">()]</span>
+</span><span id="__span-0-528"><a id="__codelineno-0-528" name="__codelineno-0-528"></a>                    <span class="o">.</span><span class="n">unique</span><span class="p">()[:</span><span class="mi">5</span><span class="p">]</span>
+</span><span id="__span-0-529"><a id="__codelineno-0-529" name="__codelineno-0-529"></a>                    <span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
+</span><span id="__span-0-530"><a id="__codelineno-0-530" name="__codelineno-0-530"></a>                <span class="p">)</span>
+</span><span id="__span-0-531"><a id="__codelineno-0-531" name="__codelineno-0-531"></a>                <span class="n">x</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="kc">False</span>
+</span><span id="__span-0-532"><a id="__codelineno-0-532" name="__codelineno-0-532"></a>                <span class="k">if</span> <span class="n">enable_gpt_tagging</span><span class="p">:</span>
+</span><span id="__span-0-533"><a id="__codelineno-0-533" name="__codelineno-0-533"></a>                    <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">],</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;TagOrigin&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">waterfall_tag</span><span class="p">(</span>
+</span><span id="__span-0-534"><a id="__codelineno-0-534" name="__codelineno-0-534"></a>                        <span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="p">,</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+</span><span id="__span-0-535"><a id="__codelineno-0-535" name="__codelineno-0-535"></a>                    <span class="p">)</span>
+</span><span id="__span-0-536"><a id="__codelineno-0-536" name="__codelineno-0-536"></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-537"><a id="__codelineno-0-537" name="__codelineno-0-537"></a>                    <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">],</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;TagOrigin&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">preceding_tokens_tag</span><span class="p">(</span>
+</span><span id="__span-0-538"><a id="__codelineno-0-538" name="__codelineno-0-538"></a>                        <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+</span><span id="__span-0-539"><a id="__codelineno-0-539" name="__codelineno-0-539"></a>                    <span class="p">)</span>
+</span><span id="__span-0-540"><a id="__codelineno-0-540" name="__codelineno-0-540"></a>                <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_find_type</span><span class="p">(</span><span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">(</span><span class="n">x</span><span class="p">))</span>
+</span><span id="__span-0-541"><a id="__codelineno-0-541" name="__codelineno-0-541"></a>                <span class="n">x</span><span class="p">[</span><span class="s2">&quot;IsUninteresting&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_find_uninteresting</span><span class="p">(</span><span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">(</span><span class="n">x</span><span class="p">))</span>
+</span><span id="__span-0-542"><a id="__codelineno-0-542" name="__codelineno-0-542"></a>
+</span><span id="__span-0-543"><a id="__codelineno-0-543" name="__codelineno-0-543"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">)]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="__span-0-544"><a id="__codelineno-0-544" name="__codelineno-0-544"></a>
+</span><span id="__span-0-545"><a id="__codelineno-0-545" name="__codelineno-0-545"></a>        <span class="c1"># Drop variable rows associated with old template id</span>
+</span><span id="__span-0-546"><a id="__codelineno-0-546" name="__codelineno-0-546"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span>
+</span><span id="__span-0-547"><a id="__codelineno-0-547" name="__codelineno-0-547"></a>            <span class="o">~</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="n">variables_to_drop</span><span class="p">)</span>
+</span><span id="__span-0-548"><a id="__codelineno-0-548" name="__codelineno-0-548"></a>        <span class="p">]</span><span class="o">.</span><span class="n">reset_index</span><span class="p">(</span><span class="n">drop</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-549"><a id="__codelineno-0-549" name="__codelineno-0-549"></a>
+</span><span id="__span-0-550"><a id="__codelineno-0-550" name="__codelineno-0-550"></a>        <span class="c1"># Deduplicate tags again</span>
+</span><span id="__span-0-551"><a id="__codelineno-0-551" name="__codelineno-0-551"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">deduplicate_tags</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">)</span>
+</span><span id="__span-0-552"><a id="__codelineno-0-552" name="__codelineno-0-552"></a>
+</span><span id="__span-0-553"><a id="__codelineno-0-553" name="__codelineno-0-553"></a>        <span class="c1"># Write out files if appropriate.</span>
+</span><span id="__span-0-554"><a id="__codelineno-0-554" name="__codelineno-0-554"></a>        <span class="k">if</span> <span class="n">skip_writeout</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-555"><a id="__codelineno-0-555" name="__codelineno-0-555"></a>            <span class="n">skip_writeout</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_skip_writeout</span>
+</span><span id="__span-0-556"><a id="__codelineno-0-556" name="__codelineno-0-556"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">skip_writeout</span><span class="p">:</span>
+</span><span id="__span-0-557"><a id="__codelineno-0-557" name="__codelineno-0-557"></a>            <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">)))</span>
+</span><span id="__span-0-558"><a id="__codelineno-0-558" name="__codelineno-0-558"></a>            <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span>
+</span><span id="__span-0-559"><a id="__codelineno-0-559" name="__codelineno-0-559"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">,</span>
+</span><span id="__span-0-560"><a id="__codelineno-0-560" name="__codelineno-0-560"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">)),</span>
+</span><span id="__span-0-561"><a id="__codelineno-0-561" name="__codelineno-0-561"></a>            <span class="p">)</span>
+</span><span id="__span-0-562"><a id="__codelineno-0-562" name="__codelineno-0-562"></a>            <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span>
+</span><span id="__span-0-563"><a id="__codelineno-0-563" name="__codelineno-0-563"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span>
+</span><span id="__span-0-564"><a id="__codelineno-0-564" name="__codelineno-0-564"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">)),</span>
+</span><span id="__span-0-565"><a id="__codelineno-0-565" name="__codelineno-0-565"></a>            <span class="p">)</span>
+</span><span id="__span-0-566"><a id="__codelineno-0-566" name="__codelineno-0-566"></a>
+</span><span id="__span-0-567"><a id="__codelineno-0-567" name="__codelineno-0-567"></a>    <span class="k">def</span> <span class="nf">tag_parsed_variable</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">tag</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-568"><a id="__codelineno-0-568" name="__codelineno-0-568"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-569"><a id="__codelineno-0-569" name="__codelineno-0-569"></a><span class="sd">        Tag a parsed variable.</span>
+</span><span id="__span-0-570"><a id="__codelineno-0-570" name="__codelineno-0-570"></a>
+</span><span id="__span-0-571"><a id="__codelineno-0-571" name="__codelineno-0-571"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-572"><a id="__codelineno-0-572" name="__codelineno-0-572"></a><span class="sd">            name: The name of the variable to be tagged.</span>
+</span><span id="__span-0-573"><a id="__codelineno-0-573" name="__codelineno-0-573"></a><span class="sd">            tag: The tag to be assigned to the variable.</span>
+</span><span id="__span-0-574"><a id="__codelineno-0-574" name="__codelineno-0-574"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-575"><a id="__codelineno-0-575" name="__codelineno-0-575"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">set_tag</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="n">name</span><span class="p">,</span> <span class="n">tag</span><span class="p">,</span> <span class="s2">&quot;parsed&quot;</span><span class="p">)</span>
+</span><span id="__span-0-576"><a id="__codelineno-0-576" name="__codelineno-0-576"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">deduplicate_tags</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">)</span>
+</span><span id="__span-0-577"><a id="__codelineno-0-577" name="__codelineno-0-577"></a>
+</span><span id="__span-0-578"><a id="__codelineno-0-578" name="__codelineno-0-578"></a>    <span class="k">def</span> <span class="nf">get_tag_of_parsed</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-579"><a id="__codelineno-0-579" name="__codelineno-0-579"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-580"><a id="__codelineno-0-580" name="__codelineno-0-580"></a><span class="sd">        Get the tag of a parsed variable.</span>
+</span><span id="__span-0-581"><a id="__codelineno-0-581" name="__codelineno-0-581"></a>
+</span><span id="__span-0-582"><a id="__codelineno-0-582" name="__codelineno-0-582"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-583"><a id="__codelineno-0-583" name="__codelineno-0-583"></a><span class="sd">            name: The name of the variable.</span>
+</span><span id="__span-0-584"><a id="__codelineno-0-584" name="__codelineno-0-584"></a>
+</span><span id="__span-0-585"><a id="__codelineno-0-585" name="__codelineno-0-585"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-586"><a id="__codelineno-0-586" name="__codelineno-0-586"></a><span class="sd">            The tag of the variable.</span>
 </span><span id="__span-0-587"><a id="__codelineno-0-587" name="__codelineno-0-587"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-588"><a id="__codelineno-0-588" name="__codelineno-0-588"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">set_tag</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">name</span><span class="p">,</span> <span class="n">tag</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
-</span><span id="__span-0-589"><a id="__codelineno-0-589" name="__codelineno-0-589"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">deduplicate_tags</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
-</span><span id="__span-0-590"><a id="__codelineno-0-590" name="__codelineno-0-590"></a>
-</span><span id="__span-0-591"><a id="__codelineno-0-591" name="__codelineno-0-591"></a>    <span class="k">def</span> <span class="nf">get_tag_of_prepared</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-</span><span id="__span-0-592"><a id="__codelineno-0-592" name="__codelineno-0-592"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-593"><a id="__codelineno-0-593" name="__codelineno-0-593"></a><span class="sd">        Get the tag of a prepared variable.</span>
-</span><span id="__span-0-594"><a id="__codelineno-0-594" name="__codelineno-0-594"></a>
-</span><span id="__span-0-595"><a id="__codelineno-0-595" name="__codelineno-0-595"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-596"><a id="__codelineno-0-596" name="__codelineno-0-596"></a><span class="sd">            name: The name of the variable.</span>
-</span><span id="__span-0-597"><a id="__codelineno-0-597" name="__codelineno-0-597"></a>
-</span><span id="__span-0-598"><a id="__codelineno-0-598" name="__codelineno-0-598"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-599"><a id="__codelineno-0-599" name="__codelineno-0-599"></a><span class="sd">            The tag of the variable.</span>
-</span><span id="__span-0-600"><a id="__codelineno-0-600" name="__codelineno-0-600"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-601"><a id="__codelineno-0-601" name="__codelineno-0-601"></a>        <span class="k">return</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">get_tag</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">name</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
-</span><span id="__span-0-602"><a id="__codelineno-0-602" name="__codelineno-0-602"></a>
-</span><span id="__span-0-603"><a id="__codelineno-0-603" name="__codelineno-0-603"></a>    <span class="k">def</span> <span class="nf">get_causal_unit_info</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">int</span><span class="p">]:</span>
-</span><span id="__span-0-604"><a id="__codelineno-0-604" name="__codelineno-0-604"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-605"><a id="__codelineno-0-605" name="__codelineno-0-605"></a><span class="sd">        Get the variable used to define causal units and the number of</span>
-</span><span id="__span-0-606"><a id="__codelineno-0-606" name="__codelineno-0-606"></a><span class="sd">        causal units.</span>
+</span><span id="__span-0-588"><a id="__codelineno-0-588" name="__codelineno-0-588"></a>        <span class="k">return</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">get_tag</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="n">name</span><span class="p">,</span> <span class="s2">&quot;parsed&quot;</span><span class="p">)</span>
+</span><span id="__span-0-589"><a id="__codelineno-0-589" name="__codelineno-0-589"></a>
+</span><span id="__span-0-590"><a id="__codelineno-0-590" name="__codelineno-0-590"></a>    <span class="k">def</span> <span class="nf">tag_prepared_variable</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">tag</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-591"><a id="__codelineno-0-591" name="__codelineno-0-591"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-592"><a id="__codelineno-0-592" name="__codelineno-0-592"></a><span class="sd">        Tag a prepared variable.</span>
+</span><span id="__span-0-593"><a id="__codelineno-0-593" name="__codelineno-0-593"></a>
+</span><span id="__span-0-594"><a id="__codelineno-0-594" name="__codelineno-0-594"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-595"><a id="__codelineno-0-595" name="__codelineno-0-595"></a><span class="sd">            name: The name of the variable to be tagged.</span>
+</span><span id="__span-0-596"><a id="__codelineno-0-596" name="__codelineno-0-596"></a><span class="sd">            tag: The tag to be assigned to the variable.</span>
+</span><span id="__span-0-597"><a id="__codelineno-0-597" name="__codelineno-0-597"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-598"><a id="__codelineno-0-598" name="__codelineno-0-598"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">set_tag</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">name</span><span class="p">,</span> <span class="n">tag</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
+</span><span id="__span-0-599"><a id="__codelineno-0-599" name="__codelineno-0-599"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">deduplicate_tags</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
+</span><span id="__span-0-600"><a id="__codelineno-0-600" name="__codelineno-0-600"></a>
+</span><span id="__span-0-601"><a id="__codelineno-0-601" name="__codelineno-0-601"></a>    <span class="k">def</span> <span class="nf">get_tag_of_prepared</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-602"><a id="__codelineno-0-602" name="__codelineno-0-602"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-603"><a id="__codelineno-0-603" name="__codelineno-0-603"></a><span class="sd">        Get the tag of a prepared variable.</span>
+</span><span id="__span-0-604"><a id="__codelineno-0-604" name="__codelineno-0-604"></a>
+</span><span id="__span-0-605"><a id="__codelineno-0-605" name="__codelineno-0-605"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-606"><a id="__codelineno-0-606" name="__codelineno-0-606"></a><span class="sd">            name: The name of the variable.</span>
 </span><span id="__span-0-607"><a id="__codelineno-0-607" name="__codelineno-0-607"></a>
 </span><span id="__span-0-608"><a id="__codelineno-0-608" name="__codelineno-0-608"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-609"><a id="__codelineno-0-609" name="__codelineno-0-609"></a><span class="sd">            The name of the variable used to define causal units</span>
-</span><span id="__span-0-610"><a id="__codelineno-0-610" name="__codelineno-0-610"></a><span class="sd">            and the number of causal units.</span>
-</span><span id="__span-0-611"><a id="__codelineno-0-611" name="__codelineno-0-611"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-612"><a id="__codelineno-0-612" name="__codelineno-0-612"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span>
-</span><span id="__span-0-613"><a id="__codelineno-0-613" name="__codelineno-0-613"></a>
-</span><span id="__span-0-614"><a id="__codelineno-0-614" name="__codelineno-0-614"></a>    <span class="k">def</span> <span class="nf">suggest_causal_unit_defs</span><span class="p">(</span>
-</span><span id="__span-0-615"><a id="__codelineno-0-615" name="__codelineno-0-615"></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-616"><a id="__codelineno-0-616" name="__codelineno-0-616"></a>        <span class="n">min_causal_units</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">4</span><span class="p">,</span>
-</span><span id="__span-0-617"><a id="__codelineno-0-617" name="__codelineno-0-617"></a>        <span class="n">num_suggestions</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">10</span><span class="p">,</span>
-</span><span id="__span-0-618"><a id="__codelineno-0-618" name="__codelineno-0-618"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">]:</span>
-</span><span id="__span-0-619"><a id="__codelineno-0-619" name="__codelineno-0-619"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-620"><a id="__codelineno-0-620" name="__codelineno-0-620"></a><span class="sd">        Suggest at most `num_suggestions` causal unit definitions based on IUS maximization,</span>
-</span><span id="__span-0-621"><a id="__codelineno-0-621" name="__codelineno-0-621"></a><span class="sd">        while returning at least `min_causal_units` causal units.</span>
-</span><span id="__span-0-622"><a id="__codelineno-0-622" name="__codelineno-0-622"></a>
-</span><span id="__span-0-623"><a id="__codelineno-0-623" name="__codelineno-0-623"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-624"><a id="__codelineno-0-624" name="__codelineno-0-624"></a><span class="sd">            min_causal_units: The minimum number of causal units that a suggested</span>
-</span><span id="__span-0-625"><a id="__codelineno-0-625" name="__codelineno-0-625"></a><span class="sd">                definition should create.</span>
-</span><span id="__span-0-626"><a id="__codelineno-0-626" name="__codelineno-0-626"></a><span class="sd">            num_suggestions: The maximum number of causal unit definitions to suggest.</span>
-</span><span id="__span-0-627"><a id="__codelineno-0-627" name="__codelineno-0-627"></a>
-</span><span id="__span-0-628"><a id="__codelineno-0-628" name="__codelineno-0-628"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-629"><a id="__codelineno-0-629" name="__codelineno-0-629"></a><span class="sd">            A DataFrame with one row for each suggested causal unit definition, or `None`</span>
-</span><span id="__span-0-630"><a id="__codelineno-0-630" name="__codelineno-0-630"></a><span class="sd">                if no suggestions were made.</span>
-</span><span id="__span-0-631"><a id="__codelineno-0-631" name="__codelineno-0-631"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-609"><a id="__codelineno-0-609" name="__codelineno-0-609"></a><span class="sd">            The tag of the variable.</span>
+</span><span id="__span-0-610"><a id="__codelineno-0-610" name="__codelineno-0-610"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-611"><a id="__codelineno-0-611" name="__codelineno-0-611"></a>        <span class="k">return</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">get_tag</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">name</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
+</span><span id="__span-0-612"><a id="__codelineno-0-612" name="__codelineno-0-612"></a>
+</span><span id="__span-0-613"><a id="__codelineno-0-613" name="__codelineno-0-613"></a>    <span class="k">def</span> <span class="nf">get_causal_unit_info</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">int</span><span class="p">]:</span>
+</span><span id="__span-0-614"><a id="__codelineno-0-614" name="__codelineno-0-614"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-615"><a id="__codelineno-0-615" name="__codelineno-0-615"></a><span class="sd">        Get the variable used to define causal units and the number of</span>
+</span><span id="__span-0-616"><a id="__codelineno-0-616" name="__codelineno-0-616"></a><span class="sd">        causal units.</span>
+</span><span id="__span-0-617"><a id="__codelineno-0-617" name="__codelineno-0-617"></a>
+</span><span id="__span-0-618"><a id="__codelineno-0-618" name="__codelineno-0-618"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-619"><a id="__codelineno-0-619" name="__codelineno-0-619"></a><span class="sd">            The name of the variable used to define causal units</span>
+</span><span id="__span-0-620"><a id="__codelineno-0-620" name="__codelineno-0-620"></a><span class="sd">            and the number of causal units.</span>
+</span><span id="__span-0-621"><a id="__codelineno-0-621" name="__codelineno-0-621"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-622"><a id="__codelineno-0-622" name="__codelineno-0-622"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span>
+</span><span id="__span-0-623"><a id="__codelineno-0-623" name="__codelineno-0-623"></a>
+</span><span id="__span-0-624"><a id="__codelineno-0-624" name="__codelineno-0-624"></a>    <span class="k">def</span> <span class="nf">suggest_causal_unit_defs</span><span class="p">(</span>
+</span><span id="__span-0-625"><a id="__codelineno-0-625" name="__codelineno-0-625"></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-626"><a id="__codelineno-0-626" name="__codelineno-0-626"></a>        <span class="n">min_causal_units</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">4</span><span class="p">,</span>
+</span><span id="__span-0-627"><a id="__codelineno-0-627" name="__codelineno-0-627"></a>        <span class="n">num_suggestions</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">10</span><span class="p">,</span>
+</span><span id="__span-0-628"><a id="__codelineno-0-628" name="__codelineno-0-628"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">]:</span>
+</span><span id="__span-0-629"><a id="__codelineno-0-629" name="__codelineno-0-629"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-630"><a id="__codelineno-0-630" name="__codelineno-0-630"></a><span class="sd">        Suggest at most `num_suggestions` causal unit definitions based on IUS maximization,</span>
+</span><span id="__span-0-631"><a id="__codelineno-0-631" name="__codelineno-0-631"></a><span class="sd">        while returning at least `min_causal_units` causal units.</span>
 </span><span id="__span-0-632"><a id="__codelineno-0-632" name="__codelineno-0-632"></a>
-</span><span id="__span-0-633"><a id="__codelineno-0-633" name="__codelineno-0-633"></a>        <span class="k">return</span> <span class="n">CausalUnitSuggester</span><span class="o">.</span><span class="n">suggest_causal_unit_defs</span><span class="p">(</span>
-</span><span id="__span-0-634"><a id="__codelineno-0-634" name="__codelineno-0-634"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">],</span>
-</span><span id="__span-0-635"><a id="__codelineno-0-635" name="__codelineno-0-635"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span>
-</span><span id="__span-0-636"><a id="__codelineno-0-636" name="__codelineno-0-636"></a>            <span class="n">min_causal_units</span><span class="o">=</span><span class="n">min_causal_units</span><span class="p">,</span>
-</span><span id="__span-0-637"><a id="__codelineno-0-637" name="__codelineno-0-637"></a>            <span class="n">num_suggestions</span><span class="o">=</span><span class="n">num_suggestions</span><span class="p">,</span>
-</span><span id="__span-0-638"><a id="__codelineno-0-638" name="__codelineno-0-638"></a>        <span class="p">)</span>
-</span><span id="__span-0-639"><a id="__codelineno-0-639" name="__codelineno-0-639"></a>
-</span><span id="__span-0-640"><a id="__codelineno-0-640" name="__codelineno-0-640"></a>    <span class="k">def</span> <span class="nf">set_causal_unit</span><span class="p">(</span>
-</span><span id="__span-0-641"><a id="__codelineno-0-641" name="__codelineno-0-641"></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-642"><a id="__codelineno-0-642" name="__codelineno-0-642"></a>        <span class="n">var</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="__span-0-643"><a id="__codelineno-0-643" name="__codelineno-0-643"></a>        <span class="n">num_units</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-644"><a id="__codelineno-0-644" name="__codelineno-0-644"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-645"><a id="__codelineno-0-645" name="__codelineno-0-645"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-646"><a id="__codelineno-0-646" name="__codelineno-0-646"></a><span class="sd">        Set the variable used to define causal units and optionally the number of</span>
-</span><span id="__span-0-647"><a id="__codelineno-0-647" name="__codelineno-0-647"></a><span class="sd">        causal units. The latter will be ignored if the variable is categorical, but it</span>
-</span><span id="__span-0-648"><a id="__codelineno-0-648" name="__codelineno-0-648"></a><span class="sd">        must be specified if the variable is numerical.</span>
+</span><span id="__span-0-633"><a id="__codelineno-0-633" name="__codelineno-0-633"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-634"><a id="__codelineno-0-634" name="__codelineno-0-634"></a><span class="sd">            min_causal_units: The minimum number of causal units that a suggested</span>
+</span><span id="__span-0-635"><a id="__codelineno-0-635" name="__codelineno-0-635"></a><span class="sd">                definition should create.</span>
+</span><span id="__span-0-636"><a id="__codelineno-0-636" name="__codelineno-0-636"></a><span class="sd">            num_suggestions: The maximum number of causal unit definitions to suggest.</span>
+</span><span id="__span-0-637"><a id="__codelineno-0-637" name="__codelineno-0-637"></a>
+</span><span id="__span-0-638"><a id="__codelineno-0-638" name="__codelineno-0-638"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-639"><a id="__codelineno-0-639" name="__codelineno-0-639"></a><span class="sd">            A DataFrame with one row for each suggested causal unit definition, or `None`</span>
+</span><span id="__span-0-640"><a id="__codelineno-0-640" name="__codelineno-0-640"></a><span class="sd">                if no suggestions were made.</span>
+</span><span id="__span-0-641"><a id="__codelineno-0-641" name="__codelineno-0-641"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-642"><a id="__codelineno-0-642" name="__codelineno-0-642"></a>
+</span><span id="__span-0-643"><a id="__codelineno-0-643" name="__codelineno-0-643"></a>        <span class="k">return</span> <span class="n">CausalUnitSuggester</span><span class="o">.</span><span class="n">suggest_causal_unit_defs</span><span class="p">(</span>
+</span><span id="__span-0-644"><a id="__codelineno-0-644" name="__codelineno-0-644"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">],</span>
+</span><span id="__span-0-645"><a id="__codelineno-0-645" name="__codelineno-0-645"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span>
+</span><span id="__span-0-646"><a id="__codelineno-0-646" name="__codelineno-0-646"></a>            <span class="n">min_causal_units</span><span class="o">=</span><span class="n">min_causal_units</span><span class="p">,</span>
+</span><span id="__span-0-647"><a id="__codelineno-0-647" name="__codelineno-0-647"></a>            <span class="n">num_suggestions</span><span class="o">=</span><span class="n">num_suggestions</span><span class="p">,</span>
+</span><span id="__span-0-648"><a id="__codelineno-0-648" name="__codelineno-0-648"></a>        <span class="p">)</span>
 </span><span id="__span-0-649"><a id="__codelineno-0-649" name="__codelineno-0-649"></a>
-</span><span id="__span-0-650"><a id="__codelineno-0-650" name="__codelineno-0-650"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-651"><a id="__codelineno-0-651" name="__codelineno-0-651"></a><span class="sd">            var: The name or tag of the variable to be used as the causal unit.</span>
-</span><span id="__span-0-652"><a id="__codelineno-0-652" name="__codelineno-0-652"></a><span class="sd">            num_units: The number of causal units to be created.</span>
-</span><span id="__span-0-653"><a id="__codelineno-0-653" name="__codelineno-0-653"></a>
-</span><span id="__span-0-654"><a id="__codelineno-0-654" name="__codelineno-0-654"></a><span class="sd">        Raises:</span>
-</span><span id="__span-0-655"><a id="__codelineno-0-655" name="__codelineno-0-655"></a><span class="sd">            ValueError: If the variable is numerical and `num_units` is not specified.</span>
-</span><span id="__span-0-656"><a id="__codelineno-0-656" name="__codelineno-0-656"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-657"><a id="__codelineno-0-657" name="__codelineno-0-657"></a>        <span class="n">var_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="n">var</span><span class="p">,</span> <span class="s2">&quot;parsed&quot;</span><span class="p">)</span>
-</span><span id="__span-0-658"><a id="__codelineno-0-658" name="__codelineno-0-658"></a>        <span class="n">var_type</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-659"><a id="__codelineno-0-659" name="__codelineno-0-659"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">var_name</span><span class="p">,</span> <span class="s2">&quot;Type&quot;</span>
-</span><span id="__span-0-660"><a id="__codelineno-0-660" name="__codelineno-0-660"></a>        <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-661"><a id="__codelineno-0-661" name="__codelineno-0-661"></a>
-</span><span id="__span-0-662"><a id="__codelineno-0-662" name="__codelineno-0-662"></a>        <span class="k">if</span> <span class="n">var_type</span> <span class="o">==</span> <span class="s2">&quot;num&quot;</span> <span class="ow">and</span> <span class="n">num_units</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-663"><a id="__codelineno-0-663" name="__codelineno-0-663"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
-</span><span id="__span-0-664"><a id="__codelineno-0-664" name="__codelineno-0-664"></a>                <span class="s2">&quot;The number of causal units must be specified if the causal unit is numerical.&quot;</span>
-</span><span id="__span-0-665"><a id="__codelineno-0-665" name="__codelineno-0-665"></a>            <span class="p">)</span>
-</span><span id="__span-0-666"><a id="__codelineno-0-666" name="__codelineno-0-666"></a>
-</span><span id="__span-0-667"><a id="__codelineno-0-667" name="__codelineno-0-667"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span> <span class="o">=</span> <span class="n">var_name</span>
-</span><span id="__span-0-668"><a id="__codelineno-0-668" name="__codelineno-0-668"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span> <span class="o">=</span> <span class="n">num_units</span>
-</span><span id="__span-0-669"><a id="__codelineno-0-669" name="__codelineno-0-669"></a>
-</span><span id="__span-0-670"><a id="__codelineno-0-670" name="__codelineno-0-670"></a>        <span class="nb">print</span><span class="p">(</span>
-</span><span id="__span-0-671"><a id="__codelineno-0-671" name="__codelineno-0-671"></a>            <span class="sa">f</span><span class="s2">&quot;Causal unit set to </span><span class="si">{</span><span class="n">var_name</span><span class="si">}</span><span class="s2"> (tag: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">get_tag_of_parsed</span><span class="p">(</span><span class="n">var_name</span><span class="p">)</span><span class="si">}</span><span class="s2">) &quot;</span>
-</span><span id="__span-0-672"><a id="__codelineno-0-672" name="__codelineno-0-672"></a>            <span class="o">+</span> <span class="p">(</span>
-</span><span id="__span-0-673"><a id="__codelineno-0-673" name="__codelineno-0-673"></a>                <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-674"><a id="__codelineno-0-674" name="__codelineno-0-674"></a>                <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span>
-</span><span id="__span-0-675"><a id="__codelineno-0-675" name="__codelineno-0-675"></a>                <span class="k">else</span> <span class="sa">f</span><span class="s2">&quot; with </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span><span class="si">}</span><span class="s2"> causal units.&quot;</span>
-</span><span id="__span-0-676"><a id="__codelineno-0-676" name="__codelineno-0-676"></a>            <span class="p">)</span>
-</span><span id="__span-0-677"><a id="__codelineno-0-677" name="__codelineno-0-677"></a>        <span class="p">)</span>
-</span><span id="__span-0-678"><a id="__codelineno-0-678" name="__codelineno-0-678"></a>
-</span><span id="__span-0-679"><a id="__codelineno-0-679" name="__codelineno-0-679"></a>    <span class="k">def</span> <span class="nf">prepare</span><span class="p">(</span>
-</span><span id="__span-0-680"><a id="__codelineno-0-680" name="__codelineno-0-680"></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-681"><a id="__codelineno-0-681" name="__codelineno-0-681"></a>        <span class="n">custom_agg</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="p">{},</span>
-</span><span id="__span-0-682"><a id="__codelineno-0-682" name="__codelineno-0-682"></a>        <span class="n">custom_imp</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="p">{},</span>
-</span><span id="__span-0-683"><a id="__codelineno-0-683" name="__codelineno-0-683"></a>        <span class="n">count_occurences</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="__span-0-684"><a id="__codelineno-0-684" name="__codelineno-0-684"></a>        <span class="n">ignore_uninteresting</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="__span-0-685"><a id="__codelineno-0-685" name="__codelineno-0-685"></a>        <span class="n">force</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="__span-0-686"><a id="__codelineno-0-686" name="__codelineno-0-686"></a>        <span class="n">lasso_alpha</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="n">Pruner</span><span class="o">.</span><span class="n">LASSO_DEFAULT_ALPHA</span><span class="p">,</span>
-</span><span id="__span-0-687"><a id="__codelineno-0-687" name="__codelineno-0-687"></a>        <span class="n">lasso_max_iter</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="n">Pruner</span><span class="o">.</span><span class="n">LASSO_DEFAULT_MAX_ITER</span><span class="p">,</span>
-</span><span id="__span-0-688"><a id="__codelineno-0-688" name="__codelineno-0-688"></a>        <span class="n">drop_bad_aggs</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="__span-0-689"><a id="__codelineno-0-689" name="__codelineno-0-689"></a>        <span class="n">reject_prunable_edges</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="__span-0-690"><a id="__codelineno-0-690" name="__codelineno-0-690"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-</span><span id="__span-0-691"><a id="__codelineno-0-691" name="__codelineno-0-691"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-692"><a id="__codelineno-0-692" name="__codelineno-0-692"></a><span class="sd">        Prepare the log parsed from the table for causal analysis, using aggregation and imputation as needed.</span>
-</span><span id="__span-0-693"><a id="__codelineno-0-693" name="__codelineno-0-693"></a>
-</span><span id="__span-0-694"><a id="__codelineno-0-694" name="__codelineno-0-694"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-695"><a id="__codelineno-0-695" name="__codelineno-0-695"></a><span class="sd">            custom_agg: A dictionary of custom aggregation functions to be used for specific variables.</span>
-</span><span id="__span-0-696"><a id="__codelineno-0-696" name="__codelineno-0-696"></a><span class="sd">            custom_imp: A dictionary of custom imputation functions to be used for specific variables.</span>
-</span><span id="__span-0-697"><a id="__codelineno-0-697" name="__codelineno-0-697"></a><span class="sd">            count_occurences: Whether to include extra variables counting the occurence of each template.</span>
-</span><span id="__span-0-698"><a id="__codelineno-0-698" name="__codelineno-0-698"></a><span class="sd">            ignore_uninteresting: Whether to ignore uninteresting variables.</span>
-</span><span id="__span-0-699"><a id="__codelineno-0-699" name="__codelineno-0-699"></a><span class="sd">            force: Whether to force re-preparation of the log.</span>
-</span><span id="__span-0-700"><a id="__codelineno-0-700" name="__codelineno-0-700"></a><span class="sd">            lasso_alpha: The alpha parameter to be used for LASSO regression.</span>
-</span><span id="__span-0-701"><a id="__codelineno-0-701" name="__codelineno-0-701"></a><span class="sd">            lasso_max_iter: The maximum number of iterations to be used for LASSO regression.</span>
-</span><span id="__span-0-702"><a id="__codelineno-0-702" name="__codelineno-0-702"></a><span class="sd">            drop_bad_aggs: Whether to drop prepared variables that do not add information compared to other</span>
-</span><span id="__span-0-703"><a id="__codelineno-0-703" name="__codelineno-0-703"></a><span class="sd">                variables based on the same base variable but using a different aggregation function.</span>
-</span><span id="__span-0-704"><a id="__codelineno-0-704" name="__codelineno-0-704"></a><span class="sd">            reject_prunable_edges: Whether to reject edges that are prunable based on LASSO applciation.</span>
-</span><span id="__span-0-705"><a id="__codelineno-0-705" name="__codelineno-0-705"></a>
-</span><span id="__span-0-706"><a id="__codelineno-0-706" name="__codelineno-0-706"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-707"><a id="__codelineno-0-707" name="__codelineno-0-707"></a><span class="sd">            The time elapsed for preparation, as a string.</span>
-</span><span id="__span-0-708"><a id="__codelineno-0-708" name="__codelineno-0-708"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-709"><a id="__codelineno-0-709" name="__codelineno-0-709"></a>
-</span><span id="__span-0-710"><a id="__codelineno-0-710" name="__codelineno-0-710"></a>        <span class="n">start_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
-</span><span id="__span-0-711"><a id="__codelineno-0-711" name="__codelineno-0-711"></a>        <span class="c1"># Ensure causal unit is set. TODO: make IUS maximizer the default</span>
-</span><span id="__span-0-712"><a id="__codelineno-0-712" name="__codelineno-0-712"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-713"><a id="__codelineno-0-713" name="__codelineno-0-713"></a>            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Causal unit not defined. Aborting.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-714"><a id="__codelineno-0-714" name="__codelineno-0-714"></a>            <span class="k">return</span> <span class="kc">None</span>
+</span><span id="__span-0-650"><a id="__codelineno-0-650" name="__codelineno-0-650"></a>    <span class="k">def</span> <span class="nf">set_causal_unit</span><span class="p">(</span>
+</span><span id="__span-0-651"><a id="__codelineno-0-651" name="__codelineno-0-651"></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-652"><a id="__codelineno-0-652" name="__codelineno-0-652"></a>        <span class="n">var</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-653"><a id="__codelineno-0-653" name="__codelineno-0-653"></a>        <span class="n">num_units</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-654"><a id="__codelineno-0-654" name="__codelineno-0-654"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-655"><a id="__codelineno-0-655" name="__codelineno-0-655"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-656"><a id="__codelineno-0-656" name="__codelineno-0-656"></a><span class="sd">        Set the variable used to define causal units and optionally the number of</span>
+</span><span id="__span-0-657"><a id="__codelineno-0-657" name="__codelineno-0-657"></a><span class="sd">        causal units. The latter will be ignored if the variable is categorical, but it</span>
+</span><span id="__span-0-658"><a id="__codelineno-0-658" name="__codelineno-0-658"></a><span class="sd">        must be specified if the variable is numerical.</span>
+</span><span id="__span-0-659"><a id="__codelineno-0-659" name="__codelineno-0-659"></a>
+</span><span id="__span-0-660"><a id="__codelineno-0-660" name="__codelineno-0-660"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-661"><a id="__codelineno-0-661" name="__codelineno-0-661"></a><span class="sd">            var: The name or tag of the variable to be used as the causal unit.</span>
+</span><span id="__span-0-662"><a id="__codelineno-0-662" name="__codelineno-0-662"></a><span class="sd">            num_units: The number of causal units to be created.</span>
+</span><span id="__span-0-663"><a id="__codelineno-0-663" name="__codelineno-0-663"></a>
+</span><span id="__span-0-664"><a id="__codelineno-0-664" name="__codelineno-0-664"></a><span class="sd">        Raises:</span>
+</span><span id="__span-0-665"><a id="__codelineno-0-665" name="__codelineno-0-665"></a><span class="sd">            ValueError: If the variable is numerical and `num_units` is not specified.</span>
+</span><span id="__span-0-666"><a id="__codelineno-0-666" name="__codelineno-0-666"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-667"><a id="__codelineno-0-667" name="__codelineno-0-667"></a>        <span class="n">var_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="n">var</span><span class="p">,</span> <span class="s2">&quot;parsed&quot;</span><span class="p">)</span>
+</span><span id="__span-0-668"><a id="__codelineno-0-668" name="__codelineno-0-668"></a>        <span class="n">var_type</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-669"><a id="__codelineno-0-669" name="__codelineno-0-669"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">var_name</span><span class="p">,</span> <span class="s2">&quot;Type&quot;</span>
+</span><span id="__span-0-670"><a id="__codelineno-0-670" name="__codelineno-0-670"></a>        <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-671"><a id="__codelineno-0-671" name="__codelineno-0-671"></a>
+</span><span id="__span-0-672"><a id="__codelineno-0-672" name="__codelineno-0-672"></a>        <span class="k">if</span> <span class="n">var_type</span> <span class="o">==</span> <span class="s2">&quot;num&quot;</span> <span class="ow">and</span> <span class="n">num_units</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-673"><a id="__codelineno-0-673" name="__codelineno-0-673"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+</span><span id="__span-0-674"><a id="__codelineno-0-674" name="__codelineno-0-674"></a>                <span class="s2">&quot;The number of causal units must be specified if the causal unit is numerical.&quot;</span>
+</span><span id="__span-0-675"><a id="__codelineno-0-675" name="__codelineno-0-675"></a>            <span class="p">)</span>
+</span><span id="__span-0-676"><a id="__codelineno-0-676" name="__codelineno-0-676"></a>
+</span><span id="__span-0-677"><a id="__codelineno-0-677" name="__codelineno-0-677"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span> <span class="o">=</span> <span class="n">var_name</span>
+</span><span id="__span-0-678"><a id="__codelineno-0-678" name="__codelineno-0-678"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span> <span class="o">=</span> <span class="n">num_units</span>
+</span><span id="__span-0-679"><a id="__codelineno-0-679" name="__codelineno-0-679"></a>
+</span><span id="__span-0-680"><a id="__codelineno-0-680" name="__codelineno-0-680"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span>
+</span><span id="__span-0-681"><a id="__codelineno-0-681" name="__codelineno-0-681"></a>            <span class="sa">f</span><span class="s2">&quot;Causal unit set to </span><span class="si">{</span><span class="n">var_name</span><span class="si">}</span><span class="s2"> (tag: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">get_tag_of_parsed</span><span class="p">(</span><span class="n">var_name</span><span class="p">)</span><span class="si">}</span><span class="s2">) &quot;</span>
+</span><span id="__span-0-682"><a id="__codelineno-0-682" name="__codelineno-0-682"></a>            <span class="o">+</span> <span class="p">(</span>
+</span><span id="__span-0-683"><a id="__codelineno-0-683" name="__codelineno-0-683"></a>                <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-684"><a id="__codelineno-0-684" name="__codelineno-0-684"></a>                <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span>
+</span><span id="__span-0-685"><a id="__codelineno-0-685" name="__codelineno-0-685"></a>                <span class="k">else</span> <span class="sa">f</span><span class="s2">&quot; with </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span><span class="si">}</span><span class="s2"> causal units.&quot;</span>
+</span><span id="__span-0-686"><a id="__codelineno-0-686" name="__codelineno-0-686"></a>            <span class="p">)</span>
+</span><span id="__span-0-687"><a id="__codelineno-0-687" name="__codelineno-0-687"></a>        <span class="p">)</span>
+</span><span id="__span-0-688"><a id="__codelineno-0-688" name="__codelineno-0-688"></a>
+</span><span id="__span-0-689"><a id="__codelineno-0-689" name="__codelineno-0-689"></a>    <span class="k">def</span> <span class="nf">prepare</span><span class="p">(</span>
+</span><span id="__span-0-690"><a id="__codelineno-0-690" name="__codelineno-0-690"></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-691"><a id="__codelineno-0-691" name="__codelineno-0-691"></a>        <span class="n">custom_agg</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="p">{},</span>
+</span><span id="__span-0-692"><a id="__codelineno-0-692" name="__codelineno-0-692"></a>        <span class="n">custom_imp</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="p">{},</span>
+</span><span id="__span-0-693"><a id="__codelineno-0-693" name="__codelineno-0-693"></a>        <span class="n">count_occurences</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-694"><a id="__codelineno-0-694" name="__codelineno-0-694"></a>        <span class="n">ignore_uninteresting</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="__span-0-695"><a id="__codelineno-0-695" name="__codelineno-0-695"></a>        <span class="n">force</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-696"><a id="__codelineno-0-696" name="__codelineno-0-696"></a>        <span class="n">lasso_alpha</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="n">Pruner</span><span class="o">.</span><span class="n">LASSO_DEFAULT_ALPHA</span><span class="p">,</span>
+</span><span id="__span-0-697"><a id="__codelineno-0-697" name="__codelineno-0-697"></a>        <span class="n">lasso_max_iter</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="n">Pruner</span><span class="o">.</span><span class="n">LASSO_DEFAULT_MAX_ITER</span><span class="p">,</span>
+</span><span id="__span-0-698"><a id="__codelineno-0-698" name="__codelineno-0-698"></a>        <span class="n">drop_bad_aggs</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="__span-0-699"><a id="__codelineno-0-699" name="__codelineno-0-699"></a>        <span class="n">reject_prunable_edges</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-700"><a id="__codelineno-0-700" name="__codelineno-0-700"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-701"><a id="__codelineno-0-701" name="__codelineno-0-701"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-702"><a id="__codelineno-0-702" name="__codelineno-0-702"></a><span class="sd">        Prepare the log parsed from the table for causal analysis, using aggregation and imputation as needed.</span>
+</span><span id="__span-0-703"><a id="__codelineno-0-703" name="__codelineno-0-703"></a>
+</span><span id="__span-0-704"><a id="__codelineno-0-704" name="__codelineno-0-704"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-705"><a id="__codelineno-0-705" name="__codelineno-0-705"></a><span class="sd">            custom_agg: A dictionary of custom aggregation functions to be used for specific variables.</span>
+</span><span id="__span-0-706"><a id="__codelineno-0-706" name="__codelineno-0-706"></a><span class="sd">            custom_imp: A dictionary of custom imputation functions to be used for specific variables.</span>
+</span><span id="__span-0-707"><a id="__codelineno-0-707" name="__codelineno-0-707"></a><span class="sd">            count_occurences: Whether to include extra variables counting the occurence of each template.</span>
+</span><span id="__span-0-708"><a id="__codelineno-0-708" name="__codelineno-0-708"></a><span class="sd">            ignore_uninteresting: Whether to ignore uninteresting variables.</span>
+</span><span id="__span-0-709"><a id="__codelineno-0-709" name="__codelineno-0-709"></a><span class="sd">            force: Whether to force re-preparation of the log.</span>
+</span><span id="__span-0-710"><a id="__codelineno-0-710" name="__codelineno-0-710"></a><span class="sd">            lasso_alpha: The alpha parameter to be used for LASSO regression.</span>
+</span><span id="__span-0-711"><a id="__codelineno-0-711" name="__codelineno-0-711"></a><span class="sd">            lasso_max_iter: The maximum number of iterations to be used for LASSO regression.</span>
+</span><span id="__span-0-712"><a id="__codelineno-0-712" name="__codelineno-0-712"></a><span class="sd">            drop_bad_aggs: Whether to drop prepared variables that do not add information compared to other</span>
+</span><span id="__span-0-713"><a id="__codelineno-0-713" name="__codelineno-0-713"></a><span class="sd">                variables based on the same base variable but using a different aggregation function.</span>
+</span><span id="__span-0-714"><a id="__codelineno-0-714" name="__codelineno-0-714"></a><span class="sd">            reject_prunable_edges: Whether to reject edges that are prunable based on LASSO applciation.</span>
 </span><span id="__span-0-715"><a id="__codelineno-0-715" name="__codelineno-0-715"></a>
-</span><span id="__span-0-716"><a id="__codelineno-0-716" name="__codelineno-0-716"></a>        <span class="c1"># Check if the prepared files already exist.</span>
-</span><span id="__span-0-717"><a id="__codelineno-0-717" name="__codelineno-0-717"></a>        <span class="n">files_exist</span> <span class="o">=</span> <span class="ow">not</span> <span class="n">force</span>
-</span><span id="__span-0-718"><a id="__codelineno-0-718" name="__codelineno-0-718"></a>        <span class="n">prepared_df_names</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="__span-0-719"><a id="__codelineno-0-719" name="__codelineno-0-719"></a>            <span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">),</span>
-</span><span id="__span-0-720"><a id="__codelineno-0-720" name="__codelineno-0-720"></a>            <span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">),</span>
-</span><span id="__span-0-721"><a id="__codelineno-0-721" name="__codelineno-0-721"></a>        <span class="p">]</span>
-</span><span id="__span-0-722"><a id="__codelineno-0-722" name="__codelineno-0-722"></a>        <span class="k">for</span> <span class="n">var_name</span> <span class="ow">in</span> <span class="n">prepared_df_names</span><span class="p">:</span>
-</span><span id="__span-0-723"><a id="__codelineno-0-723" name="__codelineno-0-723"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">isfile</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">var_name</span><span class="p">)):</span>
-</span><span id="__span-0-724"><a id="__codelineno-0-724" name="__codelineno-0-724"></a>                <span class="n">files_exist</span> <span class="o">=</span> <span class="kc">False</span>
-</span><span id="__span-0-725"><a id="__codelineno-0-725" name="__codelineno-0-725"></a>                <span class="k">break</span>
-</span><span id="__span-0-726"><a id="__codelineno-0-726" name="__codelineno-0-726"></a>
-</span><span id="__span-0-727"><a id="__codelineno-0-727" name="__codelineno-0-727"></a>        <span class="k">if</span> <span class="n">files_exist</span><span class="p">:</span>
-</span><span id="__span-0-728"><a id="__codelineno-0-728" name="__codelineno-0-728"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span> <span class="o">=</span> <span class="n">Pickler</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">prepared_df_names</span><span class="p">[</span><span class="mi">0</span><span class="p">]))</span>
-</span><span id="__span-0-729"><a id="__codelineno-0-729" name="__codelineno-0-729"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span> <span class="o">=</span> <span class="n">Pickler</span><span class="o">.</span><span class="n">load</span><span class="p">(</span>
-</span><span id="__span-0-730"><a id="__codelineno-0-730" name="__codelineno-0-730"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">prepared_df_names</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
-</span><span id="__span-0-731"><a id="__codelineno-0-731" name="__codelineno-0-731"></a>            <span class="p">)</span>
-</span><span id="__span-0-732"><a id="__codelineno-0-732" name="__codelineno-0-732"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-733"><a id="__codelineno-0-733" name="__codelineno-0-733"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepare_anew</span><span class="p">(</span>
-</span><span id="__span-0-734"><a id="__codelineno-0-734" name="__codelineno-0-734"></a>                <span class="n">custom_agg</span><span class="p">,</span>
-</span><span id="__span-0-735"><a id="__codelineno-0-735" name="__codelineno-0-735"></a>                <span class="n">custom_imp</span><span class="p">,</span>
-</span><span id="__span-0-736"><a id="__codelineno-0-736" name="__codelineno-0-736"></a>                <span class="n">count_occurences</span><span class="o">=</span><span class="n">count_occurences</span><span class="p">,</span>
-</span><span id="__span-0-737"><a id="__codelineno-0-737" name="__codelineno-0-737"></a>                <span class="n">ignore_uninteresting</span><span class="o">=</span><span class="n">ignore_uninteresting</span><span class="p">,</span>
-</span><span id="__span-0-738"><a id="__codelineno-0-738" name="__codelineno-0-738"></a>                <span class="n">drop_bad_aggs</span><span class="o">=</span><span class="n">drop_bad_aggs</span><span class="p">,</span>
-</span><span id="__span-0-739"><a id="__codelineno-0-739" name="__codelineno-0-739"></a>            <span class="p">)</span>
-</span><span id="__span-0-740"><a id="__codelineno-0-740" name="__codelineno-0-740"></a>
-</span><span id="__span-0-741"><a id="__codelineno-0-741" name="__codelineno-0-741"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span> <span class="o">=</span> <span class="n">EdgeStateMatrix</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">prepared_variable_names</span><span class="p">)</span>
-</span><span id="__span-0-742"><a id="__codelineno-0-742" name="__codelineno-0-742"></a>        <span class="k">if</span> <span class="n">reject_prunable_edges</span><span class="p">:</span>
-</span><span id="__span-0-743"><a id="__codelineno-0-743" name="__codelineno-0-743"></a>            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Pruning edges...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-744"><a id="__codelineno-0-744" name="__codelineno-0-744"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">reject_all_prunable_edges</span><span class="p">(</span>
-</span><span id="__span-0-745"><a id="__codelineno-0-745" name="__codelineno-0-745"></a>                <span class="n">lasso_alpha</span><span class="o">=</span><span class="n">lasso_alpha</span><span class="p">,</span> <span class="n">lasso_max_iter</span><span class="o">=</span><span class="n">lasso_max_iter</span>
-</span><span id="__span-0-746"><a id="__codelineno-0-746" name="__codelineno-0-746"></a>            <span class="p">)</span>
-</span><span id="__span-0-747"><a id="__codelineno-0-747" name="__codelineno-0-747"></a>
-</span><span id="__span-0-748"><a id="__codelineno-0-748" name="__codelineno-0-748"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span> <span class="o">=</span> <span class="n">ECCS</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span> <span class="n">nx</span><span class="o">.</span><span class="n">DiGraph</span><span class="p">())</span>
-</span><span id="__span-0-749"><a id="__codelineno-0-749" name="__codelineno-0-749"></a>
-</span><span id="__span-0-750"><a id="__codelineno-0-750" name="__codelineno-0-750"></a>        <span class="n">end_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
-</span><span id="__span-0-751"><a id="__codelineno-0-751" name="__codelineno-0-751"></a>        <span class="n">elapsed</span> <span class="o">=</span> <span class="s2">&quot;</span><span class="si">{:.6f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">((</span><span class="n">end_time</span> <span class="o">-</span> <span class="n">start_time</span><span class="p">)</span><span class="o">.</span><span class="n">total_seconds</span><span class="p">())</span>
-</span><span id="__span-0-752"><a id="__codelineno-0-752" name="__codelineno-0-752"></a>        <span class="nb">print</span><span class="p">(</span>
-</span><span id="__span-0-753"><a id="__codelineno-0-753" name="__codelineno-0-753"></a>            <span class="sa">f</span><span class="s2">&quot;&quot;&quot;Preparation complete in </span><span class="si">{</span><span class="n">elapsed</span><span class="si">}</span><span class="s2"> seconds! &quot;&quot;&quot;</span>
-</span><span id="__span-0-754"><a id="__codelineno-0-754" name="__codelineno-0-754"></a>            <span class="sa">f</span><span class="s2">&quot;&quot;&quot;</span><span class="si">{</span><span class="n">np</span><span class="o">.</span><span class="n">count_nonzero</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">m</span><span class="w"> </span><span class="o">==</span><span class="w"> </span><span class="o">-</span><span class="mi">1</span><span class="p">)</span><span class="si">}</span><span class="s2"> of the </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">num_prepared_variables</span><span class="w"> </span><span class="o">**</span><span class="w"> </span><span class="mi">2</span><span class="si">}</span><span class="s2"> possible edges were auto-rejected.&quot;&quot;&quot;</span>
-</span><span id="__span-0-755"><a id="__codelineno-0-755" name="__codelineno-0-755"></a>        <span class="p">)</span>
-</span><span id="__span-0-756"><a id="__codelineno-0-756" name="__codelineno-0-756"></a>
-</span><span id="__span-0-757"><a id="__codelineno-0-757" name="__codelineno-0-757"></a>        <span class="k">return</span> <span class="n">elapsed</span>
-</span><span id="__span-0-758"><a id="__codelineno-0-758" name="__codelineno-0-758"></a>
-</span><span id="__span-0-759"><a id="__codelineno-0-759" name="__codelineno-0-759"></a>    <span class="k">def</span> <span class="nf">_prepare_anew</span><span class="p">(</span>
-</span><span id="__span-0-760"><a id="__codelineno-0-760" name="__codelineno-0-760"></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-761"><a id="__codelineno-0-761" name="__codelineno-0-761"></a>        <span class="n">custom_agg</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="p">{},</span>
-</span><span id="__span-0-762"><a id="__codelineno-0-762" name="__codelineno-0-762"></a>        <span class="n">custom_imp</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="p">{},</span>
-</span><span id="__span-0-763"><a id="__codelineno-0-763" name="__codelineno-0-763"></a>        <span class="n">count_occurences</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="__span-0-764"><a id="__codelineno-0-764" name="__codelineno-0-764"></a>        <span class="n">ignore_uninteresting</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="__span-0-765"><a id="__codelineno-0-765" name="__codelineno-0-765"></a>        <span class="n">drop_bad_aggs</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="__span-0-766"><a id="__codelineno-0-766" name="__codelineno-0-766"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-767"><a id="__codelineno-0-767" name="__codelineno-0-767"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-768"><a id="__codelineno-0-768" name="__codelineno-0-768"></a><span class="sd">        Prepare the log anew.</span>
+</span><span id="__span-0-716"><a id="__codelineno-0-716" name="__codelineno-0-716"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-717"><a id="__codelineno-0-717" name="__codelineno-0-717"></a><span class="sd">            The time elapsed for preparation, as a string.</span>
+</span><span id="__span-0-718"><a id="__codelineno-0-718" name="__codelineno-0-718"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-719"><a id="__codelineno-0-719" name="__codelineno-0-719"></a>
+</span><span id="__span-0-720"><a id="__codelineno-0-720" name="__codelineno-0-720"></a>        <span class="n">start_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
+</span><span id="__span-0-721"><a id="__codelineno-0-721" name="__codelineno-0-721"></a>        <span class="c1"># Ensure causal unit is set. TODO: make IUS maximizer the default</span>
+</span><span id="__span-0-722"><a id="__codelineno-0-722" name="__codelineno-0-722"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-723"><a id="__codelineno-0-723" name="__codelineno-0-723"></a>            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Causal unit not defined. Aborting.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-724"><a id="__codelineno-0-724" name="__codelineno-0-724"></a>            <span class="k">return</span> <span class="kc">None</span>
+</span><span id="__span-0-725"><a id="__codelineno-0-725" name="__codelineno-0-725"></a>
+</span><span id="__span-0-726"><a id="__codelineno-0-726" name="__codelineno-0-726"></a>        <span class="c1"># Check if the prepared files already exist.</span>
+</span><span id="__span-0-727"><a id="__codelineno-0-727" name="__codelineno-0-727"></a>        <span class="n">files_exist</span> <span class="o">=</span> <span class="ow">not</span> <span class="n">force</span>
+</span><span id="__span-0-728"><a id="__codelineno-0-728" name="__codelineno-0-728"></a>        <span class="n">prepared_df_names</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="__span-0-729"><a id="__codelineno-0-729" name="__codelineno-0-729"></a>            <span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">),</span>
+</span><span id="__span-0-730"><a id="__codelineno-0-730" name="__codelineno-0-730"></a>            <span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">),</span>
+</span><span id="__span-0-731"><a id="__codelineno-0-731" name="__codelineno-0-731"></a>        <span class="p">]</span>
+</span><span id="__span-0-732"><a id="__codelineno-0-732" name="__codelineno-0-732"></a>        <span class="k">for</span> <span class="n">var_name</span> <span class="ow">in</span> <span class="n">prepared_df_names</span><span class="p">:</span>
+</span><span id="__span-0-733"><a id="__codelineno-0-733" name="__codelineno-0-733"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">isfile</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">var_name</span><span class="p">)):</span>
+</span><span id="__span-0-734"><a id="__codelineno-0-734" name="__codelineno-0-734"></a>                <span class="n">files_exist</span> <span class="o">=</span> <span class="kc">False</span>
+</span><span id="__span-0-735"><a id="__codelineno-0-735" name="__codelineno-0-735"></a>                <span class="k">break</span>
+</span><span id="__span-0-736"><a id="__codelineno-0-736" name="__codelineno-0-736"></a>
+</span><span id="__span-0-737"><a id="__codelineno-0-737" name="__codelineno-0-737"></a>        <span class="k">if</span> <span class="n">files_exist</span><span class="p">:</span>
+</span><span id="__span-0-738"><a id="__codelineno-0-738" name="__codelineno-0-738"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span> <span class="o">=</span> <span class="n">Pickler</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">prepared_df_names</span><span class="p">[</span><span class="mi">0</span><span class="p">]))</span>
+</span><span id="__span-0-739"><a id="__codelineno-0-739" name="__codelineno-0-739"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span> <span class="o">=</span> <span class="n">Pickler</span><span class="o">.</span><span class="n">load</span><span class="p">(</span>
+</span><span id="__span-0-740"><a id="__codelineno-0-740" name="__codelineno-0-740"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">prepared_df_names</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+</span><span id="__span-0-741"><a id="__codelineno-0-741" name="__codelineno-0-741"></a>            <span class="p">)</span>
+</span><span id="__span-0-742"><a id="__codelineno-0-742" name="__codelineno-0-742"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-743"><a id="__codelineno-0-743" name="__codelineno-0-743"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepare_anew</span><span class="p">(</span>
+</span><span id="__span-0-744"><a id="__codelineno-0-744" name="__codelineno-0-744"></a>                <span class="n">custom_agg</span><span class="p">,</span>
+</span><span id="__span-0-745"><a id="__codelineno-0-745" name="__codelineno-0-745"></a>                <span class="n">custom_imp</span><span class="p">,</span>
+</span><span id="__span-0-746"><a id="__codelineno-0-746" name="__codelineno-0-746"></a>                <span class="n">count_occurences</span><span class="o">=</span><span class="n">count_occurences</span><span class="p">,</span>
+</span><span id="__span-0-747"><a id="__codelineno-0-747" name="__codelineno-0-747"></a>                <span class="n">ignore_uninteresting</span><span class="o">=</span><span class="n">ignore_uninteresting</span><span class="p">,</span>
+</span><span id="__span-0-748"><a id="__codelineno-0-748" name="__codelineno-0-748"></a>                <span class="n">drop_bad_aggs</span><span class="o">=</span><span class="n">drop_bad_aggs</span><span class="p">,</span>
+</span><span id="__span-0-749"><a id="__codelineno-0-749" name="__codelineno-0-749"></a>            <span class="p">)</span>
+</span><span id="__span-0-750"><a id="__codelineno-0-750" name="__codelineno-0-750"></a>
+</span><span id="__span-0-751"><a id="__codelineno-0-751" name="__codelineno-0-751"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span> <span class="o">=</span> <span class="n">EdgeStateMatrix</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">prepared_variable_names</span><span class="p">)</span>
+</span><span id="__span-0-752"><a id="__codelineno-0-752" name="__codelineno-0-752"></a>        <span class="k">if</span> <span class="n">reject_prunable_edges</span><span class="p">:</span>
+</span><span id="__span-0-753"><a id="__codelineno-0-753" name="__codelineno-0-753"></a>            <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Pruning edges...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-754"><a id="__codelineno-0-754" name="__codelineno-0-754"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">reject_all_prunable_edges</span><span class="p">(</span>
+</span><span id="__span-0-755"><a id="__codelineno-0-755" name="__codelineno-0-755"></a>                <span class="n">lasso_alpha</span><span class="o">=</span><span class="n">lasso_alpha</span><span class="p">,</span> <span class="n">lasso_max_iter</span><span class="o">=</span><span class="n">lasso_max_iter</span>
+</span><span id="__span-0-756"><a id="__codelineno-0-756" name="__codelineno-0-756"></a>            <span class="p">)</span>
+</span><span id="__span-0-757"><a id="__codelineno-0-757" name="__codelineno-0-757"></a>
+</span><span id="__span-0-758"><a id="__codelineno-0-758" name="__codelineno-0-758"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span> <span class="o">=</span> <span class="n">ECCS</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span> <span class="n">nx</span><span class="o">.</span><span class="n">DiGraph</span><span class="p">())</span>
+</span><span id="__span-0-759"><a id="__codelineno-0-759" name="__codelineno-0-759"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">set_verbose_to</span><span class="p">(</span><span class="n">Printer</span><span class="o">.</span><span class="n">LOGOS_VERBOSE</span><span class="p">)</span>
+</span><span id="__span-0-760"><a id="__codelineno-0-760" name="__codelineno-0-760"></a>
+</span><span id="__span-0-761"><a id="__codelineno-0-761" name="__codelineno-0-761"></a>        <span class="n">end_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
+</span><span id="__span-0-762"><a id="__codelineno-0-762" name="__codelineno-0-762"></a>        <span class="n">elapsed</span> <span class="o">=</span> <span class="s2">&quot;</span><span class="si">{:.6f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">((</span><span class="n">end_time</span> <span class="o">-</span> <span class="n">start_time</span><span class="p">)</span><span class="o">.</span><span class="n">total_seconds</span><span class="p">())</span>
+</span><span id="__span-0-763"><a id="__codelineno-0-763" name="__codelineno-0-763"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span>
+</span><span id="__span-0-764"><a id="__codelineno-0-764" name="__codelineno-0-764"></a>            <span class="sa">f</span><span class="s2">&quot;&quot;&quot;Preparation complete in </span><span class="si">{</span><span class="n">elapsed</span><span class="si">}</span><span class="s2"> seconds! &quot;&quot;&quot;</span>
+</span><span id="__span-0-765"><a id="__codelineno-0-765" name="__codelineno-0-765"></a>            <span class="sa">f</span><span class="s2">&quot;&quot;&quot;</span><span class="si">{</span><span class="n">np</span><span class="o">.</span><span class="n">count_nonzero</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">m</span><span class="w"> </span><span class="o">==</span><span class="w"> </span><span class="o">-</span><span class="mi">1</span><span class="p">)</span><span class="si">}</span><span class="s2"> of the </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">num_prepared_variables</span><span class="w"> </span><span class="o">**</span><span class="w"> </span><span class="mi">2</span><span class="si">}</span><span class="s2"> possible edges were auto-rejected.&quot;&quot;&quot;</span>
+</span><span id="__span-0-766"><a id="__codelineno-0-766" name="__codelineno-0-766"></a>        <span class="p">)</span>
+</span><span id="__span-0-767"><a id="__codelineno-0-767" name="__codelineno-0-767"></a>
+</span><span id="__span-0-768"><a id="__codelineno-0-768" name="__codelineno-0-768"></a>        <span class="k">return</span> <span class="n">elapsed</span>
 </span><span id="__span-0-769"><a id="__codelineno-0-769" name="__codelineno-0-769"></a>
-</span><span id="__span-0-770"><a id="__codelineno-0-770" name="__codelineno-0-770"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-771"><a id="__codelineno-0-771" name="__codelineno-0-771"></a><span class="sd">            custom_agg: A dictionary of custom aggregation functions to be used for specific variables.</span>
-</span><span id="__span-0-772"><a id="__codelineno-0-772" name="__codelineno-0-772"></a><span class="sd">            custom_imp: A dictionary of custom imputation functions to be used for specific variables.</span>
-</span><span id="__span-0-773"><a id="__codelineno-0-773" name="__codelineno-0-773"></a><span class="sd">            count_occurences: Whether to include extra variables counting the occurence of each template.</span>
-</span><span id="__span-0-774"><a id="__codelineno-0-774" name="__codelineno-0-774"></a><span class="sd">            ignore_uninteresting: Whether to ignore uninteresting variables.</span>
-</span><span id="__span-0-775"><a id="__codelineno-0-775" name="__codelineno-0-775"></a><span class="sd">            drop_bad_aggs: Whether to drop prepared variables that do not add information compared to other</span>
-</span><span id="__span-0-776"><a id="__codelineno-0-776" name="__codelineno-0-776"></a><span class="sd">                variables based on the same base variable but using a different aggregation function.</span>
-</span><span id="__span-0-777"><a id="__codelineno-0-777" name="__codelineno-0-777"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-778"><a id="__codelineno-0-778" name="__codelineno-0-778"></a>
-</span><span id="__span-0-779"><a id="__codelineno-0-779" name="__codelineno-0-779"></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Determining the causal unit assignment...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-780"><a id="__codelineno-0-780" name="__codelineno-0-780"></a>        <span class="n">causal_unit_assignment</span> <span class="o">=</span> <span class="n">CausalUnitSuggester</span><span class="o">.</span><span class="n">_discretize</span><span class="p">(</span>
-</span><span id="__span-0-781"><a id="__codelineno-0-781" name="__codelineno-0-781"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">],</span>
-</span><span id="__span-0-782"><a id="__codelineno-0-782" name="__codelineno-0-782"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span>
-</span><span id="__span-0-783"><a id="__codelineno-0-783" name="__codelineno-0-783"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span>
-</span><span id="__span-0-784"><a id="__codelineno-0-784" name="__codelineno-0-784"></a>            <span class="p">][</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span>
-</span><span id="__span-0-785"><a id="__codelineno-0-785" name="__codelineno-0-785"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span><span class="p">,</span>
-</span><span id="__span-0-786"><a id="__codelineno-0-786" name="__codelineno-0-786"></a>        <span class="p">)</span>
-</span><span id="__span-0-787"><a id="__codelineno-0-787" name="__codelineno-0-787"></a>
-</span><span id="__span-0-788"><a id="__codelineno-0-788" name="__codelineno-0-788"></a>        <span class="c1"># Convert keys in custom_agg and custom_imp to the names of the variables, if they are tags.</span>
-</span><span id="__span-0-789"><a id="__codelineno-0-789" name="__codelineno-0-789"></a>        <span class="n">custom_agg</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="__span-0-790"><a id="__codelineno-0-790" name="__codelineno-0-790"></a>            <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="n">k</span><span class="p">,</span> <span class="s2">&quot;parsed&quot;</span><span class="p">):</span> <span class="n">v</span>
-</span><span id="__span-0-791"><a id="__codelineno-0-791" name="__codelineno-0-791"></a>            <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">custom_agg</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
-</span><span id="__span-0-792"><a id="__codelineno-0-792" name="__codelineno-0-792"></a>        <span class="p">}</span>
-</span><span id="__span-0-793"><a id="__codelineno-0-793" name="__codelineno-0-793"></a>        <span class="n">custom_imp</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="__span-0-794"><a id="__codelineno-0-794" name="__codelineno-0-794"></a>            <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="n">k</span><span class="p">,</span> <span class="s2">&quot;parsed&quot;</span><span class="p">):</span> <span class="n">v</span>
-</span><span id="__span-0-795"><a id="__codelineno-0-795" name="__codelineno-0-795"></a>            <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">custom_imp</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
-</span><span id="__span-0-796"><a id="__codelineno-0-796" name="__codelineno-0-796"></a>        <span class="p">}</span>
-</span><span id="__span-0-797"><a id="__codelineno-0-797" name="__codelineno-0-797"></a>
-</span><span id="__span-0-798"><a id="__codelineno-0-798" name="__codelineno-0-798"></a>        <span class="c1"># Start with the parsed log, optionally with extra variables counting the occurence of each template.</span>
-</span><span id="__span-0-799"><a id="__codelineno-0-799" name="__codelineno-0-799"></a>        <span class="k">if</span> <span class="n">count_occurences</span><span class="p">:</span>
-</span><span id="__span-0-800"><a id="__codelineno-0-800" name="__codelineno-0-800"></a>            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Adding template occurrence count variables...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-801"><a id="__codelineno-0-801" name="__codelineno-0-801"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">concat</span><span class="p">(</span>
-</span><span id="__span-0-802"><a id="__codelineno-0-802" name="__codelineno-0-802"></a>                <span class="p">[</span>
-</span><span id="__span-0-803"><a id="__codelineno-0-803" name="__codelineno-0-803"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">,</span>
-</span><span id="__span-0-804"><a id="__codelineno-0-804" name="__codelineno-0-804"></a>                    <span class="n">pd</span><span class="o">.</span><span class="n">get_dummies</span><span class="p">(</span>
-</span><span id="__span-0-805"><a id="__codelineno-0-805" name="__codelineno-0-805"></a>                        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">],</span>
-</span><span id="__span-0-806"><a id="__codelineno-0-806" name="__codelineno-0-806"></a>                        <span class="n">prefix</span><span class="o">=</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">,</span>
-</span><span id="__span-0-807"><a id="__codelineno-0-807" name="__codelineno-0-807"></a>                        <span class="n">prefix_sep</span><span class="o">=</span><span class="s2">&quot;=&quot;</span><span class="p">,</span>
-</span><span id="__span-0-808"><a id="__codelineno-0-808" name="__codelineno-0-808"></a>                    <span class="p">),</span>
-</span><span id="__span-0-809"><a id="__codelineno-0-809" name="__codelineno-0-809"></a>                <span class="p">],</span>
-</span><span id="__span-0-810"><a id="__codelineno-0-810" name="__codelineno-0-810"></a>                <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-</span><span id="__span-0-811"><a id="__codelineno-0-811" name="__codelineno-0-811"></a>            <span class="p">)</span>
-</span><span id="__span-0-812"><a id="__codelineno-0-812" name="__codelineno-0-812"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-813"><a id="__codelineno-0-813" name="__codelineno-0-813"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span><span class="n">deep</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-814"><a id="__codelineno-0-814" name="__codelineno-0-814"></a>
-</span><span id="__span-0-815"><a id="__codelineno-0-815" name="__codelineno-0-815"></a>        <span class="c1"># No longer need the column storing the actual template IDs</span>
-</span><span id="__span-0-816"><a id="__codelineno-0-816" name="__codelineno-0-816"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">columns</span><span class="o">=</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">,</span> <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-817"><a id="__codelineno-0-817" name="__codelineno-0-817"></a>
-</span><span id="__span-0-818"><a id="__codelineno-0-818" name="__codelineno-0-818"></a>        <span class="c1"># Build dictionary of aggregation functions</span>
-</span><span id="__span-0-819"><a id="__codelineno-0-819" name="__codelineno-0-819"></a>        <span class="n">agg_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="__span-0-820"><a id="__codelineno-0-820" name="__codelineno-0-820"></a>            <span class="n">variable</span><span class="o">.</span><span class="n">Name</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="__span-0-821"><a id="__codelineno-0-821" name="__codelineno-0-821"></a>                <span class="n">custom_agg</span><span class="p">[</span><span class="n">variable</span><span class="o">.</span><span class="n">Name</span><span class="p">]</span>
-</span><span id="__span-0-822"><a id="__codelineno-0-822" name="__codelineno-0-822"></a>                <span class="k">if</span> <span class="n">variable</span><span class="o">.</span><span class="n">Name</span> <span class="ow">in</span> <span class="n">custom_agg</span>
-</span><span id="__span-0-823"><a id="__codelineno-0-823" name="__codelineno-0-823"></a>                <span class="k">else</span> <span class="n">AggregateSelector</span><span class="o">.</span><span class="n">DEFAULT_AGGREGATES</span><span class="p">[</span><span class="n">variable</span><span class="o">.</span><span class="n">Type</span><span class="p">]</span>
-</span><span id="__span-0-824"><a id="__codelineno-0-824" name="__codelineno-0-824"></a>            <span class="p">)</span>
-</span><span id="__span-0-825"><a id="__codelineno-0-825" name="__codelineno-0-825"></a>            <span class="k">for</span> <span class="n">variable</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">itertuples</span><span class="p">()</span>
-</span><span id="__span-0-826"><a id="__codelineno-0-826" name="__codelineno-0-826"></a>        <span class="p">}</span>
-</span><span id="__span-0-827"><a id="__codelineno-0-827" name="__codelineno-0-827"></a>
-</span><span id="__span-0-828"><a id="__codelineno-0-828" name="__codelineno-0-828"></a>        <span class="c1"># Add aggregations for template counts</span>
-</span><span id="__span-0-829"><a id="__codelineno-0-829" name="__codelineno-0-829"></a>        <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span><span class="p">:</span>
-</span><span id="__span-0-830"><a id="__codelineno-0-830" name="__codelineno-0-830"></a>            <span class="k">if</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">col</span><span class="p">)</span><span class="o">.</span><span class="n">base_var</span><span class="p">()</span> <span class="o">==</span> <span class="s2">&quot;TemplateId&quot;</span><span class="p">:</span>
-</span><span id="__span-0-831"><a id="__codelineno-0-831" name="__codelineno-0-831"></a>                <span class="n">agg_dict</span><span class="p">[</span><span class="n">col</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span><span class="s2">&quot;sum&quot;</span><span class="p">]</span>
-</span><span id="__span-0-832"><a id="__codelineno-0-832" name="__codelineno-0-832"></a>
-</span><span id="__span-0-833"><a id="__codelineno-0-833" name="__codelineno-0-833"></a>        <span class="c1"># Drop uninteresting columns if requested, except if they are the causal unit.</span>
-</span><span id="__span-0-834"><a id="__codelineno-0-834" name="__codelineno-0-834"></a>        <span class="n">ui_cols</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-835"><a id="__codelineno-0-835" name="__codelineno-0-835"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;IsUninteresting&quot;</span><span class="p">],</span> <span class="s2">&quot;Name&quot;</span>
-</span><span id="__span-0-836"><a id="__codelineno-0-836" name="__codelineno-0-836"></a>        <span class="p">]</span><span class="o">.</span><span class="n">values</span>
-</span><span id="__span-0-837"><a id="__codelineno-0-837" name="__codelineno-0-837"></a>        <span class="n">ui_cols</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">ui_cols</span> <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">]</span>
-</span><span id="__span-0-838"><a id="__codelineno-0-838" name="__codelineno-0-838"></a>        <span class="k">if</span> <span class="n">ignore_uninteresting</span><span class="p">:</span>
-</span><span id="__span-0-839"><a id="__codelineno-0-839" name="__codelineno-0-839"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span>
-</span><span id="__span-0-840"><a id="__codelineno-0-840" name="__codelineno-0-840"></a>                <span class="n">columns</span><span class="o">=</span><span class="n">ui_cols</span><span class="p">,</span>
-</span><span id="__span-0-841"><a id="__codelineno-0-841" name="__codelineno-0-841"></a>                <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
-</span><span id="__span-0-842"><a id="__codelineno-0-842" name="__codelineno-0-842"></a>            <span class="p">)</span>
-</span><span id="__span-0-843"><a id="__codelineno-0-843" name="__codelineno-0-843"></a>            <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="n">ui_cols</span><span class="p">:</span>
-</span><span id="__span-0-844"><a id="__codelineno-0-844" name="__codelineno-0-844"></a>                <span class="n">agg_dict</span><span class="o">.</span><span class="n">pop</span><span class="p">(</span><span class="n">col</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
-</span><span id="__span-0-845"><a id="__codelineno-0-845" name="__codelineno-0-845"></a>            <span class="nb">print</span><span class="p">(</span>
-</span><span id="__span-0-846"><a id="__codelineno-0-846" name="__codelineno-0-846"></a>                <span class="sa">f</span><span class="s2">&quot;Dropped </span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">ui_cols</span><span class="p">)</span><span class="si">}</span><span class="s2"> uninteresting columns, out of an original total of </span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">parsed_variables</span><span class="p">)</span><span class="si">}</span><span class="s2">.&quot;</span>
-</span><span id="__span-0-847"><a id="__codelineno-0-847" name="__codelineno-0-847"></a>            <span class="p">)</span>
-</span><span id="__span-0-848"><a id="__codelineno-0-848" name="__codelineno-0-848"></a>
-</span><span id="__span-0-849"><a id="__codelineno-0-849" name="__codelineno-0-849"></a>        <span class="c1"># Ensure the causal unit variable only has one aggregation function</span>
-</span><span id="__span-0-850"><a id="__codelineno-0-850" name="__codelineno-0-850"></a>        <span class="n">agg_dict</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">]</span> <span class="o">=</span> <span class="n">agg_dict</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">][:</span><span class="mi">1</span><span class="p">]</span>
-</span><span id="__span-0-851"><a id="__codelineno-0-851" name="__codelineno-0-851"></a>
-</span><span id="__span-0-852"><a id="__codelineno-0-852" name="__codelineno-0-852"></a>        <span class="c1"># Perform the aggregation</span>
-</span><span id="__span-0-853"><a id="__codelineno-0-853" name="__codelineno-0-853"></a>        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Calculating aggregates for each causal unit...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-854"><a id="__codelineno-0-854" name="__codelineno-0-854"></a>        <span class="n">agg_func_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="n">Callable</span><span class="p">]]</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="__span-0-855"><a id="__codelineno-0-855" name="__codelineno-0-855"></a>            <span class="n">name</span><span class="p">:</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_agg_funcs</span><span class="p">[</span><span class="n">f</span><span class="p">]</span> <span class="k">for</span> <span class="n">f</span> <span class="ow">in</span> <span class="n">funcs</span><span class="p">]</span>
-</span><span id="__span-0-856"><a id="__codelineno-0-856" name="__codelineno-0-856"></a>            <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">funcs</span> <span class="ow">in</span> <span class="n">agg_dict</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
-</span><span id="__span-0-857"><a id="__codelineno-0-857" name="__codelineno-0-857"></a>        <span class="p">}</span>
-</span><span id="__span-0-858"><a id="__codelineno-0-858" name="__codelineno-0-858"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">groupby</span><span class="p">(</span>
-</span><span id="__span-0-859"><a id="__codelineno-0-859" name="__codelineno-0-859"></a>            <span class="n">causal_unit_assignment</span>
-</span><span id="__span-0-860"><a id="__codelineno-0-860" name="__codelineno-0-860"></a>        <span class="p">)</span><span class="o">.</span><span class="n">aggregate</span><span class="p">(</span><span class="n">agg_func_dict</span><span class="p">)</span>
-</span><span id="__span-0-861"><a id="__codelineno-0-861" name="__codelineno-0-861"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="__span-0-862"><a id="__codelineno-0-862" name="__codelineno-0-862"></a>            <span class="s2">&quot;+&quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">col</span><span class="p">)</span> <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span><span class="o">.</span><span class="n">values</span>
-</span><span id="__span-0-863"><a id="__codelineno-0-863" name="__codelineno-0-863"></a>        <span class="p">]</span>
-</span><span id="__span-0-864"><a id="__codelineno-0-864" name="__codelineno-0-864"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Aggregates&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
-</span><span id="__span-0-865"><a id="__codelineno-0-865" name="__codelineno-0-865"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">agg_dict</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="p">[])</span>
-</span><span id="__span-0-866"><a id="__codelineno-0-866" name="__codelineno-0-866"></a>        <span class="p">)</span>
-</span><span id="__span-0-867"><a id="__codelineno-0-867" name="__codelineno-0-867"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">set_index</span><span class="p">(</span>
-</span><span id="__span-0-868"><a id="__codelineno-0-868" name="__codelineno-0-868"></a>            <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="si">}</span><span class="s2">+</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s1">&#39;Name&#39;</span><span class="p">]</span><span class="w"> </span><span class="o">==</span><span class="w"> </span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">][</span><span class="s1">&#39;Aggregates&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="__span-0-869"><a id="__codelineno-0-869" name="__codelineno-0-869"></a>            <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
-</span><span id="__span-0-870"><a id="__codelineno-0-870" name="__codelineno-0-870"></a>        <span class="p">)</span>
-</span><span id="__span-0-871"><a id="__codelineno-0-871" name="__codelineno-0-871"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">sort_index</span><span class="p">(</span><span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-872"><a id="__codelineno-0-872" name="__codelineno-0-872"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">index</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">index</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">str</span><span class="p">)</span>
-</span><span id="__span-0-873"><a id="__codelineno-0-873" name="__codelineno-0-873"></a>
-</span><span id="__span-0-874"><a id="__codelineno-0-874" name="__codelineno-0-874"></a>        <span class="c1"># Perform the imputation</span>
-</span><span id="__span-0-875"><a id="__codelineno-0-875" name="__codelineno-0-875"></a>        <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="n">tqdm</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span><span class="p">,</span> <span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Imputing missing values...&quot;</span><span class="p">):</span>
-</span><span id="__span-0-876"><a id="__codelineno-0-876" name="__codelineno-0-876"></a>            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">col</span><span class="p">]</span><span class="o">.</span><span class="n">isnull</span><span class="p">()</span><span class="o">.</span><span class="n">values</span><span class="o">.</span><span class="n">any</span><span class="p">():</span>
-</span><span id="__span-0-877"><a id="__codelineno-0-877" name="__codelineno-0-877"></a>                <span class="n">base_var</span> <span class="o">=</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">col</span><span class="p">)</span><span class="o">.</span><span class="n">base_var</span><span class="p">()</span>
-</span><span id="__span-0-878"><a id="__codelineno-0-878" name="__codelineno-0-878"></a>                <span class="n">func_name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-879"><a id="__codelineno-0-879" name="__codelineno-0-879"></a>                    <span class="n">custom_imp</span><span class="p">[</span><span class="n">base_var</span><span class="p">]</span> <span class="k">if</span> <span class="n">base_var</span> <span class="ow">in</span> <span class="n">custom_imp</span> <span class="k">else</span> <span class="s2">&quot;no_imp&quot;</span>
-</span><span id="__span-0-880"><a id="__codelineno-0-880" name="__codelineno-0-880"></a>                <span class="p">)</span>
-</span><span id="__span-0-881"><a id="__codelineno-0-881" name="__codelineno-0-881"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">col</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_imp_funcs</span><span class="p">[</span><span class="n">func_name</span><span class="p">])(</span>
-</span><span id="__span-0-882"><a id="__codelineno-0-882" name="__codelineno-0-882"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">col</span><span class="p">]</span>
-</span><span id="__span-0-883"><a id="__codelineno-0-883" name="__codelineno-0-883"></a>                <span class="p">)</span>
-</span><span id="__span-0-884"><a id="__codelineno-0-884" name="__codelineno-0-884"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">dropna</span><span class="p">(</span><span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-770"><a id="__codelineno-0-770" name="__codelineno-0-770"></a>    <span class="k">def</span> <span class="nf">_prepare_anew</span><span class="p">(</span>
+</span><span id="__span-0-771"><a id="__codelineno-0-771" name="__codelineno-0-771"></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-772"><a id="__codelineno-0-772" name="__codelineno-0-772"></a>        <span class="n">custom_agg</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="p">{},</span>
+</span><span id="__span-0-773"><a id="__codelineno-0-773" name="__codelineno-0-773"></a>        <span class="n">custom_imp</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="p">{},</span>
+</span><span id="__span-0-774"><a id="__codelineno-0-774" name="__codelineno-0-774"></a>        <span class="n">count_occurences</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-775"><a id="__codelineno-0-775" name="__codelineno-0-775"></a>        <span class="n">ignore_uninteresting</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="__span-0-776"><a id="__codelineno-0-776" name="__codelineno-0-776"></a>        <span class="n">drop_bad_aggs</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="__span-0-777"><a id="__codelineno-0-777" name="__codelineno-0-777"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-778"><a id="__codelineno-0-778" name="__codelineno-0-778"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-779"><a id="__codelineno-0-779" name="__codelineno-0-779"></a><span class="sd">        Prepare the log anew.</span>
+</span><span id="__span-0-780"><a id="__codelineno-0-780" name="__codelineno-0-780"></a>
+</span><span id="__span-0-781"><a id="__codelineno-0-781" name="__codelineno-0-781"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-782"><a id="__codelineno-0-782" name="__codelineno-0-782"></a><span class="sd">            custom_agg: A dictionary of custom aggregation functions to be used for specific variables.</span>
+</span><span id="__span-0-783"><a id="__codelineno-0-783" name="__codelineno-0-783"></a><span class="sd">            custom_imp: A dictionary of custom imputation functions to be used for specific variables.</span>
+</span><span id="__span-0-784"><a id="__codelineno-0-784" name="__codelineno-0-784"></a><span class="sd">            count_occurences: Whether to include extra variables counting the occurence of each template.</span>
+</span><span id="__span-0-785"><a id="__codelineno-0-785" name="__codelineno-0-785"></a><span class="sd">            ignore_uninteresting: Whether to ignore uninteresting variables.</span>
+</span><span id="__span-0-786"><a id="__codelineno-0-786" name="__codelineno-0-786"></a><span class="sd">            drop_bad_aggs: Whether to drop prepared variables that do not add information compared to other</span>
+</span><span id="__span-0-787"><a id="__codelineno-0-787" name="__codelineno-0-787"></a><span class="sd">                variables based on the same base variable but using a different aggregation function.</span>
+</span><span id="__span-0-788"><a id="__codelineno-0-788" name="__codelineno-0-788"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-789"><a id="__codelineno-0-789" name="__codelineno-0-789"></a>
+</span><span id="__span-0-790"><a id="__codelineno-0-790" name="__codelineno-0-790"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Determining the causal unit assignment...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-791"><a id="__codelineno-0-791" name="__codelineno-0-791"></a>        <span class="n">causal_unit_assignment</span> <span class="o">=</span> <span class="n">CausalUnitSuggester</span><span class="o">.</span><span class="n">_discretize</span><span class="p">(</span>
+</span><span id="__span-0-792"><a id="__codelineno-0-792" name="__codelineno-0-792"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">],</span>
+</span><span id="__span-0-793"><a id="__codelineno-0-793" name="__codelineno-0-793"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span>
+</span><span id="__span-0-794"><a id="__codelineno-0-794" name="__codelineno-0-794"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span>
+</span><span id="__span-0-795"><a id="__codelineno-0-795" name="__codelineno-0-795"></a>            <span class="p">][</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span>
+</span><span id="__span-0-796"><a id="__codelineno-0-796" name="__codelineno-0-796"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span><span class="p">,</span>
+</span><span id="__span-0-797"><a id="__codelineno-0-797" name="__codelineno-0-797"></a>        <span class="p">)</span>
+</span><span id="__span-0-798"><a id="__codelineno-0-798" name="__codelineno-0-798"></a>
+</span><span id="__span-0-799"><a id="__codelineno-0-799" name="__codelineno-0-799"></a>        <span class="c1"># Convert keys in custom_agg and custom_imp to the names of the variables, if they are tags.</span>
+</span><span id="__span-0-800"><a id="__codelineno-0-800" name="__codelineno-0-800"></a>        <span class="n">custom_agg</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="__span-0-801"><a id="__codelineno-0-801" name="__codelineno-0-801"></a>            <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="n">k</span><span class="p">,</span> <span class="s2">&quot;parsed&quot;</span><span class="p">):</span> <span class="n">v</span>
+</span><span id="__span-0-802"><a id="__codelineno-0-802" name="__codelineno-0-802"></a>            <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">custom_agg</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="__span-0-803"><a id="__codelineno-0-803" name="__codelineno-0-803"></a>        <span class="p">}</span>
+</span><span id="__span-0-804"><a id="__codelineno-0-804" name="__codelineno-0-804"></a>        <span class="n">custom_imp</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="__span-0-805"><a id="__codelineno-0-805" name="__codelineno-0-805"></a>            <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="n">k</span><span class="p">,</span> <span class="s2">&quot;parsed&quot;</span><span class="p">):</span> <span class="n">v</span>
+</span><span id="__span-0-806"><a id="__codelineno-0-806" name="__codelineno-0-806"></a>            <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">custom_imp</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="__span-0-807"><a id="__codelineno-0-807" name="__codelineno-0-807"></a>        <span class="p">}</span>
+</span><span id="__span-0-808"><a id="__codelineno-0-808" name="__codelineno-0-808"></a>
+</span><span id="__span-0-809"><a id="__codelineno-0-809" name="__codelineno-0-809"></a>        <span class="c1"># Start with the parsed log, optionally with extra variables counting the occurence of each template.</span>
+</span><span id="__span-0-810"><a id="__codelineno-0-810" name="__codelineno-0-810"></a>        <span class="k">if</span> <span class="n">count_occurences</span><span class="p">:</span>
+</span><span id="__span-0-811"><a id="__codelineno-0-811" name="__codelineno-0-811"></a>            <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Adding template occurrence count variables...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-812"><a id="__codelineno-0-812" name="__codelineno-0-812"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">concat</span><span class="p">(</span>
+</span><span id="__span-0-813"><a id="__codelineno-0-813" name="__codelineno-0-813"></a>                <span class="p">[</span>
+</span><span id="__span-0-814"><a id="__codelineno-0-814" name="__codelineno-0-814"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">,</span>
+</span><span id="__span-0-815"><a id="__codelineno-0-815" name="__codelineno-0-815"></a>                    <span class="n">pd</span><span class="o">.</span><span class="n">get_dummies</span><span class="p">(</span>
+</span><span id="__span-0-816"><a id="__codelineno-0-816" name="__codelineno-0-816"></a>                        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">],</span>
+</span><span id="__span-0-817"><a id="__codelineno-0-817" name="__codelineno-0-817"></a>                        <span class="n">prefix</span><span class="o">=</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">,</span>
+</span><span id="__span-0-818"><a id="__codelineno-0-818" name="__codelineno-0-818"></a>                        <span class="n">prefix_sep</span><span class="o">=</span><span class="s2">&quot;=&quot;</span><span class="p">,</span>
+</span><span id="__span-0-819"><a id="__codelineno-0-819" name="__codelineno-0-819"></a>                        <span class="n">dtype</span><span class="o">=</span><span class="nb">float</span><span class="p">,</span>
+</span><span id="__span-0-820"><a id="__codelineno-0-820" name="__codelineno-0-820"></a>                    <span class="p">),</span>
+</span><span id="__span-0-821"><a id="__codelineno-0-821" name="__codelineno-0-821"></a>                <span class="p">],</span>
+</span><span id="__span-0-822"><a id="__codelineno-0-822" name="__codelineno-0-822"></a>                <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+</span><span id="__span-0-823"><a id="__codelineno-0-823" name="__codelineno-0-823"></a>            <span class="p">)</span>
+</span><span id="__span-0-824"><a id="__codelineno-0-824" name="__codelineno-0-824"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-825"><a id="__codelineno-0-825" name="__codelineno-0-825"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span><span class="n">deep</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-826"><a id="__codelineno-0-826" name="__codelineno-0-826"></a>
+</span><span id="__span-0-827"><a id="__codelineno-0-827" name="__codelineno-0-827"></a>        <span class="c1"># No longer need the column storing the actual template IDs</span>
+</span><span id="__span-0-828"><a id="__codelineno-0-828" name="__codelineno-0-828"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">columns</span><span class="o">=</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">,</span> <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-829"><a id="__codelineno-0-829" name="__codelineno-0-829"></a>
+</span><span id="__span-0-830"><a id="__codelineno-0-830" name="__codelineno-0-830"></a>        <span class="c1"># Build dictionary of aggregation functions</span>
+</span><span id="__span-0-831"><a id="__codelineno-0-831" name="__codelineno-0-831"></a>        <span class="n">agg_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="__span-0-832"><a id="__codelineno-0-832" name="__codelineno-0-832"></a>            <span class="n">variable</span><span class="o">.</span><span class="n">Name</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="__span-0-833"><a id="__codelineno-0-833" name="__codelineno-0-833"></a>                <span class="n">custom_agg</span><span class="p">[</span><span class="n">variable</span><span class="o">.</span><span class="n">Name</span><span class="p">]</span>
+</span><span id="__span-0-834"><a id="__codelineno-0-834" name="__codelineno-0-834"></a>                <span class="k">if</span> <span class="n">variable</span><span class="o">.</span><span class="n">Name</span> <span class="ow">in</span> <span class="n">custom_agg</span>
+</span><span id="__span-0-835"><a id="__codelineno-0-835" name="__codelineno-0-835"></a>                <span class="k">else</span> <span class="n">AggregateSelector</span><span class="o">.</span><span class="n">DEFAULT_AGGREGATES</span><span class="p">[</span><span class="n">variable</span><span class="o">.</span><span class="n">Type</span><span class="p">]</span>
+</span><span id="__span-0-836"><a id="__codelineno-0-836" name="__codelineno-0-836"></a>            <span class="p">)</span>
+</span><span id="__span-0-837"><a id="__codelineno-0-837" name="__codelineno-0-837"></a>            <span class="k">for</span> <span class="n">variable</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">itertuples</span><span class="p">()</span>
+</span><span id="__span-0-838"><a id="__codelineno-0-838" name="__codelineno-0-838"></a>        <span class="p">}</span>
+</span><span id="__span-0-839"><a id="__codelineno-0-839" name="__codelineno-0-839"></a>
+</span><span id="__span-0-840"><a id="__codelineno-0-840" name="__codelineno-0-840"></a>        <span class="c1"># Add aggregations for template counts</span>
+</span><span id="__span-0-841"><a id="__codelineno-0-841" name="__codelineno-0-841"></a>        <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span><span class="p">:</span>
+</span><span id="__span-0-842"><a id="__codelineno-0-842" name="__codelineno-0-842"></a>            <span class="k">if</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">col</span><span class="p">)</span><span class="o">.</span><span class="n">base_var</span><span class="p">()</span> <span class="o">==</span> <span class="s2">&quot;TemplateId&quot;</span><span class="p">:</span>
+</span><span id="__span-0-843"><a id="__codelineno-0-843" name="__codelineno-0-843"></a>                <span class="n">agg_dict</span><span class="p">[</span><span class="n">col</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span><span class="s2">&quot;sum&quot;</span><span class="p">]</span>
+</span><span id="__span-0-844"><a id="__codelineno-0-844" name="__codelineno-0-844"></a>
+</span><span id="__span-0-845"><a id="__codelineno-0-845" name="__codelineno-0-845"></a>        <span class="c1"># Drop uninteresting columns if requested, except if they are the causal unit.</span>
+</span><span id="__span-0-846"><a id="__codelineno-0-846" name="__codelineno-0-846"></a>        <span class="n">ui_cols</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-847"><a id="__codelineno-0-847" name="__codelineno-0-847"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;IsUninteresting&quot;</span><span class="p">],</span> <span class="s2">&quot;Name&quot;</span>
+</span><span id="__span-0-848"><a id="__codelineno-0-848" name="__codelineno-0-848"></a>        <span class="p">]</span><span class="o">.</span><span class="n">values</span>
+</span><span id="__span-0-849"><a id="__codelineno-0-849" name="__codelineno-0-849"></a>        <span class="n">ui_cols</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">ui_cols</span> <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">]</span>
+</span><span id="__span-0-850"><a id="__codelineno-0-850" name="__codelineno-0-850"></a>        <span class="k">if</span> <span class="n">ignore_uninteresting</span><span class="p">:</span>
+</span><span id="__span-0-851"><a id="__codelineno-0-851" name="__codelineno-0-851"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span>
+</span><span id="__span-0-852"><a id="__codelineno-0-852" name="__codelineno-0-852"></a>                <span class="n">columns</span><span class="o">=</span><span class="n">ui_cols</span><span class="p">,</span>
+</span><span id="__span-0-853"><a id="__codelineno-0-853" name="__codelineno-0-853"></a>                <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+</span><span id="__span-0-854"><a id="__codelineno-0-854" name="__codelineno-0-854"></a>            <span class="p">)</span>
+</span><span id="__span-0-855"><a id="__codelineno-0-855" name="__codelineno-0-855"></a>            <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="n">ui_cols</span><span class="p">:</span>
+</span><span id="__span-0-856"><a id="__codelineno-0-856" name="__codelineno-0-856"></a>                <span class="n">agg_dict</span><span class="o">.</span><span class="n">pop</span><span class="p">(</span><span class="n">col</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
+</span><span id="__span-0-857"><a id="__codelineno-0-857" name="__codelineno-0-857"></a>            <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span>
+</span><span id="__span-0-858"><a id="__codelineno-0-858" name="__codelineno-0-858"></a>                <span class="sa">f</span><span class="s2">&quot;Dropped </span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">ui_cols</span><span class="p">)</span><span class="si">}</span><span class="s2"> uninteresting columns, out of an original total of </span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">parsed_variables</span><span class="p">)</span><span class="si">}</span><span class="s2">.&quot;</span>
+</span><span id="__span-0-859"><a id="__codelineno-0-859" name="__codelineno-0-859"></a>            <span class="p">)</span>
+</span><span id="__span-0-860"><a id="__codelineno-0-860" name="__codelineno-0-860"></a>
+</span><span id="__span-0-861"><a id="__codelineno-0-861" name="__codelineno-0-861"></a>        <span class="c1"># Ensure the causal unit variable only has one aggregation function</span>
+</span><span id="__span-0-862"><a id="__codelineno-0-862" name="__codelineno-0-862"></a>        <span class="n">agg_dict</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">]</span> <span class="o">=</span> <span class="n">agg_dict</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">][:</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="__span-0-863"><a id="__codelineno-0-863" name="__codelineno-0-863"></a>
+</span><span id="__span-0-864"><a id="__codelineno-0-864" name="__codelineno-0-864"></a>        <span class="c1"># Perform the aggregation</span>
+</span><span id="__span-0-865"><a id="__codelineno-0-865" name="__codelineno-0-865"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="s2">&quot;Calculating aggregates for each causal unit...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-866"><a id="__codelineno-0-866" name="__codelineno-0-866"></a>        <span class="n">agg_func_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="n">Callable</span><span class="p">]]</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="__span-0-867"><a id="__codelineno-0-867" name="__codelineno-0-867"></a>            <span class="n">name</span><span class="p">:</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_agg_funcs</span><span class="p">[</span><span class="n">f</span><span class="p">]</span> <span class="k">for</span> <span class="n">f</span> <span class="ow">in</span> <span class="n">funcs</span><span class="p">]</span>
+</span><span id="__span-0-868"><a id="__codelineno-0-868" name="__codelineno-0-868"></a>            <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">funcs</span> <span class="ow">in</span> <span class="n">agg_dict</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="__span-0-869"><a id="__codelineno-0-869" name="__codelineno-0-869"></a>        <span class="p">}</span>
+</span><span id="__span-0-870"><a id="__codelineno-0-870" name="__codelineno-0-870"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">groupby</span><span class="p">(</span>
+</span><span id="__span-0-871"><a id="__codelineno-0-871" name="__codelineno-0-871"></a>            <span class="n">causal_unit_assignment</span>
+</span><span id="__span-0-872"><a id="__codelineno-0-872" name="__codelineno-0-872"></a>        <span class="p">)</span><span class="o">.</span><span class="n">aggregate</span><span class="p">(</span><span class="n">agg_func_dict</span><span class="p">)</span>
+</span><span id="__span-0-873"><a id="__codelineno-0-873" name="__codelineno-0-873"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="__span-0-874"><a id="__codelineno-0-874" name="__codelineno-0-874"></a>            <span class="s2">&quot;+&quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">col</span><span class="p">)</span> <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span><span class="o">.</span><span class="n">values</span>
+</span><span id="__span-0-875"><a id="__codelineno-0-875" name="__codelineno-0-875"></a>        <span class="p">]</span>
+</span><span id="__span-0-876"><a id="__codelineno-0-876" name="__codelineno-0-876"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Aggregates&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
+</span><span id="__span-0-877"><a id="__codelineno-0-877" name="__codelineno-0-877"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">agg_dict</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="p">[])</span>
+</span><span id="__span-0-878"><a id="__codelineno-0-878" name="__codelineno-0-878"></a>        <span class="p">)</span>
+</span><span id="__span-0-879"><a id="__codelineno-0-879" name="__codelineno-0-879"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">set_index</span><span class="p">(</span>
+</span><span id="__span-0-880"><a id="__codelineno-0-880" name="__codelineno-0-880"></a>            <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="si">}</span><span class="s2">+</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s1">&#39;Name&#39;</span><span class="p">]</span><span class="w"> </span><span class="o">==</span><span class="w"> </span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">][</span><span class="s1">&#39;Aggregates&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="__span-0-881"><a id="__codelineno-0-881" name="__codelineno-0-881"></a>            <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+</span><span id="__span-0-882"><a id="__codelineno-0-882" name="__codelineno-0-882"></a>        <span class="p">)</span>
+</span><span id="__span-0-883"><a id="__codelineno-0-883" name="__codelineno-0-883"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">sort_index</span><span class="p">(</span><span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-884"><a id="__codelineno-0-884" name="__codelineno-0-884"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">index</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">index</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">str</span><span class="p">)</span>
 </span><span id="__span-0-885"><a id="__codelineno-0-885" name="__codelineno-0-885"></a>
-</span><span id="__span-0-886"><a id="__codelineno-0-886" name="__codelineno-0-886"></a>        <span class="c1"># Drop variables that do not add information compared to other variables based on the same base variable</span>
-</span><span id="__span-0-887"><a id="__codelineno-0-887" name="__codelineno-0-887"></a>        <span class="c1"># but using a different aggregation function.</span>
-</span><span id="__span-0-888"><a id="__codelineno-0-888" name="__codelineno-0-888"></a>        <span class="k">if</span> <span class="n">drop_bad_aggs</span><span class="p">:</span>
-</span><span id="__span-0-889"><a id="__codelineno-0-889" name="__codelineno-0-889"></a>            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Dropping aggregates that do not add information...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-890"><a id="__codelineno-0-890" name="__codelineno-0-890"></a>            <span class="n">cols_to_drop</span> <span class="o">=</span> <span class="n">AggregateSelector</span><span class="o">.</span><span class="n">find_uninformative_aggregates</span><span class="p">(</span>
-</span><span id="__span-0-891"><a id="__codelineno-0-891" name="__codelineno-0-891"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span>
-</span><span id="__span-0-892"><a id="__codelineno-0-892" name="__codelineno-0-892"></a>            <span class="p">)</span>
-</span><span id="__span-0-893"><a id="__codelineno-0-893" name="__codelineno-0-893"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">columns</span><span class="o">=</span><span class="n">cols_to_drop</span><span class="p">,</span> <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-894"><a id="__codelineno-0-894" name="__codelineno-0-894"></a>
-</span><span id="__span-0-895"><a id="__codelineno-0-895" name="__codelineno-0-895"></a>        <span class="c1"># Identify the categorical variables and one-hot encode them</span>
-</span><span id="__span-0-896"><a id="__codelineno-0-896" name="__codelineno-0-896"></a>        <span class="n">categorical_vars</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">select_dtypes</span><span class="p">(</span>
-</span><span id="__span-0-897"><a id="__codelineno-0-897" name="__codelineno-0-897"></a>            <span class="n">include</span><span class="o">=</span><span class="s2">&quot;object&quot;</span>
-</span><span id="__span-0-898"><a id="__codelineno-0-898" name="__codelineno-0-898"></a>        <span class="p">)</span><span class="o">.</span><span class="n">columns</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
-</span><span id="__span-0-899"><a id="__codelineno-0-899" name="__codelineno-0-899"></a>        <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="n">tqdm</span><span class="p">(</span>
-</span><span id="__span-0-900"><a id="__codelineno-0-900" name="__codelineno-0-900"></a>            <span class="n">categorical_vars</span><span class="p">,</span> <span class="n">desc</span><span class="o">=</span><span class="s2">&quot;One-hot encoding categorical variables...&quot;</span>
-</span><span id="__span-0-901"><a id="__codelineno-0-901" name="__codelineno-0-901"></a>        <span class="p">):</span>
-</span><span id="__span-0-902"><a id="__codelineno-0-902" name="__codelineno-0-902"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">concat</span><span class="p">(</span>
-</span><span id="__span-0-903"><a id="__codelineno-0-903" name="__codelineno-0-903"></a>                <span class="p">[</span>
-</span><span id="__span-0-904"><a id="__codelineno-0-904" name="__codelineno-0-904"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span>
-</span><span id="__span-0-905"><a id="__codelineno-0-905" name="__codelineno-0-905"></a>                    <span class="n">pd</span><span class="o">.</span><span class="n">get_dummies</span><span class="p">(</span>
-</span><span id="__span-0-906"><a id="__codelineno-0-906" name="__codelineno-0-906"></a>                        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">col</span><span class="p">],</span> <span class="n">prefix</span><span class="o">=</span><span class="n">col</span><span class="p">,</span> <span class="n">prefix_sep</span><span class="o">=</span><span class="s2">&quot;=&quot;</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">int</span>
-</span><span id="__span-0-907"><a id="__codelineno-0-907" name="__codelineno-0-907"></a>                    <span class="p">),</span>
-</span><span id="__span-0-908"><a id="__codelineno-0-908" name="__codelineno-0-908"></a>                <span class="p">],</span>
-</span><span id="__span-0-909"><a id="__codelineno-0-909" name="__codelineno-0-909"></a>                <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-</span><span id="__span-0-910"><a id="__codelineno-0-910" name="__codelineno-0-910"></a>            <span class="p">)</span>
-</span><span id="__span-0-911"><a id="__codelineno-0-911" name="__codelineno-0-911"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">col</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-912"><a id="__codelineno-0-912" name="__codelineno-0-912"></a>        <span class="c1"># Deal with https://github.com/pydot/pydot/issues/258</span>
-</span><span id="__span-0-913"><a id="__codelineno-0-913" name="__codelineno-0-913"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="__span-0-914"><a id="__codelineno-0-914" name="__codelineno-0-914"></a>            <span class="n">x</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s2">&quot;:&quot;</span><span class="p">,</span> <span class="s2">&quot;;&quot;</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span>
-</span><span id="__span-0-915"><a id="__codelineno-0-915" name="__codelineno-0-915"></a>        <span class="p">]</span>
-</span><span id="__span-0-916"><a id="__codelineno-0-916" name="__codelineno-0-916"></a>
-</span><span id="__span-0-917"><a id="__codelineno-0-917" name="__codelineno-0-917"></a>        <span class="c1"># Generate dataframe of prepared variables for later tagging etc.</span>
-</span><span id="__span-0-918"><a id="__codelineno-0-918" name="__codelineno-0-918"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_generate_prepared_variables_df</span><span class="p">()</span>
-</span><span id="__span-0-919"><a id="__codelineno-0-919" name="__codelineno-0-919"></a>
-</span><span id="__span-0-920"><a id="__codelineno-0-920" name="__codelineno-0-920"></a>        <span class="c1"># Convert any date columns to Unix timestamps in milliseconds</span>
-</span><span id="__span-0-921"><a id="__codelineno-0-921" name="__codelineno-0-921"></a>        <span class="n">date_cols</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-922"><a id="__codelineno-0-922" name="__codelineno-0-922"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="s2">&quot;date&quot;</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span>
-</span><span id="__span-0-923"><a id="__codelineno-0-923" name="__codelineno-0-923"></a>        <span class="p">]</span><span class="o">.</span><span class="n">values</span>
-</span><span id="__span-0-924"><a id="__codelineno-0-924" name="__codelineno-0-924"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">date_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">date_cols</span><span class="p">]</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
-</span><span id="__span-0-925"><a id="__codelineno-0-925" name="__codelineno-0-925"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">x</span><span class="o">.</span><span class="n">timestamp</span><span class="p">()</span> <span class="o">*</span> <span class="mf">1000.0</span>
-</span><span id="__span-0-926"><a id="__codelineno-0-926" name="__codelineno-0-926"></a>        <span class="p">)</span>
-</span><span id="__span-0-927"><a id="__codelineno-0-927" name="__codelineno-0-927"></a>
-</span><span id="__span-0-928"><a id="__codelineno-0-928" name="__codelineno-0-928"></a>        <span class="c1"># Convert any time columns to milliseconds</span>
-</span><span id="__span-0-929"><a id="__codelineno-0-929" name="__codelineno-0-929"></a>        <span class="n">time_cols</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-930"><a id="__codelineno-0-930" name="__codelineno-0-930"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="s2">&quot;time&quot;</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span>
-</span><span id="__span-0-931"><a id="__codelineno-0-931" name="__codelineno-0-931"></a>        <span class="p">]</span><span class="o">.</span><span class="n">values</span>
-</span><span id="__span-0-932"><a id="__codelineno-0-932" name="__codelineno-0-932"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">time_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">time_cols</span><span class="p">]</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
-</span><span id="__span-0-933"><a id="__codelineno-0-933" name="__codelineno-0-933"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">x</span><span class="o">.</span><span class="n">total_seconds</span><span class="p">()</span> <span class="o">*</span> <span class="mf">1000.0</span>
-</span><span id="__span-0-934"><a id="__codelineno-0-934" name="__codelineno-0-934"></a>        <span class="p">)</span>
-</span><span id="__span-0-935"><a id="__codelineno-0-935" name="__codelineno-0-935"></a>
-</span><span id="__span-0-936"><a id="__codelineno-0-936" name="__codelineno-0-936"></a>        <span class="c1"># Write out prepared log and variables</span>
-</span><span id="__span-0-937"><a id="__codelineno-0-937" name="__codelineno-0-937"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_skip_writeout</span><span class="p">:</span>
-</span><span id="__span-0-938"><a id="__codelineno-0-938" name="__codelineno-0-938"></a>            <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span>
-</span><span id="__span-0-939"><a id="__codelineno-0-939" name="__codelineno-0-939"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">))</span>
-</span><span id="__span-0-940"><a id="__codelineno-0-940" name="__codelineno-0-940"></a>            <span class="p">)</span>
-</span><span id="__span-0-941"><a id="__codelineno-0-941" name="__codelineno-0-941"></a>            <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span>
-</span><span id="__span-0-942"><a id="__codelineno-0-942" name="__codelineno-0-942"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span>
-</span><span id="__span-0-943"><a id="__codelineno-0-943" name="__codelineno-0-943"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)),</span>
-</span><span id="__span-0-944"><a id="__codelineno-0-944" name="__codelineno-0-944"></a>            <span class="p">)</span>
-</span><span id="__span-0-945"><a id="__codelineno-0-945" name="__codelineno-0-945"></a>
-</span><span id="__span-0-946"><a id="__codelineno-0-946" name="__codelineno-0-946"></a>        <span class="nb">print</span><span class="p">(</span>
-</span><span id="__span-0-947"><a id="__codelineno-0-947" name="__codelineno-0-947"></a>            <span class="sa">f</span><span class="s2">&quot;&quot;&quot;Successfully prepared the log with causal unit </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="si">}</span><span class="s2"> &quot;&quot;&quot;</span>
-</span><span id="__span-0-948"><a id="__codelineno-0-948" name="__codelineno-0-948"></a>            <span class="sa">f</span><span class="s2">&quot;&quot;&quot;(tag: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">get_tag_of_parsed</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">)</span><span class="si">}</span><span class="s2">)&quot;&quot;&quot;</span>
-</span><span id="__span-0-949"><a id="__codelineno-0-949" name="__codelineno-0-949"></a>            <span class="o">+</span> <span class="p">(</span>
-</span><span id="__span-0-950"><a id="__codelineno-0-950" name="__codelineno-0-950"></a>                <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-951"><a id="__codelineno-0-951" name="__codelineno-0-951"></a>                <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span>
-</span><span id="__span-0-952"><a id="__codelineno-0-952" name="__codelineno-0-952"></a>                <span class="k">else</span> <span class="sa">f</span><span class="s2">&quot; with </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span><span class="si">}</span><span class="s2"> causal units.&quot;</span>
-</span><span id="__span-0-953"><a id="__codelineno-0-953" name="__codelineno-0-953"></a>            <span class="p">)</span>
-</span><span id="__span-0-954"><a id="__codelineno-0-954" name="__codelineno-0-954"></a>        <span class="p">)</span>
-</span><span id="__span-0-955"><a id="__codelineno-0-955" name="__codelineno-0-955"></a>
-</span><span id="__span-0-956"><a id="__codelineno-0-956" name="__codelineno-0-956"></a>        <span class="k">return</span>
+</span><span id="__span-0-886"><a id="__codelineno-0-886" name="__codelineno-0-886"></a>        <span class="c1"># Perform the imputation</span>
+</span><span id="__span-0-887"><a id="__codelineno-0-887" name="__codelineno-0-887"></a>        <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="n">tqdm</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span><span class="p">,</span> <span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Imputing missing values...&quot;</span><span class="p">):</span>
+</span><span id="__span-0-888"><a id="__codelineno-0-888" name="__codelineno-0-888"></a>            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">col</span><span class="p">]</span><span class="o">.</span><span class="n">isnull</span><span class="p">()</span><span class="o">.</span><span class="n">values</span><span class="o">.</span><span class="n">any</span><span class="p">():</span>
+</span><span id="__span-0-889"><a id="__codelineno-0-889" name="__codelineno-0-889"></a>                <span class="n">base_var</span> <span class="o">=</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">col</span><span class="p">)</span><span class="o">.</span><span class="n">base_var</span><span class="p">()</span>
+</span><span id="__span-0-890"><a id="__codelineno-0-890" name="__codelineno-0-890"></a>                <span class="n">func_name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-891"><a id="__codelineno-0-891" name="__codelineno-0-891"></a>                    <span class="n">custom_imp</span><span class="p">[</span><span class="n">base_var</span><span class="p">]</span> <span class="k">if</span> <span class="n">base_var</span> <span class="ow">in</span> <span class="n">custom_imp</span> <span class="k">else</span> <span class="s2">&quot;no_imp&quot;</span>
+</span><span id="__span-0-892"><a id="__codelineno-0-892" name="__codelineno-0-892"></a>                <span class="p">)</span>
+</span><span id="__span-0-893"><a id="__codelineno-0-893" name="__codelineno-0-893"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">col</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_imp_funcs</span><span class="p">[</span><span class="n">func_name</span><span class="p">])(</span>
+</span><span id="__span-0-894"><a id="__codelineno-0-894" name="__codelineno-0-894"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">col</span><span class="p">]</span>
+</span><span id="__span-0-895"><a id="__codelineno-0-895" name="__codelineno-0-895"></a>                <span class="p">)</span>
+</span><span id="__span-0-896"><a id="__codelineno-0-896" name="__codelineno-0-896"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">dropna</span><span class="p">(</span><span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-897"><a id="__codelineno-0-897" name="__codelineno-0-897"></a>
+</span><span id="__span-0-898"><a id="__codelineno-0-898" name="__codelineno-0-898"></a>        <span class="c1"># Drop variables that do not add information compared to other variables based on the same base variable</span>
+</span><span id="__span-0-899"><a id="__codelineno-0-899" name="__codelineno-0-899"></a>        <span class="c1"># but using a different aggregation function.</span>
+</span><span id="__span-0-900"><a id="__codelineno-0-900" name="__codelineno-0-900"></a>        <span class="k">if</span> <span class="n">drop_bad_aggs</span><span class="p">:</span>
+</span><span id="__span-0-901"><a id="__codelineno-0-901" name="__codelineno-0-901"></a>            <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Dropping aggregates that do not add information...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-902"><a id="__codelineno-0-902" name="__codelineno-0-902"></a>            <span class="n">cols_to_drop</span> <span class="o">=</span> <span class="n">AggregateSelector</span><span class="o">.</span><span class="n">find_uninformative_aggregates</span><span class="p">(</span>
+</span><span id="__span-0-903"><a id="__codelineno-0-903" name="__codelineno-0-903"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span>
+</span><span id="__span-0-904"><a id="__codelineno-0-904" name="__codelineno-0-904"></a>            <span class="p">)</span>
+</span><span id="__span-0-905"><a id="__codelineno-0-905" name="__codelineno-0-905"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">columns</span><span class="o">=</span><span class="n">cols_to_drop</span><span class="p">,</span> <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-906"><a id="__codelineno-0-906" name="__codelineno-0-906"></a>
+</span><span id="__span-0-907"><a id="__codelineno-0-907" name="__codelineno-0-907"></a>        <span class="c1"># Identify the categorical variables and one-hot encode them</span>
+</span><span id="__span-0-908"><a id="__codelineno-0-908" name="__codelineno-0-908"></a>        <span class="n">categorical_vars</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">select_dtypes</span><span class="p">(</span>
+</span><span id="__span-0-909"><a id="__codelineno-0-909" name="__codelineno-0-909"></a>            <span class="n">include</span><span class="o">=</span><span class="s2">&quot;object&quot;</span>
+</span><span id="__span-0-910"><a id="__codelineno-0-910" name="__codelineno-0-910"></a>        <span class="p">)</span><span class="o">.</span><span class="n">columns</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
+</span><span id="__span-0-911"><a id="__codelineno-0-911" name="__codelineno-0-911"></a>        <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="n">tqdm</span><span class="p">(</span>
+</span><span id="__span-0-912"><a id="__codelineno-0-912" name="__codelineno-0-912"></a>            <span class="n">categorical_vars</span><span class="p">,</span> <span class="n">desc</span><span class="o">=</span><span class="s2">&quot;One-hot encoding categorical variables...&quot;</span>
+</span><span id="__span-0-913"><a id="__codelineno-0-913" name="__codelineno-0-913"></a>        <span class="p">):</span>
+</span><span id="__span-0-914"><a id="__codelineno-0-914" name="__codelineno-0-914"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">concat</span><span class="p">(</span>
+</span><span id="__span-0-915"><a id="__codelineno-0-915" name="__codelineno-0-915"></a>                <span class="p">[</span>
+</span><span id="__span-0-916"><a id="__codelineno-0-916" name="__codelineno-0-916"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span>
+</span><span id="__span-0-917"><a id="__codelineno-0-917" name="__codelineno-0-917"></a>                    <span class="n">pd</span><span class="o">.</span><span class="n">get_dummies</span><span class="p">(</span>
+</span><span id="__span-0-918"><a id="__codelineno-0-918" name="__codelineno-0-918"></a>                        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">col</span><span class="p">],</span> <span class="n">prefix</span><span class="o">=</span><span class="n">col</span><span class="p">,</span> <span class="n">prefix_sep</span><span class="o">=</span><span class="s2">&quot;=&quot;</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">float</span>
+</span><span id="__span-0-919"><a id="__codelineno-0-919" name="__codelineno-0-919"></a>                    <span class="p">),</span>
+</span><span id="__span-0-920"><a id="__codelineno-0-920" name="__codelineno-0-920"></a>                <span class="p">],</span>
+</span><span id="__span-0-921"><a id="__codelineno-0-921" name="__codelineno-0-921"></a>                <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+</span><span id="__span-0-922"><a id="__codelineno-0-922" name="__codelineno-0-922"></a>            <span class="p">)</span>
+</span><span id="__span-0-923"><a id="__codelineno-0-923" name="__codelineno-0-923"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">col</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-924"><a id="__codelineno-0-924" name="__codelineno-0-924"></a>        <span class="c1"># Deal with https://github.com/pydot/pydot/issues/258</span>
+</span><span id="__span-0-925"><a id="__codelineno-0-925" name="__codelineno-0-925"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="__span-0-926"><a id="__codelineno-0-926" name="__codelineno-0-926"></a>            <span class="n">x</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s2">&quot;:&quot;</span><span class="p">,</span> <span class="s2">&quot;;&quot;</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span>
+</span><span id="__span-0-927"><a id="__codelineno-0-927" name="__codelineno-0-927"></a>        <span class="p">]</span>
+</span><span id="__span-0-928"><a id="__codelineno-0-928" name="__codelineno-0-928"></a>
+</span><span id="__span-0-929"><a id="__codelineno-0-929" name="__codelineno-0-929"></a>        <span class="c1"># Generate dataframe of prepared variables for later tagging etc.</span>
+</span><span id="__span-0-930"><a id="__codelineno-0-930" name="__codelineno-0-930"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_generate_prepared_variables_df</span><span class="p">()</span>
+</span><span id="__span-0-931"><a id="__codelineno-0-931" name="__codelineno-0-931"></a>
+</span><span id="__span-0-932"><a id="__codelineno-0-932" name="__codelineno-0-932"></a>        <span class="c1"># Convert any date columns to Unix timestamps in milliseconds</span>
+</span><span id="__span-0-933"><a id="__codelineno-0-933" name="__codelineno-0-933"></a>        <span class="n">date_cols</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-934"><a id="__codelineno-0-934" name="__codelineno-0-934"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="s2">&quot;date&quot;</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span>
+</span><span id="__span-0-935"><a id="__codelineno-0-935" name="__codelineno-0-935"></a>        <span class="p">]</span><span class="o">.</span><span class="n">values</span>
+</span><span id="__span-0-936"><a id="__codelineno-0-936" name="__codelineno-0-936"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">date_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">date_cols</span><span class="p">]</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
+</span><span id="__span-0-937"><a id="__codelineno-0-937" name="__codelineno-0-937"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">x</span><span class="o">.</span><span class="n">timestamp</span><span class="p">()</span> <span class="o">*</span> <span class="mf">1000.0</span>
+</span><span id="__span-0-938"><a id="__codelineno-0-938" name="__codelineno-0-938"></a>        <span class="p">)</span>
+</span><span id="__span-0-939"><a id="__codelineno-0-939" name="__codelineno-0-939"></a>
+</span><span id="__span-0-940"><a id="__codelineno-0-940" name="__codelineno-0-940"></a>        <span class="c1"># Convert any time columns to milliseconds</span>
+</span><span id="__span-0-941"><a id="__codelineno-0-941" name="__codelineno-0-941"></a>        <span class="n">time_cols</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-942"><a id="__codelineno-0-942" name="__codelineno-0-942"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="s2">&quot;time&quot;</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span>
+</span><span id="__span-0-943"><a id="__codelineno-0-943" name="__codelineno-0-943"></a>        <span class="p">]</span><span class="o">.</span><span class="n">values</span>
+</span><span id="__span-0-944"><a id="__codelineno-0-944" name="__codelineno-0-944"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">time_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">time_cols</span><span class="p">]</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
+</span><span id="__span-0-945"><a id="__codelineno-0-945" name="__codelineno-0-945"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">x</span><span class="o">.</span><span class="n">total_seconds</span><span class="p">()</span> <span class="o">*</span> <span class="mf">1000.0</span>
+</span><span id="__span-0-946"><a id="__codelineno-0-946" name="__codelineno-0-946"></a>        <span class="p">)</span>
+</span><span id="__span-0-947"><a id="__codelineno-0-947" name="__codelineno-0-947"></a>
+</span><span id="__span-0-948"><a id="__codelineno-0-948" name="__codelineno-0-948"></a>        <span class="c1"># Write out prepared log and variables</span>
+</span><span id="__span-0-949"><a id="__codelineno-0-949" name="__codelineno-0-949"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_skip_writeout</span><span class="p">:</span>
+</span><span id="__span-0-950"><a id="__codelineno-0-950" name="__codelineno-0-950"></a>            <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span>
+</span><span id="__span-0-951"><a id="__codelineno-0-951" name="__codelineno-0-951"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">))</span>
+</span><span id="__span-0-952"><a id="__codelineno-0-952" name="__codelineno-0-952"></a>            <span class="p">)</span>
+</span><span id="__span-0-953"><a id="__codelineno-0-953" name="__codelineno-0-953"></a>            <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span>
+</span><span id="__span-0-954"><a id="__codelineno-0-954" name="__codelineno-0-954"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span>
+</span><span id="__span-0-955"><a id="__codelineno-0-955" name="__codelineno-0-955"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)),</span>
+</span><span id="__span-0-956"><a id="__codelineno-0-956" name="__codelineno-0-956"></a>            <span class="p">)</span>
 </span><span id="__span-0-957"><a id="__codelineno-0-957" name="__codelineno-0-957"></a>
-</span><span id="__span-0-958"><a id="__codelineno-0-958" name="__codelineno-0-958"></a>    <span class="k">def</span> <span class="nf">_generate_prepared_variables_df</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-959"><a id="__codelineno-0-959" name="__codelineno-0-959"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-960"><a id="__codelineno-0-960" name="__codelineno-0-960"></a><span class="sd">        Generate dataframe of prepared variables for later tagging etc.</span>
-</span><span id="__span-0-961"><a id="__codelineno-0-961" name="__codelineno-0-961"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-962"><a id="__codelineno-0-962" name="__codelineno-0-962"></a>
-</span><span id="__span-0-963"><a id="__codelineno-0-963" name="__codelineno-0-963"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">()</span>
-</span><span id="__span-0-964"><a id="__codelineno-0-964" name="__codelineno-0-964"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span>
-</span><span id="__span-0-965"><a id="__codelineno-0-965" name="__codelineno-0-965"></a>
-</span><span id="__span-0-966"><a id="__codelineno-0-966" name="__codelineno-0-966"></a>        <span class="c1"># Bring in varable name components leveraging PreparedVariableName</span>
-</span><span id="__span-0-967"><a id="__codelineno-0-967" name="__codelineno-0-967"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Base&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
-</span><span id="__span-0-968"><a id="__codelineno-0-968" name="__codelineno-0-968"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">x</span><span class="p">)</span><span class="o">.</span><span class="n">base_var</span><span class="p">()</span>
-</span><span id="__span-0-969"><a id="__codelineno-0-969" name="__codelineno-0-969"></a>        <span class="p">)</span>
-</span><span id="__span-0-970"><a id="__codelineno-0-970" name="__codelineno-0-970"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Pre-agg Value&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span>
-</span><span id="__span-0-971"><a id="__codelineno-0-971" name="__codelineno-0-971"></a>            <span class="s2">&quot;Name&quot;</span>
-</span><span id="__span-0-972"><a id="__codelineno-0-972" name="__codelineno-0-972"></a>        <span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span><span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">x</span><span class="p">)</span><span class="o">.</span><span class="n">pre_agg_value</span><span class="p">())</span>
-</span><span id="__span-0-973"><a id="__codelineno-0-973" name="__codelineno-0-973"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Agg&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
-</span><span id="__span-0-974"><a id="__codelineno-0-974" name="__codelineno-0-974"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">x</span><span class="p">)</span><span class="o">.</span><span class="n">aggregate</span><span class="p">()</span>
-</span><span id="__span-0-975"><a id="__codelineno-0-975" name="__codelineno-0-975"></a>        <span class="p">)</span>
-</span><span id="__span-0-976"><a id="__codelineno-0-976" name="__codelineno-0-976"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Post-agg Value&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span>
-</span><span id="__span-0-977"><a id="__codelineno-0-977" name="__codelineno-0-977"></a>            <span class="s2">&quot;Name&quot;</span>
-</span><span id="__span-0-978"><a id="__codelineno-0-978" name="__codelineno-0-978"></a>        <span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span><span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">x</span><span class="p">)</span><span class="o">.</span><span class="n">post_agg_value</span><span class="p">())</span>
-</span><span id="__span-0-979"><a id="__codelineno-0-979" name="__codelineno-0-979"></a>
-</span><span id="__span-0-980"><a id="__codelineno-0-980" name="__codelineno-0-980"></a>        <span class="c1"># Bring in other info from self._parsed_variables</span>
-</span><span id="__span-0-981"><a id="__codelineno-0-981" name="__codelineno-0-981"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
-</span><span id="__span-0-982"><a id="__codelineno-0-982" name="__codelineno-0-982"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="__span-0-983"><a id="__codelineno-0-983" name="__codelineno-0-983"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-984"><a id="__codelineno-0-984" name="__codelineno-0-984"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Base&quot;</span><span class="p">],</span>
-</span><span id="__span-0-985"><a id="__codelineno-0-985" name="__codelineno-0-985"></a>                    <span class="s2">&quot;Tag&quot;</span><span class="p">,</span>
-</span><span id="__span-0-986"><a id="__codelineno-0-986" name="__codelineno-0-986"></a>                <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-987"><a id="__codelineno-0-987" name="__codelineno-0-987"></a>                <span class="k">if</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Base&quot;</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;TemplateId&quot;</span>
-</span><span id="__span-0-988"><a id="__codelineno-0-988" name="__codelineno-0-988"></a>                <span class="k">else</span> <span class="s2">&quot;TemplateId&quot;</span>
-</span><span id="__span-0-989"><a id="__codelineno-0-989" name="__codelineno-0-989"></a>            <span class="p">)</span>
-</span><span id="__span-0-990"><a id="__codelineno-0-990" name="__codelineno-0-990"></a>            <span class="o">+</span> <span class="p">(</span><span class="sa">f</span><span class="s2">&quot; </span><span class="si">{</span><span class="n">x</span><span class="p">[</span><span class="s1">&#39;Pre-agg Value&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span> <span class="k">if</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Pre-agg Value&quot;</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;&quot;</span> <span class="k">else</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
-</span><span id="__span-0-991"><a id="__codelineno-0-991" name="__codelineno-0-991"></a>            <span class="o">+</span> <span class="p">(</span><span class="sa">f</span><span class="s2">&quot; </span><span class="si">{</span><span class="n">x</span><span class="p">[</span><span class="s1">&#39;Agg&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span> <span class="k">if</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Agg&quot;</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;&quot;</span> <span class="k">else</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
-</span><span id="__span-0-992"><a id="__codelineno-0-992" name="__codelineno-0-992"></a>            <span class="o">+</span> <span class="p">(</span><span class="sa">f</span><span class="s2">&quot; </span><span class="si">{</span><span class="n">x</span><span class="p">[</span><span class="s1">&#39;Post-agg Value&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span> <span class="k">if</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Post-agg Value&quot;</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;&quot;</span> <span class="k">else</span> <span class="s2">&quot;&quot;</span><span class="p">),</span>
-</span><span id="__span-0-993"><a id="__codelineno-0-993" name="__codelineno-0-993"></a>            <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-</span><span id="__span-0-994"><a id="__codelineno-0-994" name="__codelineno-0-994"></a>        <span class="p">)</span>
-</span><span id="__span-0-995"><a id="__codelineno-0-995" name="__codelineno-0-995"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Base Variable Occurences&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span>
-</span><span id="__span-0-996"><a id="__codelineno-0-996" name="__codelineno-0-996"></a>            <span class="s2">&quot;Base&quot;</span>
-</span><span id="__span-0-997"><a id="__codelineno-0-997" name="__codelineno-0-997"></a>        <span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
-</span><span id="__span-0-998"><a id="__codelineno-0-998" name="__codelineno-0-998"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="__span-0-999"><a id="__codelineno-0-999" name="__codelineno-0-999"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-1000"><a id="__codelineno-0-1000" name="__codelineno-0-1000"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">x</span><span class="p">,</span> <span class="s2">&quot;Occurrences&quot;</span>
-</span><span id="__span-0-1001"><a id="__codelineno-0-1001" name="__codelineno-0-1001"></a>                <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-1002"><a id="__codelineno-0-1002" name="__codelineno-0-1002"></a>                <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="s2">&quot;TemplateId&quot;</span>
-</span><span id="__span-0-1003"><a id="__codelineno-0-1003" name="__codelineno-0-1003"></a>                <span class="k">else</span> <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-1004"><a id="__codelineno-0-1004" name="__codelineno-0-1004"></a>            <span class="p">)</span>
-</span><span id="__span-0-1005"><a id="__codelineno-0-1005" name="__codelineno-0-1005"></a>        <span class="p">)</span>
-</span><span id="__span-0-1006"><a id="__codelineno-0-1006" name="__codelineno-0-1006"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Base&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
-</span><span id="__span-0-1007"><a id="__codelineno-0-1007" name="__codelineno-0-1007"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="__span-0-1008"><a id="__codelineno-0-1008" name="__codelineno-0-1008"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-1009"><a id="__codelineno-0-1009" name="__codelineno-0-1009"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">x</span><span class="p">,</span> <span class="s2">&quot;Type&quot;</span>
-</span><span id="__span-0-1010"><a id="__codelineno-0-1010" name="__codelineno-0-1010"></a>                <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-1011"><a id="__codelineno-0-1011" name="__codelineno-0-1011"></a>                <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="s2">&quot;TemplateId&quot;</span>
-</span><span id="__span-0-1012"><a id="__codelineno-0-1012" name="__codelineno-0-1012"></a>                <span class="k">else</span> <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-1013"><a id="__codelineno-0-1013" name="__codelineno-0-1013"></a>            <span class="p">)</span>
-</span><span id="__span-0-1014"><a id="__codelineno-0-1014" name="__codelineno-0-1014"></a>        <span class="p">)</span>
-</span><span id="__span-0-1015"><a id="__codelineno-0-1015" name="__codelineno-0-1015"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Examples&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Base&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
-</span><span id="__span-0-1016"><a id="__codelineno-0-1016" name="__codelineno-0-1016"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="__span-0-1017"><a id="__codelineno-0-1017" name="__codelineno-0-1017"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-1018"><a id="__codelineno-0-1018" name="__codelineno-0-1018"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">x</span><span class="p">,</span> <span class="s2">&quot;Examples&quot;</span>
-</span><span id="__span-0-1019"><a id="__codelineno-0-1019" name="__codelineno-0-1019"></a>                <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-1020"><a id="__codelineno-0-1020" name="__codelineno-0-1020"></a>                <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="s2">&quot;TemplateId&quot;</span>
-</span><span id="__span-0-1021"><a id="__codelineno-0-1021" name="__codelineno-0-1021"></a>                <span class="k">else</span> <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-1022"><a id="__codelineno-0-1022" name="__codelineno-0-1022"></a>            <span class="p">)</span>
-</span><span id="__span-0-1023"><a id="__codelineno-0-1023" name="__codelineno-0-1023"></a>        <span class="p">)</span>
-</span><span id="__span-0-1024"><a id="__codelineno-0-1024" name="__codelineno-0-1024"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Base&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
-</span><span id="__span-0-1025"><a id="__codelineno-0-1025" name="__codelineno-0-1025"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="__span-0-1026"><a id="__codelineno-0-1026" name="__codelineno-0-1026"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-1027"><a id="__codelineno-0-1027" name="__codelineno-0-1027"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">x</span><span class="p">,</span> <span class="s2">&quot;From regex&quot;</span>
-</span><span id="__span-0-1028"><a id="__codelineno-0-1028" name="__codelineno-0-1028"></a>                <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-1029"><a id="__codelineno-0-1029" name="__codelineno-0-1029"></a>                <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="s2">&quot;TemplateId&quot;</span>
-</span><span id="__span-0-1030"><a id="__codelineno-0-1030" name="__codelineno-0-1030"></a>                <span class="k">else</span> <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-1031"><a id="__codelineno-0-1031" name="__codelineno-0-1031"></a>            <span class="p">)</span>
-</span><span id="__span-0-1032"><a id="__codelineno-0-1032" name="__codelineno-0-1032"></a>        <span class="p">)</span>
-</span><span id="__span-0-1033"><a id="__codelineno-0-1033" name="__codelineno-0-1033"></a>
-</span><span id="__span-0-1034"><a id="__codelineno-0-1034" name="__codelineno-0-1034"></a>        <span class="c1"># Bring in template text, only for appropriate base variables.</span>
-</span><span id="__span-0-1035"><a id="__codelineno-0-1035" name="__codelineno-0-1035"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
-</span><span id="__span-0-1036"><a id="__codelineno-0-1036" name="__codelineno-0-1036"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="__span-0-1037"><a id="__codelineno-0-1037" name="__codelineno-0-1037"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-1038"><a id="__codelineno-0-1038" name="__codelineno-0-1038"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span>
-</span><span id="__span-0-1039"><a id="__codelineno-0-1039" name="__codelineno-0-1039"></a>                    <span class="o">==</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">x</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">])</span><span class="o">.</span><span class="n">template_id</span><span class="p">(),</span>
-</span><span id="__span-0-1040"><a id="__codelineno-0-1040" name="__codelineno-0-1040"></a>                    <span class="s2">&quot;TemplateText&quot;</span><span class="p">,</span>
-</span><span id="__span-0-1041"><a id="__codelineno-0-1041" name="__codelineno-0-1041"></a>                <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-1042"><a id="__codelineno-0-1042" name="__codelineno-0-1042"></a>                <span class="k">if</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="kc">False</span>
-</span><span id="__span-0-1043"><a id="__codelineno-0-1043" name="__codelineno-0-1043"></a>                <span class="k">else</span> <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-1044"><a id="__codelineno-0-1044" name="__codelineno-0-1044"></a>            <span class="p">),</span>
-</span><span id="__span-0-1045"><a id="__codelineno-0-1045" name="__codelineno-0-1045"></a>            <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-</span><span id="__span-0-1046"><a id="__codelineno-0-1046" name="__codelineno-0-1046"></a>        <span class="p">)</span>
-</span><span id="__span-0-1047"><a id="__codelineno-0-1047" name="__codelineno-0-1047"></a>
-</span><span id="__span-0-1048"><a id="__codelineno-0-1048" name="__codelineno-0-1048"></a>    <span class="k">def</span> <span class="nf">inspect</span><span class="p">(</span>
-</span><span id="__span-0-1049"><a id="__codelineno-0-1049" name="__codelineno-0-1049"></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-1050"><a id="__codelineno-0-1050" name="__codelineno-0-1050"></a>        <span class="n">var</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="__span-0-1051"><a id="__codelineno-0-1051" name="__codelineno-0-1051"></a>        <span class="n">ref_var</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-1052"><a id="__codelineno-0-1052" name="__codelineno-0-1052"></a>        <span class="n">row_limit</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">=</span> <span class="mi">10</span><span class="p">,</span>
-</span><span id="__span-0-1053"><a id="__codelineno-0-1053" name="__codelineno-0-1053"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">]:</span>
-</span><span id="__span-0-1054"><a id="__codelineno-0-1054" name="__codelineno-0-1054"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1055"><a id="__codelineno-0-1055" name="__codelineno-0-1055"></a><span class="sd">        Print information about a specific prepared variable.</span>
-</span><span id="__span-0-1056"><a id="__codelineno-0-1056" name="__codelineno-0-1056"></a>
-</span><span id="__span-0-1057"><a id="__codelineno-0-1057" name="__codelineno-0-1057"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-1058"><a id="__codelineno-0-1058" name="__codelineno-0-1058"></a><span class="sd">            var: The name or tag of the variable.</span>
-</span><span id="__span-0-1059"><a id="__codelineno-0-1059" name="__codelineno-0-1059"></a><span class="sd">            ref_var: The name or tag of a reference variable.</span>
-</span><span id="__span-0-1060"><a id="__codelineno-0-1060" name="__codelineno-0-1060"></a><span class="sd">            row_limit: The number of rows of the prepared log to print out,</span>
-</span><span id="__span-0-1061"><a id="__codelineno-0-1061" name="__codelineno-0-1061"></a><span class="sd">                to illustrate example values of this variable.</span>
-</span><span id="__span-0-1062"><a id="__codelineno-0-1062" name="__codelineno-0-1062"></a>
-</span><span id="__span-0-1063"><a id="__codelineno-0-1063" name="__codelineno-0-1063"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-1064"><a id="__codelineno-0-1064" name="__codelineno-0-1064"></a><span class="sd">            A tuple containing:</span>
-</span><span id="__span-0-1065"><a id="__codelineno-0-1065" name="__codelineno-0-1065"></a><span class="sd">                (1) Information about the base variable of `var`, if `var` is not related to the</span>
-</span><span id="__span-0-1066"><a id="__codelineno-0-1066" name="__codelineno-0-1066"></a><span class="sd">                    occurrence count of a template.</span>
-</span><span id="__span-0-1067"><a id="__codelineno-0-1067" name="__codelineno-0-1067"></a><span class="sd">                (2) Information about the template of `var`, if `var` was not created from a regex.</span>
-</span><span id="__span-0-1068"><a id="__codelineno-0-1068" name="__codelineno-0-1068"></a><span class="sd">                (3) A sample of the prepared log, with `row_limit` rows.</span>
-</span><span id="__span-0-1069"><a id="__codelineno-0-1069" name="__codelineno-0-1069"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1070"><a id="__codelineno-0-1070" name="__codelineno-0-1070"></a>
-</span><span id="__span-0-1071"><a id="__codelineno-0-1071" name="__codelineno-0-1071"></a>        <span class="c1"># Retrieve the name of this variable, if a tag was passed in.</span>
-</span><span id="__span-0-1072"><a id="__codelineno-0-1072" name="__codelineno-0-1072"></a>        <span class="n">name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">var</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1073"><a id="__codelineno-0-1073" name="__codelineno-0-1073"></a>
-</span><span id="__span-0-1074"><a id="__codelineno-0-1074" name="__codelineno-0-1074"></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Information about prepared variable </span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2">:</span><span class="se">\n</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1075"><a id="__codelineno-0-1075" name="__codelineno-0-1075"></a>        <span class="n">base_var</span> <span class="o">=</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">name</span><span class="p">)</span><span class="o">.</span><span class="n">base_var</span><span class="p">()</span>
-</span><span id="__span-0-1076"><a id="__codelineno-0-1076" name="__codelineno-0-1076"></a>        <span class="n">from_regex</span> <span class="o">=</span> <span class="kc">False</span>
-</span><span id="__span-0-1077"><a id="__codelineno-0-1077" name="__codelineno-0-1077"></a>
-</span><span id="__span-0-1078"><a id="__codelineno-0-1078" name="__codelineno-0-1078"></a>        <span class="n">base_var_info_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">()</span>
-</span><span id="__span-0-1079"><a id="__codelineno-0-1079" name="__codelineno-0-1079"></a>        <span class="k">if</span> <span class="n">base_var</span> <span class="o">!=</span> <span class="s2">&quot;TemplateId&quot;</span><span class="p">:</span>
-</span><span id="__span-0-1080"><a id="__codelineno-0-1080" name="__codelineno-0-1080"></a>            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;--&gt; Variable Information about </span><span class="si">{</span><span class="n">base_var</span><span class="si">}</span><span class="s2">:&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1081"><a id="__codelineno-0-1081" name="__codelineno-0-1081"></a>            <span class="n">base_var_info_df</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span>
-</span><span id="__span-0-1082"><a id="__codelineno-0-1082" name="__codelineno-0-1082"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">base_var</span>
-</span><span id="__span-0-1083"><a id="__codelineno-0-1083" name="__codelineno-0-1083"></a>            <span class="p">]</span>
-</span><span id="__span-0-1084"><a id="__codelineno-0-1084" name="__codelineno-0-1084"></a>            <span class="n">from_regex</span> <span class="o">=</span> <span class="n">base_var_info_df</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-1085"><a id="__codelineno-0-1085" name="__codelineno-0-1085"></a>            <span class="n">display</span><span class="p">(</span><span class="n">base_var_info_df</span><span class="p">)</span>
-</span><span id="__span-0-1086"><a id="__codelineno-0-1086" name="__codelineno-0-1086"></a>
-</span><span id="__span-0-1087"><a id="__codelineno-0-1087" name="__codelineno-0-1087"></a>        <span class="n">template_info_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">()</span>
-</span><span id="__span-0-1088"><a id="__codelineno-0-1088" name="__codelineno-0-1088"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">from_regex</span><span class="p">:</span>
-</span><span id="__span-0-1089"><a id="__codelineno-0-1089" name="__codelineno-0-1089"></a>            <span class="n">template_id</span> <span class="o">=</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">name</span><span class="p">)</span><span class="o">.</span><span class="n">template_id</span><span class="p">()</span>
-</span><span id="__span-0-1090"><a id="__codelineno-0-1090" name="__codelineno-0-1090"></a>            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;--&gt; Template Information about </span><span class="si">{</span><span class="n">template_id</span><span class="si">}</span><span class="s2">:&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1091"><a id="__codelineno-0-1091" name="__codelineno-0-1091"></a>            <span class="n">template_info_df</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span>
-</span><span id="__span-0-1092"><a id="__codelineno-0-1092" name="__codelineno-0-1092"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">template_id</span>
-</span><span id="__span-0-1093"><a id="__codelineno-0-1093" name="__codelineno-0-1093"></a>            <span class="p">]</span>
-</span><span id="__span-0-1094"><a id="__codelineno-0-1094" name="__codelineno-0-1094"></a>            <span class="n">display</span><span class="p">(</span><span class="n">template_info_df</span><span class="p">)</span>
-</span><span id="__span-0-1095"><a id="__codelineno-0-1095" name="__codelineno-0-1095"></a>
-</span><span id="__span-0-1096"><a id="__codelineno-0-1096" name="__codelineno-0-1096"></a>        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;--&gt; Causal Unit Partial Information:&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1097"><a id="__codelineno-0-1097" name="__codelineno-0-1097"></a>        <span class="k">if</span> <span class="n">row_limit</span> <span class="o">==</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-1098"><a id="__codelineno-0-1098" name="__codelineno-0-1098"></a>            <span class="n">row_limit</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">)</span>
-</span><span id="__span-0-1099"><a id="__codelineno-0-1099" name="__codelineno-0-1099"></a>        <span class="n">col_list</span> <span class="o">=</span> <span class="p">[</span><span class="n">name</span><span class="p">]</span>
-</span><span id="__span-0-1100"><a id="__codelineno-0-1100" name="__codelineno-0-1100"></a>        <span class="n">col_list</span><span class="o">.</span><span class="n">extend</span><span class="p">([</span><span class="n">ref_var</span><span class="p">]</span> <span class="k">if</span> <span class="n">ref_var</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="k">else</span> <span class="p">[])</span>
-</span><span id="__span-0-1101"><a id="__codelineno-0-1101" name="__codelineno-0-1101"></a>        <span class="n">prepared_log_info_df</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">col_list</span><span class="p">]</span><span class="o">.</span><span class="n">head</span><span class="p">(</span><span class="n">row_limit</span><span class="p">)</span>
-</span><span id="__span-0-1102"><a id="__codelineno-0-1102" name="__codelineno-0-1102"></a>        <span class="n">col_names</span> <span class="o">=</span> <span class="p">[</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> (candidate)&quot;</span><span class="p">]</span>
-</span><span id="__span-0-1103"><a id="__codelineno-0-1103" name="__codelineno-0-1103"></a>        <span class="n">col_names</span><span class="o">.</span><span class="n">extend</span><span class="p">([</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">ref_var</span><span class="si">}</span><span class="s2"> (outcome)&quot;</span><span class="p">]</span> <span class="k">if</span> <span class="n">ref_var</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="k">else</span> <span class="p">[])</span>
-</span><span id="__span-0-1104"><a id="__codelineno-0-1104" name="__codelineno-0-1104"></a>        <span class="n">prepared_log_info_df</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="n">col_names</span>
-</span><span id="__span-0-1105"><a id="__codelineno-0-1105" name="__codelineno-0-1105"></a>        <span class="n">display</span><span class="p">(</span><span class="n">prepared_log_info_df</span><span class="p">)</span>
-</span><span id="__span-0-1106"><a id="__codelineno-0-1106" name="__codelineno-0-1106"></a>
-</span><span id="__span-0-1107"><a id="__codelineno-0-1107" name="__codelineno-0-1107"></a>        <span class="k">return</span> <span class="n">base_var_info_df</span><span class="p">,</span> <span class="n">template_info_df</span><span class="p">,</span> <span class="n">prepared_log_info_df</span>
-</span><span id="__span-0-1108"><a id="__codelineno-0-1108" name="__codelineno-0-1108"></a>
-</span><span id="__span-0-1109"><a id="__codelineno-0-1109" name="__codelineno-0-1109"></a>    <span class="k">def</span> <span class="nf">clear_graph</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">clear_edge_states</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-1110"><a id="__codelineno-0-1110" name="__codelineno-0-1110"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1111"><a id="__codelineno-0-1111" name="__codelineno-0-1111"></a><span class="sd">        Clear the graph and possibly edge states.</span>
-</span><span id="__span-0-1112"><a id="__codelineno-0-1112" name="__codelineno-0-1112"></a>
-</span><span id="__span-0-1113"><a id="__codelineno-0-1113" name="__codelineno-0-1113"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-1114"><a id="__codelineno-0-1114" name="__codelineno-0-1114"></a><span class="sd">            clear_edge_states: Whether to also clear the edge states.</span>
-</span><span id="__span-0-1115"><a id="__codelineno-0-1115" name="__codelineno-0-1115"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1116"><a id="__codelineno-0-1116" name="__codelineno-0-1116"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span> <span class="o">=</span> <span class="n">nx</span><span class="o">.</span><span class="n">DiGraph</span><span class="p">()</span>
-</span><span id="__span-0-1117"><a id="__codelineno-0-1117" name="__codelineno-0-1117"></a>        <span class="k">if</span> <span class="n">clear_edge_states</span><span class="p">:</span>
-</span><span id="__span-0-1118"><a id="__codelineno-0-1118" name="__codelineno-0-1118"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span> <span class="o">=</span> <span class="n">EdgeStateMatrix</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">prepared_variable_names</span><span class="p">)</span>
-</span><span id="__span-0-1119"><a id="__codelineno-0-1119" name="__codelineno-0-1119"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="p">:</span>
-</span><span id="__span-0-1120"><a id="__codelineno-0-1120" name="__codelineno-0-1120"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">clear_graph</span><span class="p">(</span><span class="n">clear_edge_states</span><span class="p">)</span>
-</span><span id="__span-0-1121"><a id="__codelineno-0-1121" name="__codelineno-0-1121"></a>
-</span><span id="__span-0-1122"><a id="__codelineno-0-1122" name="__codelineno-0-1122"></a>    <span class="k">def</span> <span class="nf">display_graph</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-1123"><a id="__codelineno-0-1123" name="__codelineno-0-1123"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1124"><a id="__codelineno-0-1124" name="__codelineno-0-1124"></a><span class="sd">        Display the current graph.</span>
-</span><span id="__span-0-1125"><a id="__codelineno-0-1125" name="__codelineno-0-1125"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1126"><a id="__codelineno-0-1126" name="__codelineno-0-1126"></a>        <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">display_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
-</span><span id="__span-0-1127"><a id="__codelineno-0-1127" name="__codelineno-0-1127"></a>
-</span><span id="__span-0-1128"><a id="__codelineno-0-1128" name="__codelineno-0-1128"></a>    <span class="k">def</span> <span class="nf">save_graph</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filename</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-1129"><a id="__codelineno-0-1129" name="__codelineno-0-1129"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1130"><a id="__codelineno-0-1130" name="__codelineno-0-1130"></a><span class="sd">        Save the current graph to a file.</span>
-</span><span id="__span-0-1131"><a id="__codelineno-0-1131" name="__codelineno-0-1131"></a>
-</span><span id="__span-0-1132"><a id="__codelineno-0-1132" name="__codelineno-0-1132"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-1133"><a id="__codelineno-0-1133" name="__codelineno-0-1133"></a><span class="sd">            filename: The name of the file to save to.</span>
-</span><span id="__span-0-1134"><a id="__codelineno-0-1134" name="__codelineno-0-1134"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1135"><a id="__codelineno-0-1135" name="__codelineno-0-1135"></a>        <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">save_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">filename</span><span class="p">)</span>
-</span><span id="__span-0-1136"><a id="__codelineno-0-1136" name="__codelineno-0-1136"></a>
-</span><span id="__span-0-1137"><a id="__codelineno-0-1137" name="__codelineno-0-1137"></a>    <span class="k">def</span> <span class="nf">accept</span><span class="p">(</span>
-</span><span id="__span-0-1138"><a id="__codelineno-0-1138" name="__codelineno-0-1138"></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-1139"><a id="__codelineno-0-1139" name="__codelineno-0-1139"></a>        <span class="n">src</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="__span-0-1140"><a id="__codelineno-0-1140" name="__codelineno-0-1140"></a>        <span class="n">dst</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="__span-0-1141"><a id="__codelineno-0-1141" name="__codelineno-0-1141"></a>        <span class="n">also_fix</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
-</span><span id="__span-0-1142"><a id="__codelineno-0-1142" name="__codelineno-0-1142"></a>        <span class="n">interactive</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="__span-0-1143"><a id="__codelineno-0-1143" name="__codelineno-0-1143"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
-</span><span id="__span-0-1144"><a id="__codelineno-0-1144" name="__codelineno-0-1144"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1145"><a id="__codelineno-0-1145" name="__codelineno-0-1145"></a><span class="sd">        Mark a causal graph edge as accepted.</span>
-</span><span id="__span-0-1146"><a id="__codelineno-0-1146" name="__codelineno-0-1146"></a>
-</span><span id="__span-0-1147"><a id="__codelineno-0-1147" name="__codelineno-0-1147"></a><span class="sd">        This will also reject the edge from `dst` to `src` and remove any other variables with the</span>
-</span><span id="__span-0-1148"><a id="__codelineno-0-1148" name="__codelineno-0-1148"></a><span class="sd">        same base variable as either `src` or `dst` from consideration for the partial causal graph.</span>
-</span><span id="__span-0-1149"><a id="__codelineno-0-1149" name="__codelineno-0-1149"></a>
-</span><span id="__span-0-1150"><a id="__codelineno-0-1150" name="__codelineno-0-1150"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-1151"><a id="__codelineno-0-1151" name="__codelineno-0-1151"></a><span class="sd">            src: The name or tag of the source variable.</span>
-</span><span id="__span-0-1152"><a id="__codelineno-0-1152" name="__codelineno-0-1152"></a><span class="sd">            dst: The name or tag of the destination variable.</span>
-</span><span id="__span-0-1153"><a id="__codelineno-0-1153" name="__codelineno-0-1153"></a><span class="sd">            also_fix: Whether to also fix the edge, for ECCS.</span>
-</span><span id="__span-0-1154"><a id="__codelineno-0-1154" name="__codelineno-0-1154"></a><span class="sd">            interactive: Whether to display the graph interactively after accepting the edge.</span>
-</span><span id="__span-0-1155"><a id="__codelineno-0-1155" name="__codelineno-0-1155"></a>
-</span><span id="__span-0-1156"><a id="__codelineno-0-1156" name="__codelineno-0-1156"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-1157"><a id="__codelineno-0-1157" name="__codelineno-0-1157"></a><span class="sd">            A tuple containing:</span>
-</span><span id="__span-0-1158"><a id="__codelineno-0-1158" name="__codelineno-0-1158"></a><span class="sd">                (1) the exploration score after the edge addition,</span>
-</span><span id="__span-0-1159"><a id="__codelineno-0-1159" name="__codelineno-0-1159"></a><span class="sd">                (2) the max-impact variable to explore next, if any,</span>
-</span><span id="__span-0-1160"><a id="__codelineno-0-1160" name="__codelineno-0-1160"></a><span class="sd">                (3) optionally a string representation of the graph, if `interactive` is False.</span>
-</span><span id="__span-0-1161"><a id="__codelineno-0-1161" name="__codelineno-0-1161"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1162"><a id="__codelineno-0-1162" name="__codelineno-0-1162"></a>
-</span><span id="__span-0-1163"><a id="__codelineno-0-1163" name="__codelineno-0-1163"></a>        <span class="n">src_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">src</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1164"><a id="__codelineno-0-1164" name="__codelineno-0-1164"></a>        <span class="n">dst_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">dst</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1165"><a id="__codelineno-0-1165" name="__codelineno-0-1165"></a>        <span class="n">to_drop</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">mark_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">,</span> <span class="s2">&quot;Accepted&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1166"><a id="__codelineno-0-1166" name="__codelineno-0-1166"></a>        <span class="k">for</span> <span class="n">node</span> <span class="ow">in</span> <span class="n">to_drop</span><span class="p">:</span>
-</span><span id="__span-0-1167"><a id="__codelineno-0-1167" name="__codelineno-0-1167"></a>            <span class="k">if</span> <span class="n">node</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">nodes</span><span class="p">:</span>
-</span><span id="__span-0-1168"><a id="__codelineno-0-1168" name="__codelineno-0-1168"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">remove_node</span><span class="p">(</span><span class="n">node</span><span class="p">)</span>
-</span><span id="__span-0-1169"><a id="__codelineno-0-1169" name="__codelineno-0-1169"></a>
-</span><span id="__span-0-1170"><a id="__codelineno-0-1170" name="__codelineno-0-1170"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">add_node</span><span class="p">(</span><span class="n">src_name</span><span class="p">)</span>
-</span><span id="__span-0-1171"><a id="__codelineno-0-1171" name="__codelineno-0-1171"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">add_node</span><span class="p">(</span><span class="n">dst_name</span><span class="p">)</span>
-</span><span id="__span-0-1172"><a id="__codelineno-0-1172" name="__codelineno-0-1172"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">add_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">)</span>
-</span><span id="__span-0-1173"><a id="__codelineno-0-1173" name="__codelineno-0-1173"></a>        <span class="k">if</span> <span class="p">(</span><span class="n">dst_name</span><span class="p">,</span> <span class="n">src_name</span><span class="p">)</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">edges</span><span class="p">:</span>
-</span><span id="__span-0-1174"><a id="__codelineno-0-1174" name="__codelineno-0-1174"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">remove_edge</span><span class="p">(</span><span class="n">dst_name</span><span class="p">,</span> <span class="n">src_name</span><span class="p">)</span>
-</span><span id="__span-0-1175"><a id="__codelineno-0-1175" name="__codelineno-0-1175"></a>        <span class="k">if</span> <span class="n">interactive</span><span class="p">:</span>
-</span><span id="__span-0-1176"><a id="__codelineno-0-1176" name="__codelineno-0-1176"></a>            <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">display_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
-</span><span id="__span-0-1177"><a id="__codelineno-0-1177" name="__codelineno-0-1177"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="p">:</span>
-</span><span id="__span-0-1178"><a id="__codelineno-0-1178" name="__codelineno-0-1178"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">remove_edge</span><span class="p">(</span><span class="n">dst_name</span><span class="p">,</span> <span class="n">src_name</span><span class="p">)</span>
-</span><span id="__span-0-1179"><a id="__codelineno-0-1179" name="__codelineno-0-1179"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">add_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">)</span>
-</span><span id="__span-0-1180"><a id="__codelineno-0-1180" name="__codelineno-0-1180"></a>            <span class="k">if</span> <span class="n">also_fix</span><span class="p">:</span>
-</span><span id="__span-0-1181"><a id="__codelineno-0-1181" name="__codelineno-0-1181"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">fix_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">)</span>
-</span><span id="__span-0-1182"><a id="__codelineno-0-1182" name="__codelineno-0-1182"></a>
-</span><span id="__span-0-1183"><a id="__codelineno-0-1183" name="__codelineno-0-1183"></a>        <span class="k">return</span> <span class="p">(</span>
-</span><span id="__span-0-1184"><a id="__codelineno-0-1184" name="__codelineno-0-1184"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">exploration_score</span><span class="p">,</span>
-</span><span id="__span-0-1185"><a id="__codelineno-0-1185" name="__codelineno-0-1185"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">suggest_next_exploration</span><span class="p">(),</span>
-</span><span id="__span-0-1186"><a id="__codelineno-0-1186" name="__codelineno-0-1186"></a>            <span class="p">(</span>
-</span><span id="__span-0-1187"><a id="__codelineno-0-1187" name="__codelineno-0-1187"></a>                <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">draw_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
-</span><span id="__span-0-1188"><a id="__codelineno-0-1188" name="__codelineno-0-1188"></a>                <span class="k">if</span> <span class="ow">not</span> <span class="n">interactive</span>
-</span><span id="__span-0-1189"><a id="__codelineno-0-1189" name="__codelineno-0-1189"></a>                <span class="k">else</span> <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-1190"><a id="__codelineno-0-1190" name="__codelineno-0-1190"></a>            <span class="p">),</span>
-</span><span id="__span-0-1191"><a id="__codelineno-0-1191" name="__codelineno-0-1191"></a>        <span class="p">)</span>
-</span><span id="__span-0-1192"><a id="__codelineno-0-1192" name="__codelineno-0-1192"></a>
-</span><span id="__span-0-1193"><a id="__codelineno-0-1193" name="__codelineno-0-1193"></a>    <span class="k">def</span> <span class="nf">reject</span><span class="p">(</span>
-</span><span id="__span-0-1194"><a id="__codelineno-0-1194" name="__codelineno-0-1194"></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-1195"><a id="__codelineno-0-1195" name="__codelineno-0-1195"></a>        <span class="n">src</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="__span-0-1196"><a id="__codelineno-0-1196" name="__codelineno-0-1196"></a>        <span class="n">dst</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="__span-0-1197"><a id="__codelineno-0-1197" name="__codelineno-0-1197"></a>        <span class="n">also_ban</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
-</span><span id="__span-0-1198"><a id="__codelineno-0-1198" name="__codelineno-0-1198"></a>        <span class="n">interactive</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="__span-0-1199"><a id="__codelineno-0-1199" name="__codelineno-0-1199"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
-</span><span id="__span-0-1200"><a id="__codelineno-0-1200" name="__codelineno-0-1200"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1201"><a id="__codelineno-0-1201" name="__codelineno-0-1201"></a><span class="sd">        Mark a causal graph edge as rejected.</span>
-</span><span id="__span-0-1202"><a id="__codelineno-0-1202" name="__codelineno-0-1202"></a>
-</span><span id="__span-0-1203"><a id="__codelineno-0-1203" name="__codelineno-0-1203"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-1204"><a id="__codelineno-0-1204" name="__codelineno-0-1204"></a><span class="sd">            src: The name or tag of the source variable.</span>
-</span><span id="__span-0-1205"><a id="__codelineno-0-1205" name="__codelineno-0-1205"></a><span class="sd">            dst: The name or tag of the destination variable.</span>
-</span><span id="__span-0-1206"><a id="__codelineno-0-1206" name="__codelineno-0-1206"></a><span class="sd">            also_ban: Whether to also ban the edge, for ECCS.</span>
-</span><span id="__span-0-1207"><a id="__codelineno-0-1207" name="__codelineno-0-1207"></a><span class="sd">            interactive: Whether to display the graph interactively after rejecting the edge.</span>
-</span><span id="__span-0-1208"><a id="__codelineno-0-1208" name="__codelineno-0-1208"></a>
-</span><span id="__span-0-1209"><a id="__codelineno-0-1209" name="__codelineno-0-1209"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-1210"><a id="__codelineno-0-1210" name="__codelineno-0-1210"></a><span class="sd">            A tuple containing:</span>
-</span><span id="__span-0-1211"><a id="__codelineno-0-1211" name="__codelineno-0-1211"></a><span class="sd">                (1) the exploration score after the edge rejection,</span>
-</span><span id="__span-0-1212"><a id="__codelineno-0-1212" name="__codelineno-0-1212"></a><span class="sd">                (2) the max-impact variable to explore next, if any,</span>
-</span><span id="__span-0-1213"><a id="__codelineno-0-1213" name="__codelineno-0-1213"></a><span class="sd">                (3) optionally a string representation of the graph, if `interactive` is False.</span>
-</span><span id="__span-0-1214"><a id="__codelineno-0-1214" name="__codelineno-0-1214"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1215"><a id="__codelineno-0-1215" name="__codelineno-0-1215"></a>
-</span><span id="__span-0-1216"><a id="__codelineno-0-1216" name="__codelineno-0-1216"></a>        <span class="n">src_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">src</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1217"><a id="__codelineno-0-1217" name="__codelineno-0-1217"></a>        <span class="n">dst_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">dst</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1218"><a id="__codelineno-0-1218" name="__codelineno-0-1218"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">mark_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">,</span> <span class="s2">&quot;Rejected&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1219"><a id="__codelineno-0-1219" name="__codelineno-0-1219"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span> <span class="ow">and</span> <span class="n">also_ban</span><span class="p">:</span>
-</span><span id="__span-0-1220"><a id="__codelineno-0-1220" name="__codelineno-0-1220"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">ban_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">)</span>
-</span><span id="__span-0-1221"><a id="__codelineno-0-1221" name="__codelineno-0-1221"></a>
-</span><span id="__span-0-1222"><a id="__codelineno-0-1222" name="__codelineno-0-1222"></a>        <span class="k">if</span> <span class="n">interactive</span><span class="p">:</span>
-</span><span id="__span-0-1223"><a id="__codelineno-0-1223" name="__codelineno-0-1223"></a>            <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">display_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
-</span><span id="__span-0-1224"><a id="__codelineno-0-1224" name="__codelineno-0-1224"></a>
-</span><span id="__span-0-1225"><a id="__codelineno-0-1225" name="__codelineno-0-1225"></a>        <span class="k">return</span> <span class="p">(</span>
-</span><span id="__span-0-1226"><a id="__codelineno-0-1226" name="__codelineno-0-1226"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">exploration_score</span><span class="p">,</span>
-</span><span id="__span-0-1227"><a id="__codelineno-0-1227" name="__codelineno-0-1227"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">suggest_next_exploration</span><span class="p">(),</span>
-</span><span id="__span-0-1228"><a id="__codelineno-0-1228" name="__codelineno-0-1228"></a>            <span class="p">(</span>
-</span><span id="__span-0-1229"><a id="__codelineno-0-1229" name="__codelineno-0-1229"></a>                <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">draw_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
-</span><span id="__span-0-1230"><a id="__codelineno-0-1230" name="__codelineno-0-1230"></a>                <span class="k">if</span> <span class="ow">not</span> <span class="n">interactive</span>
-</span><span id="__span-0-1231"><a id="__codelineno-0-1231" name="__codelineno-0-1231"></a>                <span class="k">else</span> <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-1232"><a id="__codelineno-0-1232" name="__codelineno-0-1232"></a>            <span class="p">),</span>
-</span><span id="__span-0-1233"><a id="__codelineno-0-1233" name="__codelineno-0-1233"></a>        <span class="p">)</span>
-</span><span id="__span-0-1234"><a id="__codelineno-0-1234" name="__codelineno-0-1234"></a>
-</span><span id="__span-0-1235"><a id="__codelineno-0-1235" name="__codelineno-0-1235"></a>    <span class="k">def</span> <span class="nf">reject_undecided_incoming</span><span class="p">(</span>
-</span><span id="__span-0-1236"><a id="__codelineno-0-1236" name="__codelineno-0-1236"></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">dst</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">also_ban</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span> <span class="n">interactive</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span>
-</span><span id="__span-0-1237"><a id="__codelineno-0-1237" name="__codelineno-0-1237"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
-</span><span id="__span-0-1238"><a id="__codelineno-0-1238" name="__codelineno-0-1238"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1239"><a id="__codelineno-0-1239" name="__codelineno-0-1239"></a><span class="sd">        Mark all undecided incoming edges to a variable as rejected.</span>
-</span><span id="__span-0-1240"><a id="__codelineno-0-1240" name="__codelineno-0-1240"></a>
-</span><span id="__span-0-1241"><a id="__codelineno-0-1241" name="__codelineno-0-1241"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-1242"><a id="__codelineno-0-1242" name="__codelineno-0-1242"></a><span class="sd">            dst: The name or tag of the destination variable.</span>
-</span><span id="__span-0-1243"><a id="__codelineno-0-1243" name="__codelineno-0-1243"></a><span class="sd">            also_ban: Whether to also ban the edges, for ECCS.</span>
-</span><span id="__span-0-1244"><a id="__codelineno-0-1244" name="__codelineno-0-1244"></a><span class="sd">            interactive: Whether to display the graph interactively after rejecting the edges.</span>
-</span><span id="__span-0-1245"><a id="__codelineno-0-1245" name="__codelineno-0-1245"></a>
-</span><span id="__span-0-1246"><a id="__codelineno-0-1246" name="__codelineno-0-1246"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-1247"><a id="__codelineno-0-1247" name="__codelineno-0-1247"></a><span class="sd">            A tuple containing:</span>
-</span><span id="__span-0-1248"><a id="__codelineno-0-1248" name="__codelineno-0-1248"></a><span class="sd">                (1) the exploration score after the edge rejections,</span>
-</span><span id="__span-0-1249"><a id="__codelineno-0-1249" name="__codelineno-0-1249"></a><span class="sd">                (2) the max-impact variable to explore next, if any,</span>
-</span><span id="__span-0-1250"><a id="__codelineno-0-1250" name="__codelineno-0-1250"></a><span class="sd">                (3) optionally a string representation of the graph, if `interactive` is False.</span>
-</span><span id="__span-0-1251"><a id="__codelineno-0-1251" name="__codelineno-0-1251"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1252"><a id="__codelineno-0-1252" name="__codelineno-0-1252"></a>        <span class="n">dst_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">dst</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1253"><a id="__codelineno-0-1253" name="__codelineno-0-1253"></a>        <span class="k">for</span> <span class="n">v</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variable_names</span><span class="p">:</span>
-</span><span id="__span-0-1254"><a id="__codelineno-0-1254" name="__codelineno-0-1254"></a>            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">get_edge_state</span><span class="p">(</span><span class="n">v</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">)</span> <span class="o">==</span> <span class="s2">&quot;Undecided&quot;</span><span class="p">:</span>
-</span><span id="__span-0-1255"><a id="__codelineno-0-1255" name="__codelineno-0-1255"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">mark_edge</span><span class="p">(</span><span class="n">v</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">,</span> <span class="s2">&quot;Rejected&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1256"><a id="__codelineno-0-1256" name="__codelineno-0-1256"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span> <span class="ow">and</span> <span class="n">also_ban</span><span class="p">:</span>
-</span><span id="__span-0-1257"><a id="__codelineno-0-1257" name="__codelineno-0-1257"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">ban_edge</span><span class="p">(</span><span class="n">v</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">)</span>
-</span><span id="__span-0-1258"><a id="__codelineno-0-1258" name="__codelineno-0-1258"></a>
-</span><span id="__span-0-1259"><a id="__codelineno-0-1259" name="__codelineno-0-1259"></a>        <span class="k">if</span> <span class="n">interactive</span><span class="p">:</span>
-</span><span id="__span-0-1260"><a id="__codelineno-0-1260" name="__codelineno-0-1260"></a>            <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">display_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
-</span><span id="__span-0-1261"><a id="__codelineno-0-1261" name="__codelineno-0-1261"></a>
-</span><span id="__span-0-1262"><a id="__codelineno-0-1262" name="__codelineno-0-1262"></a>        <span class="k">return</span> <span class="p">(</span>
-</span><span id="__span-0-1263"><a id="__codelineno-0-1263" name="__codelineno-0-1263"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">exploration_score</span><span class="p">,</span>
-</span><span id="__span-0-1264"><a id="__codelineno-0-1264" name="__codelineno-0-1264"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">suggest_next_exploration</span><span class="p">(),</span>
-</span><span id="__span-0-1265"><a id="__codelineno-0-1265" name="__codelineno-0-1265"></a>            <span class="p">(</span>
-</span><span id="__span-0-1266"><a id="__codelineno-0-1266" name="__codelineno-0-1266"></a>                <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">draw_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
-</span><span id="__span-0-1267"><a id="__codelineno-0-1267" name="__codelineno-0-1267"></a>                <span class="k">if</span> <span class="ow">not</span> <span class="n">interactive</span>
-</span><span id="__span-0-1268"><a id="__codelineno-0-1268" name="__codelineno-0-1268"></a>                <span class="k">else</span> <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-1269"><a id="__codelineno-0-1269" name="__codelineno-0-1269"></a>            <span class="p">),</span>
-</span><span id="__span-0-1270"><a id="__codelineno-0-1270" name="__codelineno-0-1270"></a>        <span class="p">)</span>
-</span><span id="__span-0-1271"><a id="__codelineno-0-1271" name="__codelineno-0-1271"></a>
-</span><span id="__span-0-1272"><a id="__codelineno-0-1272" name="__codelineno-0-1272"></a>    <span class="k">def</span> <span class="nf">reject_undecided_outgoing</span><span class="p">(</span>
-</span><span id="__span-0-1273"><a id="__codelineno-0-1273" name="__codelineno-0-1273"></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">src</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">also_ban</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span> <span class="n">interactive</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span>
-</span><span id="__span-0-1274"><a id="__codelineno-0-1274" name="__codelineno-0-1274"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
-</span><span id="__span-0-1275"><a id="__codelineno-0-1275" name="__codelineno-0-1275"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1276"><a id="__codelineno-0-1276" name="__codelineno-0-1276"></a><span class="sd">        Mark all undecided outgoing edges from a variable as rejected.</span>
-</span><span id="__span-0-1277"><a id="__codelineno-0-1277" name="__codelineno-0-1277"></a>
-</span><span id="__span-0-1278"><a id="__codelineno-0-1278" name="__codelineno-0-1278"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-1279"><a id="__codelineno-0-1279" name="__codelineno-0-1279"></a><span class="sd">            src: The name or tag of the source variable.</span>
-</span><span id="__span-0-1280"><a id="__codelineno-0-1280" name="__codelineno-0-1280"></a><span class="sd">            also_ban: Whether to also ban the edges, for ECCS.</span>
-</span><span id="__span-0-1281"><a id="__codelineno-0-1281" name="__codelineno-0-1281"></a><span class="sd">            interactive: Whether to display the graph interactively after rejecting the edges.</span>
-</span><span id="__span-0-1282"><a id="__codelineno-0-1282" name="__codelineno-0-1282"></a>
-</span><span id="__span-0-1283"><a id="__codelineno-0-1283" name="__codelineno-0-1283"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-1284"><a id="__codelineno-0-1284" name="__codelineno-0-1284"></a><span class="sd">            A tuple containing:</span>
-</span><span id="__span-0-1285"><a id="__codelineno-0-1285" name="__codelineno-0-1285"></a><span class="sd">                (1) the exploration score after the edge rejections,</span>
-</span><span id="__span-0-1286"><a id="__codelineno-0-1286" name="__codelineno-0-1286"></a><span class="sd">                (2) the max-impact variable to explore next, if any,</span>
-</span><span id="__span-0-1287"><a id="__codelineno-0-1287" name="__codelineno-0-1287"></a><span class="sd">                (3) optionally a string representation of the graph, if `interactive` is False.</span>
-</span><span id="__span-0-1288"><a id="__codelineno-0-1288" name="__codelineno-0-1288"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1289"><a id="__codelineno-0-1289" name="__codelineno-0-1289"></a>        <span class="n">src_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">src</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1290"><a id="__codelineno-0-1290" name="__codelineno-0-1290"></a>        <span class="k">for</span> <span class="n">v</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variable_names</span><span class="p">:</span>
-</span><span id="__span-0-1291"><a id="__codelineno-0-1291" name="__codelineno-0-1291"></a>            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">get_edge_state</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">v</span><span class="p">)</span> <span class="o">==</span> <span class="s2">&quot;Undecided&quot;</span><span class="p">:</span>
-</span><span id="__span-0-1292"><a id="__codelineno-0-1292" name="__codelineno-0-1292"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">mark_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">v</span><span class="p">,</span> <span class="s2">&quot;Rejected&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1293"><a id="__codelineno-0-1293" name="__codelineno-0-1293"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span> <span class="ow">and</span> <span class="n">also_ban</span><span class="p">:</span>
-</span><span id="__span-0-1294"><a id="__codelineno-0-1294" name="__codelineno-0-1294"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">ban_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">v</span><span class="p">)</span>
-</span><span id="__span-0-1295"><a id="__codelineno-0-1295" name="__codelineno-0-1295"></a>
-</span><span id="__span-0-1296"><a id="__codelineno-0-1296" name="__codelineno-0-1296"></a>        <span class="k">if</span> <span class="n">interactive</span><span class="p">:</span>
-</span><span id="__span-0-1297"><a id="__codelineno-0-1297" name="__codelineno-0-1297"></a>            <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">display_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
-</span><span id="__span-0-1298"><a id="__codelineno-0-1298" name="__codelineno-0-1298"></a>
-</span><span id="__span-0-1299"><a id="__codelineno-0-1299" name="__codelineno-0-1299"></a>        <span class="k">return</span> <span class="p">(</span>
-</span><span id="__span-0-1300"><a id="__codelineno-0-1300" name="__codelineno-0-1300"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">exploration_score</span><span class="p">,</span>
-</span><span id="__span-0-1301"><a id="__codelineno-0-1301" name="__codelineno-0-1301"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">suggest_next_exploration</span><span class="p">(),</span>
-</span><span id="__span-0-1302"><a id="__codelineno-0-1302" name="__codelineno-0-1302"></a>            <span class="p">(</span>
-</span><span id="__span-0-1303"><a id="__codelineno-0-1303" name="__codelineno-0-1303"></a>                <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">draw_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
-</span><span id="__span-0-1304"><a id="__codelineno-0-1304" name="__codelineno-0-1304"></a>                <span class="k">if</span> <span class="ow">not</span> <span class="n">interactive</span>
-</span><span id="__span-0-1305"><a id="__codelineno-0-1305" name="__codelineno-0-1305"></a>                <span class="k">else</span> <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-1306"><a id="__codelineno-0-1306" name="__codelineno-0-1306"></a>            <span class="p">),</span>
-</span><span id="__span-0-1307"><a id="__codelineno-0-1307" name="__codelineno-0-1307"></a>        <span class="p">)</span>
-</span><span id="__span-0-1308"><a id="__codelineno-0-1308" name="__codelineno-0-1308"></a>
-</span><span id="__span-0-1309"><a id="__codelineno-0-1309" name="__codelineno-0-1309"></a>    <span class="k">def</span> <span class="nf">reject_all_prunable_edges</span><span class="p">(</span>
-</span><span id="__span-0-1310"><a id="__codelineno-0-1310" name="__codelineno-0-1310"></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-1311"><a id="__codelineno-0-1311" name="__codelineno-0-1311"></a>        <span class="n">also_ban</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
-</span><span id="__span-0-1312"><a id="__codelineno-0-1312" name="__codelineno-0-1312"></a>        <span class="n">lasso_alpha</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="n">Pruner</span><span class="o">.</span><span class="n">LASSO_DEFAULT_ALPHA</span><span class="p">,</span>
-</span><span id="__span-0-1313"><a id="__codelineno-0-1313" name="__codelineno-0-1313"></a>        <span class="n">lasso_max_iter</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="n">Pruner</span><span class="o">.</span><span class="n">LASSO_DEFAULT_MAX_ITER</span><span class="p">,</span>
-</span><span id="__span-0-1314"><a id="__codelineno-0-1314" name="__codelineno-0-1314"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
-</span><span id="__span-0-1315"><a id="__codelineno-0-1315" name="__codelineno-0-1315"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1316"><a id="__codelineno-0-1316" name="__codelineno-0-1316"></a><span class="sd">        For every prepared variable, reject all incoming edges that start at a variable</span>
-</span><span id="__span-0-1317"><a id="__codelineno-0-1317" name="__codelineno-0-1317"></a><span class="sd">        that is pruned by our pruning approach. This may be time-consuming depending on the number of variables.</span>
-</span><span id="__span-0-1318"><a id="__codelineno-0-1318" name="__codelineno-0-1318"></a>
-</span><span id="__span-0-1319"><a id="__codelineno-0-1319" name="__codelineno-0-1319"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-1320"><a id="__codelineno-0-1320" name="__codelineno-0-1320"></a><span class="sd">            also_ban: Whether to also ban the edges, for ECCS.</span>
-</span><span id="__span-0-1321"><a id="__codelineno-0-1321" name="__codelineno-0-1321"></a><span class="sd">            lasso_alpha: The alpha parameter to be used for Lasso regression.</span>
-</span><span id="__span-0-1322"><a id="__codelineno-0-1322" name="__codelineno-0-1322"></a><span class="sd">            lasso_max_iter: The maximum number of iterations to be used for Lasso regression.</span>
-</span><span id="__span-0-1323"><a id="__codelineno-0-1323" name="__codelineno-0-1323"></a>
-</span><span id="__span-0-1324"><a id="__codelineno-0-1324" name="__codelineno-0-1324"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-1325"><a id="__codelineno-0-1325" name="__codelineno-0-1325"></a><span class="sd">            A tuple containing:</span>
-</span><span id="__span-0-1326"><a id="__codelineno-0-1326" name="__codelineno-0-1326"></a><span class="sd">                (1) the exploration score after the edge rejections,</span>
-</span><span id="__span-0-1327"><a id="__codelineno-0-1327" name="__codelineno-0-1327"></a><span class="sd">                (2) the max-impact variable to explore next, if any,</span>
-</span><span id="__span-0-1328"><a id="__codelineno-0-1328" name="__codelineno-0-1328"></a><span class="sd">                (3) optionally a string representation of the graph, if `interactive` is False.</span>
-</span><span id="__span-0-1329"><a id="__codelineno-0-1329" name="__codelineno-0-1329"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1330"><a id="__codelineno-0-1330" name="__codelineno-0-1330"></a>        <span class="n">num_processors</span> <span class="o">=</span> <span class="n">multiprocessing</span><span class="o">.</span><span class="n">cpu_count</span><span class="p">()</span>
-</span><span id="__span-0-1331"><a id="__codelineno-0-1331" name="__codelineno-0-1331"></a>        <span class="k">with</span> <span class="n">multiprocessing</span><span class="o">.</span><span class="n">Pool</span><span class="p">(</span><span class="n">processes</span><span class="o">=</span><span class="n">num_processors</span><span class="p">)</span> <span class="k">as</span> <span class="n">pool</span><span class="p">:</span>
-</span><span id="__span-0-1332"><a id="__codelineno-0-1332" name="__codelineno-0-1332"></a>            <span class="n">all_candidates</span> <span class="o">=</span> <span class="n">pool</span><span class="o">.</span><span class="n">starmap</span><span class="p">(</span>
-</span><span id="__span-0-1333"><a id="__codelineno-0-1333" name="__codelineno-0-1333"></a>                <span class="n">Pruner</span><span class="o">.</span><span class="n">prune_with_lasso</span><span class="p">,</span>
-</span><span id="__span-0-1334"><a id="__codelineno-0-1334" name="__codelineno-0-1334"></a>                <span class="n">tqdm</span><span class="p">(</span>
-</span><span id="__span-0-1335"><a id="__codelineno-0-1335" name="__codelineno-0-1335"></a>                    <span class="p">[</span>
-</span><span id="__span-0-1336"><a id="__codelineno-0-1336" name="__codelineno-0-1336"></a>                        <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span> <span class="p">[</span><span class="n">target</span><span class="p">],</span> <span class="n">lasso_alpha</span><span class="p">,</span> <span class="n">lasso_max_iter</span><span class="p">)</span>
-</span><span id="__span-0-1337"><a id="__codelineno-0-1337" name="__codelineno-0-1337"></a>                        <span class="k">for</span> <span class="n">target</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variable_names</span>
-</span><span id="__span-0-1338"><a id="__codelineno-0-1338" name="__codelineno-0-1338"></a>                    <span class="p">],</span>
-</span><span id="__span-0-1339"><a id="__codelineno-0-1339" name="__codelineno-0-1339"></a>                    <span class="n">total</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">num_prepared_variables</span><span class="p">,</span>
-</span><span id="__span-0-1340"><a id="__codelineno-0-1340" name="__codelineno-0-1340"></a>                    <span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Finding pruned variables...&quot;</span><span class="p">,</span>
-</span><span id="__span-0-1341"><a id="__codelineno-0-1341" name="__codelineno-0-1341"></a>                <span class="p">),</span>
-</span><span id="__span-0-1342"><a id="__codelineno-0-1342" name="__codelineno-0-1342"></a>            <span class="p">)</span>
-</span><span id="__span-0-1343"><a id="__codelineno-0-1343" name="__codelineno-0-1343"></a>
-</span><span id="__span-0-1344"><a id="__codelineno-0-1344" name="__codelineno-0-1344"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="n">all_candidates</span><span class="p">)</span>
-</span><span id="__span-0-1345"><a id="__codelineno-0-1345" name="__codelineno-0-1345"></a>
-</span><span id="__span-0-1346"><a id="__codelineno-0-1346" name="__codelineno-0-1346"></a>        <span class="k">for</span> <span class="n">candidates</span><span class="p">,</span> <span class="n">target</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">all_candidates</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variable_names</span><span class="p">):</span>
-</span><span id="__span-0-1347"><a id="__codelineno-0-1347" name="__codelineno-0-1347"></a>            <span class="n">non_candidates</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-1348"><a id="__codelineno-0-1348" name="__codelineno-0-1348"></a>                <span class="nb">set</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span><span class="p">)</span> <span class="o">-</span> <span class="nb">set</span><span class="p">(</span><span class="n">candidates</span><span class="p">)</span> <span class="o">-</span> <span class="nb">set</span><span class="p">([</span><span class="n">target</span><span class="p">])</span>
-</span><span id="__span-0-1349"><a id="__codelineno-0-1349" name="__codelineno-0-1349"></a>            <span class="p">)</span>
-</span><span id="__span-0-1350"><a id="__codelineno-0-1350" name="__codelineno-0-1350"></a>            <span class="k">for</span> <span class="n">nc</span> <span class="ow">in</span> <span class="n">non_candidates</span><span class="p">:</span>
-</span><span id="__span-0-1351"><a id="__codelineno-0-1351" name="__codelineno-0-1351"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">mark_edge</span><span class="p">(</span><span class="n">nc</span><span class="p">,</span> <span class="n">target</span><span class="p">,</span> <span class="s2">&quot;Rejected&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1352"><a id="__codelineno-0-1352" name="__codelineno-0-1352"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span> <span class="ow">and</span> <span class="n">also_ban</span><span class="p">:</span>
-</span><span id="__span-0-1353"><a id="__codelineno-0-1353" name="__codelineno-0-1353"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">ban_edge</span><span class="p">(</span><span class="n">nc</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>
-</span><span id="__span-0-1354"><a id="__codelineno-0-1354" name="__codelineno-0-1354"></a>
-</span><span id="__span-0-1355"><a id="__codelineno-0-1355" name="__codelineno-0-1355"></a>        <span class="k">return</span> <span class="p">(</span>
-</span><span id="__span-0-1356"><a id="__codelineno-0-1356" name="__codelineno-0-1356"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">exploration_score</span><span class="p">,</span>
-</span><span id="__span-0-1357"><a id="__codelineno-0-1357" name="__codelineno-0-1357"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">suggest_next_exploration</span><span class="p">(),</span>
-</span><span id="__span-0-1358"><a id="__codelineno-0-1358" name="__codelineno-0-1358"></a>            <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">draw_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">),</span>
-</span><span id="__span-0-1359"><a id="__codelineno-0-1359" name="__codelineno-0-1359"></a>        <span class="p">)</span>
-</span><span id="__span-0-1360"><a id="__codelineno-0-1360" name="__codelineno-0-1360"></a>
-</span><span id="__span-0-1361"><a id="__codelineno-0-1361" name="__codelineno-0-1361"></a>    <span class="nd">@property</span>
-</span><span id="__span-0-1362"><a id="__codelineno-0-1362" name="__codelineno-0-1362"></a>    <span class="k">def</span> <span class="nf">exploration_score</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
-</span><span id="__span-0-1363"><a id="__codelineno-0-1363" name="__codelineno-0-1363"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1364"><a id="__codelineno-0-1364" name="__codelineno-0-1364"></a><span class="sd">        Calculate the exploration score of the current partial causal graph,</span>
-</span><span id="__span-0-1365"><a id="__codelineno-0-1365" name="__codelineno-0-1365"></a><span class="sd">        based on the edge state matrix.</span>
+</span><span id="__span-0-958"><a id="__codelineno-0-958" name="__codelineno-0-958"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span>
+</span><span id="__span-0-959"><a id="__codelineno-0-959" name="__codelineno-0-959"></a>            <span class="sa">f</span><span class="s2">&quot;&quot;&quot;Successfully prepared the log with causal unit </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="si">}</span><span class="s2"> &quot;&quot;&quot;</span>
+</span><span id="__span-0-960"><a id="__codelineno-0-960" name="__codelineno-0-960"></a>            <span class="sa">f</span><span class="s2">&quot;&quot;&quot;(tag: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">get_tag_of_parsed</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">)</span><span class="si">}</span><span class="s2">)&quot;&quot;&quot;</span>
+</span><span id="__span-0-961"><a id="__codelineno-0-961" name="__codelineno-0-961"></a>            <span class="o">+</span> <span class="p">(</span>
+</span><span id="__span-0-962"><a id="__codelineno-0-962" name="__codelineno-0-962"></a>                <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-963"><a id="__codelineno-0-963" name="__codelineno-0-963"></a>                <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span>
+</span><span id="__span-0-964"><a id="__codelineno-0-964" name="__codelineno-0-964"></a>                <span class="k">else</span> <span class="sa">f</span><span class="s2">&quot; with </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span><span class="si">}</span><span class="s2"> causal units.&quot;</span>
+</span><span id="__span-0-965"><a id="__codelineno-0-965" name="__codelineno-0-965"></a>            <span class="p">)</span>
+</span><span id="__span-0-966"><a id="__codelineno-0-966" name="__codelineno-0-966"></a>        <span class="p">)</span>
+</span><span id="__span-0-967"><a id="__codelineno-0-967" name="__codelineno-0-967"></a>
+</span><span id="__span-0-968"><a id="__codelineno-0-968" name="__codelineno-0-968"></a>        <span class="k">return</span>
+</span><span id="__span-0-969"><a id="__codelineno-0-969" name="__codelineno-0-969"></a>
+</span><span id="__span-0-970"><a id="__codelineno-0-970" name="__codelineno-0-970"></a>    <span class="k">def</span> <span class="nf">_generate_prepared_variables_df</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-971"><a id="__codelineno-0-971" name="__codelineno-0-971"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-972"><a id="__codelineno-0-972" name="__codelineno-0-972"></a><span class="sd">        Generate dataframe of prepared variables for later tagging etc.</span>
+</span><span id="__span-0-973"><a id="__codelineno-0-973" name="__codelineno-0-973"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-974"><a id="__codelineno-0-974" name="__codelineno-0-974"></a>
+</span><span id="__span-0-975"><a id="__codelineno-0-975" name="__codelineno-0-975"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">()</span>
+</span><span id="__span-0-976"><a id="__codelineno-0-976" name="__codelineno-0-976"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span>
+</span><span id="__span-0-977"><a id="__codelineno-0-977" name="__codelineno-0-977"></a>
+</span><span id="__span-0-978"><a id="__codelineno-0-978" name="__codelineno-0-978"></a>        <span class="c1"># Bring in varable name components leveraging PreparedVariableName</span>
+</span><span id="__span-0-979"><a id="__codelineno-0-979" name="__codelineno-0-979"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Base&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
+</span><span id="__span-0-980"><a id="__codelineno-0-980" name="__codelineno-0-980"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">x</span><span class="p">)</span><span class="o">.</span><span class="n">base_var</span><span class="p">()</span>
+</span><span id="__span-0-981"><a id="__codelineno-0-981" name="__codelineno-0-981"></a>        <span class="p">)</span>
+</span><span id="__span-0-982"><a id="__codelineno-0-982" name="__codelineno-0-982"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Pre-agg Value&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span>
+</span><span id="__span-0-983"><a id="__codelineno-0-983" name="__codelineno-0-983"></a>            <span class="s2">&quot;Name&quot;</span>
+</span><span id="__span-0-984"><a id="__codelineno-0-984" name="__codelineno-0-984"></a>        <span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span><span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">x</span><span class="p">)</span><span class="o">.</span><span class="n">pre_agg_value</span><span class="p">())</span>
+</span><span id="__span-0-985"><a id="__codelineno-0-985" name="__codelineno-0-985"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Agg&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
+</span><span id="__span-0-986"><a id="__codelineno-0-986" name="__codelineno-0-986"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">x</span><span class="p">)</span><span class="o">.</span><span class="n">aggregate</span><span class="p">()</span>
+</span><span id="__span-0-987"><a id="__codelineno-0-987" name="__codelineno-0-987"></a>        <span class="p">)</span>
+</span><span id="__span-0-988"><a id="__codelineno-0-988" name="__codelineno-0-988"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Post-agg Value&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span>
+</span><span id="__span-0-989"><a id="__codelineno-0-989" name="__codelineno-0-989"></a>            <span class="s2">&quot;Name&quot;</span>
+</span><span id="__span-0-990"><a id="__codelineno-0-990" name="__codelineno-0-990"></a>        <span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span><span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">x</span><span class="p">)</span><span class="o">.</span><span class="n">post_agg_value</span><span class="p">())</span>
+</span><span id="__span-0-991"><a id="__codelineno-0-991" name="__codelineno-0-991"></a>
+</span><span id="__span-0-992"><a id="__codelineno-0-992" name="__codelineno-0-992"></a>        <span class="c1"># Bring in other info from self._parsed_variables</span>
+</span><span id="__span-0-993"><a id="__codelineno-0-993" name="__codelineno-0-993"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
+</span><span id="__span-0-994"><a id="__codelineno-0-994" name="__codelineno-0-994"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="__span-0-995"><a id="__codelineno-0-995" name="__codelineno-0-995"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-996"><a id="__codelineno-0-996" name="__codelineno-0-996"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Base&quot;</span><span class="p">],</span>
+</span><span id="__span-0-997"><a id="__codelineno-0-997" name="__codelineno-0-997"></a>                    <span class="s2">&quot;Tag&quot;</span><span class="p">,</span>
+</span><span id="__span-0-998"><a id="__codelineno-0-998" name="__codelineno-0-998"></a>                <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-999"><a id="__codelineno-0-999" name="__codelineno-0-999"></a>                <span class="k">if</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Base&quot;</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;TemplateId&quot;</span>
+</span><span id="__span-0-1000"><a id="__codelineno-0-1000" name="__codelineno-0-1000"></a>                <span class="k">else</span> <span class="s2">&quot;TemplateId&quot;</span>
+</span><span id="__span-0-1001"><a id="__codelineno-0-1001" name="__codelineno-0-1001"></a>            <span class="p">)</span>
+</span><span id="__span-0-1002"><a id="__codelineno-0-1002" name="__codelineno-0-1002"></a>            <span class="o">+</span> <span class="p">(</span><span class="sa">f</span><span class="s2">&quot; </span><span class="si">{</span><span class="n">x</span><span class="p">[</span><span class="s1">&#39;Pre-agg Value&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span> <span class="k">if</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Pre-agg Value&quot;</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;&quot;</span> <span class="k">else</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1003"><a id="__codelineno-0-1003" name="__codelineno-0-1003"></a>            <span class="o">+</span> <span class="p">(</span><span class="sa">f</span><span class="s2">&quot; </span><span class="si">{</span><span class="n">x</span><span class="p">[</span><span class="s1">&#39;Agg&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span> <span class="k">if</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Agg&quot;</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;&quot;</span> <span class="k">else</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1004"><a id="__codelineno-0-1004" name="__codelineno-0-1004"></a>            <span class="o">+</span> <span class="p">(</span><span class="sa">f</span><span class="s2">&quot; </span><span class="si">{</span><span class="n">x</span><span class="p">[</span><span class="s1">&#39;Post-agg Value&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span> <span class="k">if</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Post-agg Value&quot;</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;&quot;</span> <span class="k">else</span> <span class="s2">&quot;&quot;</span><span class="p">),</span>
+</span><span id="__span-0-1005"><a id="__codelineno-0-1005" name="__codelineno-0-1005"></a>            <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+</span><span id="__span-0-1006"><a id="__codelineno-0-1006" name="__codelineno-0-1006"></a>        <span class="p">)</span>
+</span><span id="__span-0-1007"><a id="__codelineno-0-1007" name="__codelineno-0-1007"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Base Variable Occurences&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span>
+</span><span id="__span-0-1008"><a id="__codelineno-0-1008" name="__codelineno-0-1008"></a>            <span class="s2">&quot;Base&quot;</span>
+</span><span id="__span-0-1009"><a id="__codelineno-0-1009" name="__codelineno-0-1009"></a>        <span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
+</span><span id="__span-0-1010"><a id="__codelineno-0-1010" name="__codelineno-0-1010"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="__span-0-1011"><a id="__codelineno-0-1011" name="__codelineno-0-1011"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-1012"><a id="__codelineno-0-1012" name="__codelineno-0-1012"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">x</span><span class="p">,</span> <span class="s2">&quot;Occurrences&quot;</span>
+</span><span id="__span-0-1013"><a id="__codelineno-0-1013" name="__codelineno-0-1013"></a>                <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-1014"><a id="__codelineno-0-1014" name="__codelineno-0-1014"></a>                <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="s2">&quot;TemplateId&quot;</span>
+</span><span id="__span-0-1015"><a id="__codelineno-0-1015" name="__codelineno-0-1015"></a>                <span class="k">else</span> <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-1016"><a id="__codelineno-0-1016" name="__codelineno-0-1016"></a>            <span class="p">)</span>
+</span><span id="__span-0-1017"><a id="__codelineno-0-1017" name="__codelineno-0-1017"></a>        <span class="p">)</span>
+</span><span id="__span-0-1018"><a id="__codelineno-0-1018" name="__codelineno-0-1018"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Base&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
+</span><span id="__span-0-1019"><a id="__codelineno-0-1019" name="__codelineno-0-1019"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="__span-0-1020"><a id="__codelineno-0-1020" name="__codelineno-0-1020"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-1021"><a id="__codelineno-0-1021" name="__codelineno-0-1021"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">x</span><span class="p">,</span> <span class="s2">&quot;Type&quot;</span>
+</span><span id="__span-0-1022"><a id="__codelineno-0-1022" name="__codelineno-0-1022"></a>                <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-1023"><a id="__codelineno-0-1023" name="__codelineno-0-1023"></a>                <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="s2">&quot;TemplateId&quot;</span>
+</span><span id="__span-0-1024"><a id="__codelineno-0-1024" name="__codelineno-0-1024"></a>                <span class="k">else</span> <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-1025"><a id="__codelineno-0-1025" name="__codelineno-0-1025"></a>            <span class="p">)</span>
+</span><span id="__span-0-1026"><a id="__codelineno-0-1026" name="__codelineno-0-1026"></a>        <span class="p">)</span>
+</span><span id="__span-0-1027"><a id="__codelineno-0-1027" name="__codelineno-0-1027"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Examples&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Base&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
+</span><span id="__span-0-1028"><a id="__codelineno-0-1028" name="__codelineno-0-1028"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="__span-0-1029"><a id="__codelineno-0-1029" name="__codelineno-0-1029"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-1030"><a id="__codelineno-0-1030" name="__codelineno-0-1030"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">x</span><span class="p">,</span> <span class="s2">&quot;Examples&quot;</span>
+</span><span id="__span-0-1031"><a id="__codelineno-0-1031" name="__codelineno-0-1031"></a>                <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-1032"><a id="__codelineno-0-1032" name="__codelineno-0-1032"></a>                <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="s2">&quot;TemplateId&quot;</span>
+</span><span id="__span-0-1033"><a id="__codelineno-0-1033" name="__codelineno-0-1033"></a>                <span class="k">else</span> <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-1034"><a id="__codelineno-0-1034" name="__codelineno-0-1034"></a>            <span class="p">)</span>
+</span><span id="__span-0-1035"><a id="__codelineno-0-1035" name="__codelineno-0-1035"></a>        <span class="p">)</span>
+</span><span id="__span-0-1036"><a id="__codelineno-0-1036" name="__codelineno-0-1036"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Base&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
+</span><span id="__span-0-1037"><a id="__codelineno-0-1037" name="__codelineno-0-1037"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="__span-0-1038"><a id="__codelineno-0-1038" name="__codelineno-0-1038"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-1039"><a id="__codelineno-0-1039" name="__codelineno-0-1039"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">x</span><span class="p">,</span> <span class="s2">&quot;From regex&quot;</span>
+</span><span id="__span-0-1040"><a id="__codelineno-0-1040" name="__codelineno-0-1040"></a>                <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-1041"><a id="__codelineno-0-1041" name="__codelineno-0-1041"></a>                <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="s2">&quot;TemplateId&quot;</span>
+</span><span id="__span-0-1042"><a id="__codelineno-0-1042" name="__codelineno-0-1042"></a>                <span class="k">else</span> <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-1043"><a id="__codelineno-0-1043" name="__codelineno-0-1043"></a>            <span class="p">)</span>
+</span><span id="__span-0-1044"><a id="__codelineno-0-1044" name="__codelineno-0-1044"></a>        <span class="p">)</span>
+</span><span id="__span-0-1045"><a id="__codelineno-0-1045" name="__codelineno-0-1045"></a>
+</span><span id="__span-0-1046"><a id="__codelineno-0-1046" name="__codelineno-0-1046"></a>        <span class="c1"># Bring in template text, only for appropriate base variables.</span>
+</span><span id="__span-0-1047"><a id="__codelineno-0-1047" name="__codelineno-0-1047"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
+</span><span id="__span-0-1048"><a id="__codelineno-0-1048" name="__codelineno-0-1048"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="__span-0-1049"><a id="__codelineno-0-1049" name="__codelineno-0-1049"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-1050"><a id="__codelineno-0-1050" name="__codelineno-0-1050"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span>
+</span><span id="__span-0-1051"><a id="__codelineno-0-1051" name="__codelineno-0-1051"></a>                    <span class="o">==</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">x</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">])</span><span class="o">.</span><span class="n">template_id</span><span class="p">(),</span>
+</span><span id="__span-0-1052"><a id="__codelineno-0-1052" name="__codelineno-0-1052"></a>                    <span class="s2">&quot;TemplateText&quot;</span><span class="p">,</span>
+</span><span id="__span-0-1053"><a id="__codelineno-0-1053" name="__codelineno-0-1053"></a>                <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-1054"><a id="__codelineno-0-1054" name="__codelineno-0-1054"></a>                <span class="k">if</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="kc">False</span>
+</span><span id="__span-0-1055"><a id="__codelineno-0-1055" name="__codelineno-0-1055"></a>                <span class="k">else</span> <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-1056"><a id="__codelineno-0-1056" name="__codelineno-0-1056"></a>            <span class="p">),</span>
+</span><span id="__span-0-1057"><a id="__codelineno-0-1057" name="__codelineno-0-1057"></a>            <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+</span><span id="__span-0-1058"><a id="__codelineno-0-1058" name="__codelineno-0-1058"></a>        <span class="p">)</span>
+</span><span id="__span-0-1059"><a id="__codelineno-0-1059" name="__codelineno-0-1059"></a>
+</span><span id="__span-0-1060"><a id="__codelineno-0-1060" name="__codelineno-0-1060"></a>    <span class="k">def</span> <span class="nf">inspect</span><span class="p">(</span>
+</span><span id="__span-0-1061"><a id="__codelineno-0-1061" name="__codelineno-0-1061"></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-1062"><a id="__codelineno-0-1062" name="__codelineno-0-1062"></a>        <span class="n">var</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-1063"><a id="__codelineno-0-1063" name="__codelineno-0-1063"></a>        <span class="n">ref_var</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-1064"><a id="__codelineno-0-1064" name="__codelineno-0-1064"></a>        <span class="n">row_limit</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">=</span> <span class="mi">10</span><span class="p">,</span>
+</span><span id="__span-0-1065"><a id="__codelineno-0-1065" name="__codelineno-0-1065"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">]:</span>
+</span><span id="__span-0-1066"><a id="__codelineno-0-1066" name="__codelineno-0-1066"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1067"><a id="__codelineno-0-1067" name="__codelineno-0-1067"></a><span class="sd">        Print information about a specific prepared variable.</span>
+</span><span id="__span-0-1068"><a id="__codelineno-0-1068" name="__codelineno-0-1068"></a>
+</span><span id="__span-0-1069"><a id="__codelineno-0-1069" name="__codelineno-0-1069"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-1070"><a id="__codelineno-0-1070" name="__codelineno-0-1070"></a><span class="sd">            var: The name or tag of the variable.</span>
+</span><span id="__span-0-1071"><a id="__codelineno-0-1071" name="__codelineno-0-1071"></a><span class="sd">            ref_var: The name or tag of a reference variable.</span>
+</span><span id="__span-0-1072"><a id="__codelineno-0-1072" name="__codelineno-0-1072"></a><span class="sd">            row_limit: The number of rows of the prepared log to print out,</span>
+</span><span id="__span-0-1073"><a id="__codelineno-0-1073" name="__codelineno-0-1073"></a><span class="sd">                to illustrate example values of this variable.</span>
+</span><span id="__span-0-1074"><a id="__codelineno-0-1074" name="__codelineno-0-1074"></a>
+</span><span id="__span-0-1075"><a id="__codelineno-0-1075" name="__codelineno-0-1075"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-1076"><a id="__codelineno-0-1076" name="__codelineno-0-1076"></a><span class="sd">            A tuple containing:</span>
+</span><span id="__span-0-1077"><a id="__codelineno-0-1077" name="__codelineno-0-1077"></a><span class="sd">                (1) Information about the base variable of `var`, if `var` is not related to the</span>
+</span><span id="__span-0-1078"><a id="__codelineno-0-1078" name="__codelineno-0-1078"></a><span class="sd">                    occurrence count of a template.</span>
+</span><span id="__span-0-1079"><a id="__codelineno-0-1079" name="__codelineno-0-1079"></a><span class="sd">                (2) Information about the template of `var`, if `var` was not created from a regex.</span>
+</span><span id="__span-0-1080"><a id="__codelineno-0-1080" name="__codelineno-0-1080"></a><span class="sd">                (3) A sample of the prepared log, with `row_limit` rows.</span>
+</span><span id="__span-0-1081"><a id="__codelineno-0-1081" name="__codelineno-0-1081"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1082"><a id="__codelineno-0-1082" name="__codelineno-0-1082"></a>
+</span><span id="__span-0-1083"><a id="__codelineno-0-1083" name="__codelineno-0-1083"></a>        <span class="c1"># Retrieve the name of this variable, if a tag was passed in.</span>
+</span><span id="__span-0-1084"><a id="__codelineno-0-1084" name="__codelineno-0-1084"></a>        <span class="n">name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">var</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1085"><a id="__codelineno-0-1085" name="__codelineno-0-1085"></a>
+</span><span id="__span-0-1086"><a id="__codelineno-0-1086" name="__codelineno-0-1086"></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Information about prepared variable </span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2">:</span><span class="se">\n</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1087"><a id="__codelineno-0-1087" name="__codelineno-0-1087"></a>        <span class="n">base_var</span> <span class="o">=</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">name</span><span class="p">)</span><span class="o">.</span><span class="n">base_var</span><span class="p">()</span>
+</span><span id="__span-0-1088"><a id="__codelineno-0-1088" name="__codelineno-0-1088"></a>        <span class="n">from_regex</span> <span class="o">=</span> <span class="kc">False</span>
+</span><span id="__span-0-1089"><a id="__codelineno-0-1089" name="__codelineno-0-1089"></a>
+</span><span id="__span-0-1090"><a id="__codelineno-0-1090" name="__codelineno-0-1090"></a>        <span class="n">base_var_info_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">()</span>
+</span><span id="__span-0-1091"><a id="__codelineno-0-1091" name="__codelineno-0-1091"></a>        <span class="k">if</span> <span class="n">base_var</span> <span class="o">!=</span> <span class="s2">&quot;TemplateId&quot;</span><span class="p">:</span>
+</span><span id="__span-0-1092"><a id="__codelineno-0-1092" name="__codelineno-0-1092"></a>            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;--&gt; Variable Information about </span><span class="si">{</span><span class="n">base_var</span><span class="si">}</span><span class="s2">:&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1093"><a id="__codelineno-0-1093" name="__codelineno-0-1093"></a>            <span class="n">base_var_info_df</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span>
+</span><span id="__span-0-1094"><a id="__codelineno-0-1094" name="__codelineno-0-1094"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">base_var</span>
+</span><span id="__span-0-1095"><a id="__codelineno-0-1095" name="__codelineno-0-1095"></a>            <span class="p">]</span>
+</span><span id="__span-0-1096"><a id="__codelineno-0-1096" name="__codelineno-0-1096"></a>            <span class="n">from_regex</span> <span class="o">=</span> <span class="n">base_var_info_df</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-1097"><a id="__codelineno-0-1097" name="__codelineno-0-1097"></a>            <span class="n">display</span><span class="p">(</span><span class="n">base_var_info_df</span><span class="p">)</span>
+</span><span id="__span-0-1098"><a id="__codelineno-0-1098" name="__codelineno-0-1098"></a>
+</span><span id="__span-0-1099"><a id="__codelineno-0-1099" name="__codelineno-0-1099"></a>        <span class="n">template_info_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">()</span>
+</span><span id="__span-0-1100"><a id="__codelineno-0-1100" name="__codelineno-0-1100"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">from_regex</span><span class="p">:</span>
+</span><span id="__span-0-1101"><a id="__codelineno-0-1101" name="__codelineno-0-1101"></a>            <span class="n">template_id</span> <span class="o">=</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">name</span><span class="p">)</span><span class="o">.</span><span class="n">template_id</span><span class="p">()</span>
+</span><span id="__span-0-1102"><a id="__codelineno-0-1102" name="__codelineno-0-1102"></a>            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;--&gt; Template Information about </span><span class="si">{</span><span class="n">template_id</span><span class="si">}</span><span class="s2">:&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1103"><a id="__codelineno-0-1103" name="__codelineno-0-1103"></a>            <span class="n">template_info_df</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span>
+</span><span id="__span-0-1104"><a id="__codelineno-0-1104" name="__codelineno-0-1104"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">template_id</span>
+</span><span id="__span-0-1105"><a id="__codelineno-0-1105" name="__codelineno-0-1105"></a>            <span class="p">]</span>
+</span><span id="__span-0-1106"><a id="__codelineno-0-1106" name="__codelineno-0-1106"></a>            <span class="n">display</span><span class="p">(</span><span class="n">template_info_df</span><span class="p">)</span>
+</span><span id="__span-0-1107"><a id="__codelineno-0-1107" name="__codelineno-0-1107"></a>
+</span><span id="__span-0-1108"><a id="__codelineno-0-1108" name="__codelineno-0-1108"></a>        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;--&gt; Causal Unit Partial Information:&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1109"><a id="__codelineno-0-1109" name="__codelineno-0-1109"></a>        <span class="k">if</span> <span class="n">row_limit</span> <span class="o">==</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-1110"><a id="__codelineno-0-1110" name="__codelineno-0-1110"></a>            <span class="n">row_limit</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">)</span>
+</span><span id="__span-0-1111"><a id="__codelineno-0-1111" name="__codelineno-0-1111"></a>        <span class="n">col_list</span> <span class="o">=</span> <span class="p">[</span><span class="n">name</span><span class="p">]</span>
+</span><span id="__span-0-1112"><a id="__codelineno-0-1112" name="__codelineno-0-1112"></a>        <span class="n">col_list</span><span class="o">.</span><span class="n">extend</span><span class="p">([</span><span class="n">ref_var</span><span class="p">]</span> <span class="k">if</span> <span class="n">ref_var</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="k">else</span> <span class="p">[])</span>
+</span><span id="__span-0-1113"><a id="__codelineno-0-1113" name="__codelineno-0-1113"></a>        <span class="n">prepared_log_info_df</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">col_list</span><span class="p">]</span><span class="o">.</span><span class="n">head</span><span class="p">(</span><span class="n">row_limit</span><span class="p">)</span>
+</span><span id="__span-0-1114"><a id="__codelineno-0-1114" name="__codelineno-0-1114"></a>        <span class="n">col_names</span> <span class="o">=</span> <span class="p">[</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> (candidate)&quot;</span><span class="p">]</span>
+</span><span id="__span-0-1115"><a id="__codelineno-0-1115" name="__codelineno-0-1115"></a>        <span class="n">col_names</span><span class="o">.</span><span class="n">extend</span><span class="p">([</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">ref_var</span><span class="si">}</span><span class="s2"> (outcome)&quot;</span><span class="p">]</span> <span class="k">if</span> <span class="n">ref_var</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="k">else</span> <span class="p">[])</span>
+</span><span id="__span-0-1116"><a id="__codelineno-0-1116" name="__codelineno-0-1116"></a>        <span class="n">prepared_log_info_df</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="n">col_names</span>
+</span><span id="__span-0-1117"><a id="__codelineno-0-1117" name="__codelineno-0-1117"></a>        <span class="n">display</span><span class="p">(</span><span class="n">prepared_log_info_df</span><span class="p">)</span>
+</span><span id="__span-0-1118"><a id="__codelineno-0-1118" name="__codelineno-0-1118"></a>
+</span><span id="__span-0-1119"><a id="__codelineno-0-1119" name="__codelineno-0-1119"></a>        <span class="k">return</span> <span class="n">base_var_info_df</span><span class="p">,</span> <span class="n">template_info_df</span><span class="p">,</span> <span class="n">prepared_log_info_df</span>
+</span><span id="__span-0-1120"><a id="__codelineno-0-1120" name="__codelineno-0-1120"></a>
+</span><span id="__span-0-1121"><a id="__codelineno-0-1121" name="__codelineno-0-1121"></a>    <span class="k">def</span> <span class="nf">clear_graph</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">clear_edge_states</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-1122"><a id="__codelineno-0-1122" name="__codelineno-0-1122"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1123"><a id="__codelineno-0-1123" name="__codelineno-0-1123"></a><span class="sd">        Clear the graph and possibly edge states.</span>
+</span><span id="__span-0-1124"><a id="__codelineno-0-1124" name="__codelineno-0-1124"></a>
+</span><span id="__span-0-1125"><a id="__codelineno-0-1125" name="__codelineno-0-1125"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-1126"><a id="__codelineno-0-1126" name="__codelineno-0-1126"></a><span class="sd">            clear_edge_states: Whether to also clear the edge states.</span>
+</span><span id="__span-0-1127"><a id="__codelineno-0-1127" name="__codelineno-0-1127"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1128"><a id="__codelineno-0-1128" name="__codelineno-0-1128"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span> <span class="o">=</span> <span class="n">nx</span><span class="o">.</span><span class="n">DiGraph</span><span class="p">()</span>
+</span><span id="__span-0-1129"><a id="__codelineno-0-1129" name="__codelineno-0-1129"></a>        <span class="k">if</span> <span class="n">clear_edge_states</span><span class="p">:</span>
+</span><span id="__span-0-1130"><a id="__codelineno-0-1130" name="__codelineno-0-1130"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span> <span class="o">=</span> <span class="n">EdgeStateMatrix</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">prepared_variable_names</span><span class="p">)</span>
+</span><span id="__span-0-1131"><a id="__codelineno-0-1131" name="__codelineno-0-1131"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="p">:</span>
+</span><span id="__span-0-1132"><a id="__codelineno-0-1132" name="__codelineno-0-1132"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">clear_graph</span><span class="p">(</span><span class="n">clear_edge_states</span><span class="p">)</span>
+</span><span id="__span-0-1133"><a id="__codelineno-0-1133" name="__codelineno-0-1133"></a>
+</span><span id="__span-0-1134"><a id="__codelineno-0-1134" name="__codelineno-0-1134"></a>    <span class="k">def</span> <span class="nf">display_graph</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-1135"><a id="__codelineno-0-1135" name="__codelineno-0-1135"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1136"><a id="__codelineno-0-1136" name="__codelineno-0-1136"></a><span class="sd">        Display the current graph.</span>
+</span><span id="__span-0-1137"><a id="__codelineno-0-1137" name="__codelineno-0-1137"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1138"><a id="__codelineno-0-1138" name="__codelineno-0-1138"></a>        <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">display_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
+</span><span id="__span-0-1139"><a id="__codelineno-0-1139" name="__codelineno-0-1139"></a>
+</span><span id="__span-0-1140"><a id="__codelineno-0-1140" name="__codelineno-0-1140"></a>    <span class="k">def</span> <span class="nf">save_graph</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filename</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-1141"><a id="__codelineno-0-1141" name="__codelineno-0-1141"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1142"><a id="__codelineno-0-1142" name="__codelineno-0-1142"></a><span class="sd">        Save the current graph to a file.</span>
+</span><span id="__span-0-1143"><a id="__codelineno-0-1143" name="__codelineno-0-1143"></a>
+</span><span id="__span-0-1144"><a id="__codelineno-0-1144" name="__codelineno-0-1144"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-1145"><a id="__codelineno-0-1145" name="__codelineno-0-1145"></a><span class="sd">            filename: The name of the file to save to.</span>
+</span><span id="__span-0-1146"><a id="__codelineno-0-1146" name="__codelineno-0-1146"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1147"><a id="__codelineno-0-1147" name="__codelineno-0-1147"></a>        <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">save_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">filename</span><span class="p">)</span>
+</span><span id="__span-0-1148"><a id="__codelineno-0-1148" name="__codelineno-0-1148"></a>
+</span><span id="__span-0-1149"><a id="__codelineno-0-1149" name="__codelineno-0-1149"></a>    <span class="k">def</span> <span class="nf">accept</span><span class="p">(</span>
+</span><span id="__span-0-1150"><a id="__codelineno-0-1150" name="__codelineno-0-1150"></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-1151"><a id="__codelineno-0-1151" name="__codelineno-0-1151"></a>        <span class="n">src</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-1152"><a id="__codelineno-0-1152" name="__codelineno-0-1152"></a>        <span class="n">dst</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-1153"><a id="__codelineno-0-1153" name="__codelineno-0-1153"></a>        <span class="n">also_fix</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-1154"><a id="__codelineno-0-1154" name="__codelineno-0-1154"></a>        <span class="n">interactive</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="__span-0-1155"><a id="__codelineno-0-1155" name="__codelineno-0-1155"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
+</span><span id="__span-0-1156"><a id="__codelineno-0-1156" name="__codelineno-0-1156"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1157"><a id="__codelineno-0-1157" name="__codelineno-0-1157"></a><span class="sd">        Mark a causal graph edge as accepted.</span>
+</span><span id="__span-0-1158"><a id="__codelineno-0-1158" name="__codelineno-0-1158"></a>
+</span><span id="__span-0-1159"><a id="__codelineno-0-1159" name="__codelineno-0-1159"></a><span class="sd">        This will also reject the edge from `dst` to `src` and remove any other variables with the</span>
+</span><span id="__span-0-1160"><a id="__codelineno-0-1160" name="__codelineno-0-1160"></a><span class="sd">        same base variable as either `src` or `dst` from consideration for the partial causal graph.</span>
+</span><span id="__span-0-1161"><a id="__codelineno-0-1161" name="__codelineno-0-1161"></a>
+</span><span id="__span-0-1162"><a id="__codelineno-0-1162" name="__codelineno-0-1162"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-1163"><a id="__codelineno-0-1163" name="__codelineno-0-1163"></a><span class="sd">            src: The name or tag of the source variable.</span>
+</span><span id="__span-0-1164"><a id="__codelineno-0-1164" name="__codelineno-0-1164"></a><span class="sd">            dst: The name or tag of the destination variable.</span>
+</span><span id="__span-0-1165"><a id="__codelineno-0-1165" name="__codelineno-0-1165"></a><span class="sd">            also_fix: Whether to also fix the edge, for ECCS.</span>
+</span><span id="__span-0-1166"><a id="__codelineno-0-1166" name="__codelineno-0-1166"></a><span class="sd">            interactive: Whether to display the graph interactively after accepting the edge.</span>
+</span><span id="__span-0-1167"><a id="__codelineno-0-1167" name="__codelineno-0-1167"></a>
+</span><span id="__span-0-1168"><a id="__codelineno-0-1168" name="__codelineno-0-1168"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-1169"><a id="__codelineno-0-1169" name="__codelineno-0-1169"></a><span class="sd">            A tuple containing:</span>
+</span><span id="__span-0-1170"><a id="__codelineno-0-1170" name="__codelineno-0-1170"></a><span class="sd">                (1) the exploration score after the edge addition,</span>
+</span><span id="__span-0-1171"><a id="__codelineno-0-1171" name="__codelineno-0-1171"></a><span class="sd">                (2) the max-impact variable to explore next, if any,</span>
+</span><span id="__span-0-1172"><a id="__codelineno-0-1172" name="__codelineno-0-1172"></a><span class="sd">                (3) optionally a string representation of the graph, if `interactive` is False.</span>
+</span><span id="__span-0-1173"><a id="__codelineno-0-1173" name="__codelineno-0-1173"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1174"><a id="__codelineno-0-1174" name="__codelineno-0-1174"></a>
+</span><span id="__span-0-1175"><a id="__codelineno-0-1175" name="__codelineno-0-1175"></a>        <span class="n">src_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">src</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1176"><a id="__codelineno-0-1176" name="__codelineno-0-1176"></a>        <span class="n">dst_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">dst</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1177"><a id="__codelineno-0-1177" name="__codelineno-0-1177"></a>        <span class="n">to_drop</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">mark_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">,</span> <span class="s2">&quot;Accepted&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1178"><a id="__codelineno-0-1178" name="__codelineno-0-1178"></a>        <span class="k">for</span> <span class="n">node</span> <span class="ow">in</span> <span class="n">to_drop</span><span class="p">:</span>
+</span><span id="__span-0-1179"><a id="__codelineno-0-1179" name="__codelineno-0-1179"></a>            <span class="k">if</span> <span class="n">node</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">nodes</span><span class="p">:</span>
+</span><span id="__span-0-1180"><a id="__codelineno-0-1180" name="__codelineno-0-1180"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">remove_node</span><span class="p">(</span><span class="n">node</span><span class="p">)</span>
+</span><span id="__span-0-1181"><a id="__codelineno-0-1181" name="__codelineno-0-1181"></a>
+</span><span id="__span-0-1182"><a id="__codelineno-0-1182" name="__codelineno-0-1182"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">add_node</span><span class="p">(</span><span class="n">src_name</span><span class="p">)</span>
+</span><span id="__span-0-1183"><a id="__codelineno-0-1183" name="__codelineno-0-1183"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">add_node</span><span class="p">(</span><span class="n">dst_name</span><span class="p">)</span>
+</span><span id="__span-0-1184"><a id="__codelineno-0-1184" name="__codelineno-0-1184"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">add_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">)</span>
+</span><span id="__span-0-1185"><a id="__codelineno-0-1185" name="__codelineno-0-1185"></a>        <span class="k">if</span> <span class="p">(</span><span class="n">dst_name</span><span class="p">,</span> <span class="n">src_name</span><span class="p">)</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">edges</span><span class="p">:</span>
+</span><span id="__span-0-1186"><a id="__codelineno-0-1186" name="__codelineno-0-1186"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">remove_edge</span><span class="p">(</span><span class="n">dst_name</span><span class="p">,</span> <span class="n">src_name</span><span class="p">)</span>
+</span><span id="__span-0-1187"><a id="__codelineno-0-1187" name="__codelineno-0-1187"></a>        <span class="k">if</span> <span class="n">interactive</span><span class="p">:</span>
+</span><span id="__span-0-1188"><a id="__codelineno-0-1188" name="__codelineno-0-1188"></a>            <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">display_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
+</span><span id="__span-0-1189"><a id="__codelineno-0-1189" name="__codelineno-0-1189"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="p">:</span>
+</span><span id="__span-0-1190"><a id="__codelineno-0-1190" name="__codelineno-0-1190"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">remove_edge</span><span class="p">(</span><span class="n">dst_name</span><span class="p">,</span> <span class="n">src_name</span><span class="p">)</span>
+</span><span id="__span-0-1191"><a id="__codelineno-0-1191" name="__codelineno-0-1191"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">add_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">)</span>
+</span><span id="__span-0-1192"><a id="__codelineno-0-1192" name="__codelineno-0-1192"></a>            <span class="k">if</span> <span class="n">also_fix</span><span class="p">:</span>
+</span><span id="__span-0-1193"><a id="__codelineno-0-1193" name="__codelineno-0-1193"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">fix_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">)</span>
+</span><span id="__span-0-1194"><a id="__codelineno-0-1194" name="__codelineno-0-1194"></a>
+</span><span id="__span-0-1195"><a id="__codelineno-0-1195" name="__codelineno-0-1195"></a>        <span class="k">return</span> <span class="p">(</span>
+</span><span id="__span-0-1196"><a id="__codelineno-0-1196" name="__codelineno-0-1196"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">exploration_score</span><span class="p">,</span>
+</span><span id="__span-0-1197"><a id="__codelineno-0-1197" name="__codelineno-0-1197"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">suggest_next_exploration</span><span class="p">(),</span>
+</span><span id="__span-0-1198"><a id="__codelineno-0-1198" name="__codelineno-0-1198"></a>            <span class="p">(</span>
+</span><span id="__span-0-1199"><a id="__codelineno-0-1199" name="__codelineno-0-1199"></a>                <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">draw_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
+</span><span id="__span-0-1200"><a id="__codelineno-0-1200" name="__codelineno-0-1200"></a>                <span class="k">if</span> <span class="ow">not</span> <span class="n">interactive</span>
+</span><span id="__span-0-1201"><a id="__codelineno-0-1201" name="__codelineno-0-1201"></a>                <span class="k">else</span> <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-1202"><a id="__codelineno-0-1202" name="__codelineno-0-1202"></a>            <span class="p">),</span>
+</span><span id="__span-0-1203"><a id="__codelineno-0-1203" name="__codelineno-0-1203"></a>        <span class="p">)</span>
+</span><span id="__span-0-1204"><a id="__codelineno-0-1204" name="__codelineno-0-1204"></a>
+</span><span id="__span-0-1205"><a id="__codelineno-0-1205" name="__codelineno-0-1205"></a>    <span class="k">def</span> <span class="nf">reject</span><span class="p">(</span>
+</span><span id="__span-0-1206"><a id="__codelineno-0-1206" name="__codelineno-0-1206"></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-1207"><a id="__codelineno-0-1207" name="__codelineno-0-1207"></a>        <span class="n">src</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-1208"><a id="__codelineno-0-1208" name="__codelineno-0-1208"></a>        <span class="n">dst</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-1209"><a id="__codelineno-0-1209" name="__codelineno-0-1209"></a>        <span class="n">also_ban</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
+</span><span id="__span-0-1210"><a id="__codelineno-0-1210" name="__codelineno-0-1210"></a>        <span class="n">interactive</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="__span-0-1211"><a id="__codelineno-0-1211" name="__codelineno-0-1211"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
+</span><span id="__span-0-1212"><a id="__codelineno-0-1212" name="__codelineno-0-1212"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1213"><a id="__codelineno-0-1213" name="__codelineno-0-1213"></a><span class="sd">        Mark a causal graph edge as rejected.</span>
+</span><span id="__span-0-1214"><a id="__codelineno-0-1214" name="__codelineno-0-1214"></a>
+</span><span id="__span-0-1215"><a id="__codelineno-0-1215" name="__codelineno-0-1215"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-1216"><a id="__codelineno-0-1216" name="__codelineno-0-1216"></a><span class="sd">            src: The name or tag of the source variable.</span>
+</span><span id="__span-0-1217"><a id="__codelineno-0-1217" name="__codelineno-0-1217"></a><span class="sd">            dst: The name or tag of the destination variable.</span>
+</span><span id="__span-0-1218"><a id="__codelineno-0-1218" name="__codelineno-0-1218"></a><span class="sd">            also_ban: Whether to also ban the edge, for ECCS.</span>
+</span><span id="__span-0-1219"><a id="__codelineno-0-1219" name="__codelineno-0-1219"></a><span class="sd">            interactive: Whether to display the graph interactively after rejecting the edge.</span>
+</span><span id="__span-0-1220"><a id="__codelineno-0-1220" name="__codelineno-0-1220"></a>
+</span><span id="__span-0-1221"><a id="__codelineno-0-1221" name="__codelineno-0-1221"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-1222"><a id="__codelineno-0-1222" name="__codelineno-0-1222"></a><span class="sd">            A tuple containing:</span>
+</span><span id="__span-0-1223"><a id="__codelineno-0-1223" name="__codelineno-0-1223"></a><span class="sd">                (1) the exploration score after the edge rejection,</span>
+</span><span id="__span-0-1224"><a id="__codelineno-0-1224" name="__codelineno-0-1224"></a><span class="sd">                (2) the max-impact variable to explore next, if any,</span>
+</span><span id="__span-0-1225"><a id="__codelineno-0-1225" name="__codelineno-0-1225"></a><span class="sd">                (3) optionally a string representation of the graph, if `interactive` is False.</span>
+</span><span id="__span-0-1226"><a id="__codelineno-0-1226" name="__codelineno-0-1226"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1227"><a id="__codelineno-0-1227" name="__codelineno-0-1227"></a>
+</span><span id="__span-0-1228"><a id="__codelineno-0-1228" name="__codelineno-0-1228"></a>        <span class="n">src_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">src</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1229"><a id="__codelineno-0-1229" name="__codelineno-0-1229"></a>        <span class="n">dst_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">dst</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1230"><a id="__codelineno-0-1230" name="__codelineno-0-1230"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">mark_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">,</span> <span class="s2">&quot;Rejected&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1231"><a id="__codelineno-0-1231" name="__codelineno-0-1231"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span> <span class="ow">and</span> <span class="n">also_ban</span><span class="p">:</span>
+</span><span id="__span-0-1232"><a id="__codelineno-0-1232" name="__codelineno-0-1232"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">ban_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">)</span>
+</span><span id="__span-0-1233"><a id="__codelineno-0-1233" name="__codelineno-0-1233"></a>
+</span><span id="__span-0-1234"><a id="__codelineno-0-1234" name="__codelineno-0-1234"></a>        <span class="k">if</span> <span class="n">interactive</span><span class="p">:</span>
+</span><span id="__span-0-1235"><a id="__codelineno-0-1235" name="__codelineno-0-1235"></a>            <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">display_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
+</span><span id="__span-0-1236"><a id="__codelineno-0-1236" name="__codelineno-0-1236"></a>
+</span><span id="__span-0-1237"><a id="__codelineno-0-1237" name="__codelineno-0-1237"></a>        <span class="k">return</span> <span class="p">(</span>
+</span><span id="__span-0-1238"><a id="__codelineno-0-1238" name="__codelineno-0-1238"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">exploration_score</span><span class="p">,</span>
+</span><span id="__span-0-1239"><a id="__codelineno-0-1239" name="__codelineno-0-1239"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">suggest_next_exploration</span><span class="p">(),</span>
+</span><span id="__span-0-1240"><a id="__codelineno-0-1240" name="__codelineno-0-1240"></a>            <span class="p">(</span>
+</span><span id="__span-0-1241"><a id="__codelineno-0-1241" name="__codelineno-0-1241"></a>                <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">draw_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
+</span><span id="__span-0-1242"><a id="__codelineno-0-1242" name="__codelineno-0-1242"></a>                <span class="k">if</span> <span class="ow">not</span> <span class="n">interactive</span>
+</span><span id="__span-0-1243"><a id="__codelineno-0-1243" name="__codelineno-0-1243"></a>                <span class="k">else</span> <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-1244"><a id="__codelineno-0-1244" name="__codelineno-0-1244"></a>            <span class="p">),</span>
+</span><span id="__span-0-1245"><a id="__codelineno-0-1245" name="__codelineno-0-1245"></a>        <span class="p">)</span>
+</span><span id="__span-0-1246"><a id="__codelineno-0-1246" name="__codelineno-0-1246"></a>
+</span><span id="__span-0-1247"><a id="__codelineno-0-1247" name="__codelineno-0-1247"></a>    <span class="k">def</span> <span class="nf">reject_undecided_incoming</span><span class="p">(</span>
+</span><span id="__span-0-1248"><a id="__codelineno-0-1248" name="__codelineno-0-1248"></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">dst</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">also_ban</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span> <span class="n">interactive</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span>
+</span><span id="__span-0-1249"><a id="__codelineno-0-1249" name="__codelineno-0-1249"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
+</span><span id="__span-0-1250"><a id="__codelineno-0-1250" name="__codelineno-0-1250"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1251"><a id="__codelineno-0-1251" name="__codelineno-0-1251"></a><span class="sd">        Mark all undecided incoming edges to a variable as rejected.</span>
+</span><span id="__span-0-1252"><a id="__codelineno-0-1252" name="__codelineno-0-1252"></a>
+</span><span id="__span-0-1253"><a id="__codelineno-0-1253" name="__codelineno-0-1253"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-1254"><a id="__codelineno-0-1254" name="__codelineno-0-1254"></a><span class="sd">            dst: The name or tag of the destination variable.</span>
+</span><span id="__span-0-1255"><a id="__codelineno-0-1255" name="__codelineno-0-1255"></a><span class="sd">            also_ban: Whether to also ban the edges, for ECCS.</span>
+</span><span id="__span-0-1256"><a id="__codelineno-0-1256" name="__codelineno-0-1256"></a><span class="sd">            interactive: Whether to display the graph interactively after rejecting the edges.</span>
+</span><span id="__span-0-1257"><a id="__codelineno-0-1257" name="__codelineno-0-1257"></a>
+</span><span id="__span-0-1258"><a id="__codelineno-0-1258" name="__codelineno-0-1258"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-1259"><a id="__codelineno-0-1259" name="__codelineno-0-1259"></a><span class="sd">            A tuple containing:</span>
+</span><span id="__span-0-1260"><a id="__codelineno-0-1260" name="__codelineno-0-1260"></a><span class="sd">                (1) the exploration score after the edge rejections,</span>
+</span><span id="__span-0-1261"><a id="__codelineno-0-1261" name="__codelineno-0-1261"></a><span class="sd">                (2) the max-impact variable to explore next, if any,</span>
+</span><span id="__span-0-1262"><a id="__codelineno-0-1262" name="__codelineno-0-1262"></a><span class="sd">                (3) optionally a string representation of the graph, if `interactive` is False.</span>
+</span><span id="__span-0-1263"><a id="__codelineno-0-1263" name="__codelineno-0-1263"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1264"><a id="__codelineno-0-1264" name="__codelineno-0-1264"></a>        <span class="n">dst_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">dst</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1265"><a id="__codelineno-0-1265" name="__codelineno-0-1265"></a>        <span class="k">for</span> <span class="n">v</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variable_names</span><span class="p">:</span>
+</span><span id="__span-0-1266"><a id="__codelineno-0-1266" name="__codelineno-0-1266"></a>            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">get_edge_state</span><span class="p">(</span><span class="n">v</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">)</span> <span class="o">==</span> <span class="s2">&quot;Undecided&quot;</span><span class="p">:</span>
+</span><span id="__span-0-1267"><a id="__codelineno-0-1267" name="__codelineno-0-1267"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">mark_edge</span><span class="p">(</span><span class="n">v</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">,</span> <span class="s2">&quot;Rejected&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1268"><a id="__codelineno-0-1268" name="__codelineno-0-1268"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span> <span class="ow">and</span> <span class="n">also_ban</span><span class="p">:</span>
+</span><span id="__span-0-1269"><a id="__codelineno-0-1269" name="__codelineno-0-1269"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">ban_edge</span><span class="p">(</span><span class="n">v</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">)</span>
+</span><span id="__span-0-1270"><a id="__codelineno-0-1270" name="__codelineno-0-1270"></a>
+</span><span id="__span-0-1271"><a id="__codelineno-0-1271" name="__codelineno-0-1271"></a>        <span class="k">if</span> <span class="n">interactive</span><span class="p">:</span>
+</span><span id="__span-0-1272"><a id="__codelineno-0-1272" name="__codelineno-0-1272"></a>            <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">display_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
+</span><span id="__span-0-1273"><a id="__codelineno-0-1273" name="__codelineno-0-1273"></a>
+</span><span id="__span-0-1274"><a id="__codelineno-0-1274" name="__codelineno-0-1274"></a>        <span class="k">return</span> <span class="p">(</span>
+</span><span id="__span-0-1275"><a id="__codelineno-0-1275" name="__codelineno-0-1275"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">exploration_score</span><span class="p">,</span>
+</span><span id="__span-0-1276"><a id="__codelineno-0-1276" name="__codelineno-0-1276"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">suggest_next_exploration</span><span class="p">(),</span>
+</span><span id="__span-0-1277"><a id="__codelineno-0-1277" name="__codelineno-0-1277"></a>            <span class="p">(</span>
+</span><span id="__span-0-1278"><a id="__codelineno-0-1278" name="__codelineno-0-1278"></a>                <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">draw_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
+</span><span id="__span-0-1279"><a id="__codelineno-0-1279" name="__codelineno-0-1279"></a>                <span class="k">if</span> <span class="ow">not</span> <span class="n">interactive</span>
+</span><span id="__span-0-1280"><a id="__codelineno-0-1280" name="__codelineno-0-1280"></a>                <span class="k">else</span> <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-1281"><a id="__codelineno-0-1281" name="__codelineno-0-1281"></a>            <span class="p">),</span>
+</span><span id="__span-0-1282"><a id="__codelineno-0-1282" name="__codelineno-0-1282"></a>        <span class="p">)</span>
+</span><span id="__span-0-1283"><a id="__codelineno-0-1283" name="__codelineno-0-1283"></a>
+</span><span id="__span-0-1284"><a id="__codelineno-0-1284" name="__codelineno-0-1284"></a>    <span class="k">def</span> <span class="nf">reject_undecided_outgoing</span><span class="p">(</span>
+</span><span id="__span-0-1285"><a id="__codelineno-0-1285" name="__codelineno-0-1285"></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">src</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">also_ban</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span> <span class="n">interactive</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span>
+</span><span id="__span-0-1286"><a id="__codelineno-0-1286" name="__codelineno-0-1286"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
+</span><span id="__span-0-1287"><a id="__codelineno-0-1287" name="__codelineno-0-1287"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1288"><a id="__codelineno-0-1288" name="__codelineno-0-1288"></a><span class="sd">        Mark all undecided outgoing edges from a variable as rejected.</span>
+</span><span id="__span-0-1289"><a id="__codelineno-0-1289" name="__codelineno-0-1289"></a>
+</span><span id="__span-0-1290"><a id="__codelineno-0-1290" name="__codelineno-0-1290"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-1291"><a id="__codelineno-0-1291" name="__codelineno-0-1291"></a><span class="sd">            src: The name or tag of the source variable.</span>
+</span><span id="__span-0-1292"><a id="__codelineno-0-1292" name="__codelineno-0-1292"></a><span class="sd">            also_ban: Whether to also ban the edges, for ECCS.</span>
+</span><span id="__span-0-1293"><a id="__codelineno-0-1293" name="__codelineno-0-1293"></a><span class="sd">            interactive: Whether to display the graph interactively after rejecting the edges.</span>
+</span><span id="__span-0-1294"><a id="__codelineno-0-1294" name="__codelineno-0-1294"></a>
+</span><span id="__span-0-1295"><a id="__codelineno-0-1295" name="__codelineno-0-1295"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-1296"><a id="__codelineno-0-1296" name="__codelineno-0-1296"></a><span class="sd">            A tuple containing:</span>
+</span><span id="__span-0-1297"><a id="__codelineno-0-1297" name="__codelineno-0-1297"></a><span class="sd">                (1) the exploration score after the edge rejections,</span>
+</span><span id="__span-0-1298"><a id="__codelineno-0-1298" name="__codelineno-0-1298"></a><span class="sd">                (2) the max-impact variable to explore next, if any,</span>
+</span><span id="__span-0-1299"><a id="__codelineno-0-1299" name="__codelineno-0-1299"></a><span class="sd">                (3) optionally a string representation of the graph, if `interactive` is False.</span>
+</span><span id="__span-0-1300"><a id="__codelineno-0-1300" name="__codelineno-0-1300"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1301"><a id="__codelineno-0-1301" name="__codelineno-0-1301"></a>        <span class="n">src_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">src</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1302"><a id="__codelineno-0-1302" name="__codelineno-0-1302"></a>        <span class="k">for</span> <span class="n">v</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variable_names</span><span class="p">:</span>
+</span><span id="__span-0-1303"><a id="__codelineno-0-1303" name="__codelineno-0-1303"></a>            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">get_edge_state</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">v</span><span class="p">)</span> <span class="o">==</span> <span class="s2">&quot;Undecided&quot;</span><span class="p">:</span>
+</span><span id="__span-0-1304"><a id="__codelineno-0-1304" name="__codelineno-0-1304"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">mark_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">v</span><span class="p">,</span> <span class="s2">&quot;Rejected&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1305"><a id="__codelineno-0-1305" name="__codelineno-0-1305"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span> <span class="ow">and</span> <span class="n">also_ban</span><span class="p">:</span>
+</span><span id="__span-0-1306"><a id="__codelineno-0-1306" name="__codelineno-0-1306"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">ban_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">v</span><span class="p">)</span>
+</span><span id="__span-0-1307"><a id="__codelineno-0-1307" name="__codelineno-0-1307"></a>
+</span><span id="__span-0-1308"><a id="__codelineno-0-1308" name="__codelineno-0-1308"></a>        <span class="k">if</span> <span class="n">interactive</span><span class="p">:</span>
+</span><span id="__span-0-1309"><a id="__codelineno-0-1309" name="__codelineno-0-1309"></a>            <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">display_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
+</span><span id="__span-0-1310"><a id="__codelineno-0-1310" name="__codelineno-0-1310"></a>
+</span><span id="__span-0-1311"><a id="__codelineno-0-1311" name="__codelineno-0-1311"></a>        <span class="k">return</span> <span class="p">(</span>
+</span><span id="__span-0-1312"><a id="__codelineno-0-1312" name="__codelineno-0-1312"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">exploration_score</span><span class="p">,</span>
+</span><span id="__span-0-1313"><a id="__codelineno-0-1313" name="__codelineno-0-1313"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">suggest_next_exploration</span><span class="p">(),</span>
+</span><span id="__span-0-1314"><a id="__codelineno-0-1314" name="__codelineno-0-1314"></a>            <span class="p">(</span>
+</span><span id="__span-0-1315"><a id="__codelineno-0-1315" name="__codelineno-0-1315"></a>                <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">draw_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
+</span><span id="__span-0-1316"><a id="__codelineno-0-1316" name="__codelineno-0-1316"></a>                <span class="k">if</span> <span class="ow">not</span> <span class="n">interactive</span>
+</span><span id="__span-0-1317"><a id="__codelineno-0-1317" name="__codelineno-0-1317"></a>                <span class="k">else</span> <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-1318"><a id="__codelineno-0-1318" name="__codelineno-0-1318"></a>            <span class="p">),</span>
+</span><span id="__span-0-1319"><a id="__codelineno-0-1319" name="__codelineno-0-1319"></a>        <span class="p">)</span>
+</span><span id="__span-0-1320"><a id="__codelineno-0-1320" name="__codelineno-0-1320"></a>
+</span><span id="__span-0-1321"><a id="__codelineno-0-1321" name="__codelineno-0-1321"></a>    <span class="k">def</span> <span class="nf">reject_all_prunable_edges</span><span class="p">(</span>
+</span><span id="__span-0-1322"><a id="__codelineno-0-1322" name="__codelineno-0-1322"></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-1323"><a id="__codelineno-0-1323" name="__codelineno-0-1323"></a>        <span class="n">also_ban</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
+</span><span id="__span-0-1324"><a id="__codelineno-0-1324" name="__codelineno-0-1324"></a>        <span class="n">lasso_alpha</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="n">Pruner</span><span class="o">.</span><span class="n">LASSO_DEFAULT_ALPHA</span><span class="p">,</span>
+</span><span id="__span-0-1325"><a id="__codelineno-0-1325" name="__codelineno-0-1325"></a>        <span class="n">lasso_max_iter</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="n">Pruner</span><span class="o">.</span><span class="n">LASSO_DEFAULT_MAX_ITER</span><span class="p">,</span>
+</span><span id="__span-0-1326"><a id="__codelineno-0-1326" name="__codelineno-0-1326"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
+</span><span id="__span-0-1327"><a id="__codelineno-0-1327" name="__codelineno-0-1327"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1328"><a id="__codelineno-0-1328" name="__codelineno-0-1328"></a><span class="sd">        For every prepared variable, reject all incoming edges that start at a variable</span>
+</span><span id="__span-0-1329"><a id="__codelineno-0-1329" name="__codelineno-0-1329"></a><span class="sd">        that is pruned by our pruning approach. This may be time-consuming depending on the number of variables.</span>
+</span><span id="__span-0-1330"><a id="__codelineno-0-1330" name="__codelineno-0-1330"></a>
+</span><span id="__span-0-1331"><a id="__codelineno-0-1331" name="__codelineno-0-1331"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-1332"><a id="__codelineno-0-1332" name="__codelineno-0-1332"></a><span class="sd">            also_ban: Whether to also ban the edges, for ECCS.</span>
+</span><span id="__span-0-1333"><a id="__codelineno-0-1333" name="__codelineno-0-1333"></a><span class="sd">            lasso_alpha: The alpha parameter to be used for Lasso regression.</span>
+</span><span id="__span-0-1334"><a id="__codelineno-0-1334" name="__codelineno-0-1334"></a><span class="sd">            lasso_max_iter: The maximum number of iterations to be used for Lasso regression.</span>
+</span><span id="__span-0-1335"><a id="__codelineno-0-1335" name="__codelineno-0-1335"></a>
+</span><span id="__span-0-1336"><a id="__codelineno-0-1336" name="__codelineno-0-1336"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-1337"><a id="__codelineno-0-1337" name="__codelineno-0-1337"></a><span class="sd">            A tuple containing:</span>
+</span><span id="__span-0-1338"><a id="__codelineno-0-1338" name="__codelineno-0-1338"></a><span class="sd">                (1) the exploration score after the edge rejections,</span>
+</span><span id="__span-0-1339"><a id="__codelineno-0-1339" name="__codelineno-0-1339"></a><span class="sd">                (2) the max-impact variable to explore next, if any,</span>
+</span><span id="__span-0-1340"><a id="__codelineno-0-1340" name="__codelineno-0-1340"></a><span class="sd">                (3) optionally a string representation of the graph, if `interactive` is False.</span>
+</span><span id="__span-0-1341"><a id="__codelineno-0-1341" name="__codelineno-0-1341"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1342"><a id="__codelineno-0-1342" name="__codelineno-0-1342"></a>        <span class="n">num_processors</span> <span class="o">=</span> <span class="n">multiprocessing</span><span class="o">.</span><span class="n">cpu_count</span><span class="p">()</span>
+</span><span id="__span-0-1343"><a id="__codelineno-0-1343" name="__codelineno-0-1343"></a>        <span class="k">with</span> <span class="n">multiprocessing</span><span class="o">.</span><span class="n">Pool</span><span class="p">(</span><span class="n">processes</span><span class="o">=</span><span class="n">num_processors</span><span class="p">)</span> <span class="k">as</span> <span class="n">pool</span><span class="p">:</span>
+</span><span id="__span-0-1344"><a id="__codelineno-0-1344" name="__codelineno-0-1344"></a>            <span class="n">all_candidates</span> <span class="o">=</span> <span class="n">pool</span><span class="o">.</span><span class="n">starmap</span><span class="p">(</span>
+</span><span id="__span-0-1345"><a id="__codelineno-0-1345" name="__codelineno-0-1345"></a>                <span class="n">Pruner</span><span class="o">.</span><span class="n">prune_with_lasso</span><span class="p">,</span>
+</span><span id="__span-0-1346"><a id="__codelineno-0-1346" name="__codelineno-0-1346"></a>                <span class="n">tqdm</span><span class="p">(</span>
+</span><span id="__span-0-1347"><a id="__codelineno-0-1347" name="__codelineno-0-1347"></a>                    <span class="p">[</span>
+</span><span id="__span-0-1348"><a id="__codelineno-0-1348" name="__codelineno-0-1348"></a>                        <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span> <span class="p">[</span><span class="n">target</span><span class="p">],</span> <span class="n">lasso_alpha</span><span class="p">,</span> <span class="n">lasso_max_iter</span><span class="p">)</span>
+</span><span id="__span-0-1349"><a id="__codelineno-0-1349" name="__codelineno-0-1349"></a>                        <span class="k">for</span> <span class="n">target</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variable_names</span>
+</span><span id="__span-0-1350"><a id="__codelineno-0-1350" name="__codelineno-0-1350"></a>                    <span class="p">],</span>
+</span><span id="__span-0-1351"><a id="__codelineno-0-1351" name="__codelineno-0-1351"></a>                    <span class="n">total</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">num_prepared_variables</span><span class="p">,</span>
+</span><span id="__span-0-1352"><a id="__codelineno-0-1352" name="__codelineno-0-1352"></a>                    <span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Finding pruned variables...&quot;</span><span class="p">,</span>
+</span><span id="__span-0-1353"><a id="__codelineno-0-1353" name="__codelineno-0-1353"></a>                <span class="p">),</span>
+</span><span id="__span-0-1354"><a id="__codelineno-0-1354" name="__codelineno-0-1354"></a>            <span class="p">)</span>
+</span><span id="__span-0-1355"><a id="__codelineno-0-1355" name="__codelineno-0-1355"></a>
+</span><span id="__span-0-1356"><a id="__codelineno-0-1356" name="__codelineno-0-1356"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="n">all_candidates</span><span class="p">)</span>
+</span><span id="__span-0-1357"><a id="__codelineno-0-1357" name="__codelineno-0-1357"></a>
+</span><span id="__span-0-1358"><a id="__codelineno-0-1358" name="__codelineno-0-1358"></a>        <span class="k">for</span> <span class="n">candidates</span><span class="p">,</span> <span class="n">target</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">all_candidates</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variable_names</span><span class="p">):</span>
+</span><span id="__span-0-1359"><a id="__codelineno-0-1359" name="__codelineno-0-1359"></a>            <span class="n">non_candidates</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-1360"><a id="__codelineno-0-1360" name="__codelineno-0-1360"></a>                <span class="nb">set</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span><span class="p">)</span> <span class="o">-</span> <span class="nb">set</span><span class="p">(</span><span class="n">candidates</span><span class="p">)</span> <span class="o">-</span> <span class="nb">set</span><span class="p">([</span><span class="n">target</span><span class="p">])</span>
+</span><span id="__span-0-1361"><a id="__codelineno-0-1361" name="__codelineno-0-1361"></a>            <span class="p">)</span>
+</span><span id="__span-0-1362"><a id="__codelineno-0-1362" name="__codelineno-0-1362"></a>            <span class="k">for</span> <span class="n">nc</span> <span class="ow">in</span> <span class="n">non_candidates</span><span class="p">:</span>
+</span><span id="__span-0-1363"><a id="__codelineno-0-1363" name="__codelineno-0-1363"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">mark_edge</span><span class="p">(</span><span class="n">nc</span><span class="p">,</span> <span class="n">target</span><span class="p">,</span> <span class="s2">&quot;Rejected&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1364"><a id="__codelineno-0-1364" name="__codelineno-0-1364"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span> <span class="ow">and</span> <span class="n">also_ban</span><span class="p">:</span>
+</span><span id="__span-0-1365"><a id="__codelineno-0-1365" name="__codelineno-0-1365"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">ban_edge</span><span class="p">(</span><span class="n">nc</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>
 </span><span id="__span-0-1366"><a id="__codelineno-0-1366" name="__codelineno-0-1366"></a>
-</span><span id="__span-0-1367"><a id="__codelineno-0-1367" name="__codelineno-0-1367"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-1368"><a id="__codelineno-0-1368" name="__codelineno-0-1368"></a><span class="sd">            The exploration score of the current partial causal graph.</span>
-</span><span id="__span-0-1369"><a id="__codelineno-0-1369" name="__codelineno-0-1369"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1370"><a id="__codelineno-0-1370" name="__codelineno-0-1370"></a>        <span class="c1"># Number of edges incident to a node in the current partial graph</span>
-</span><span id="__span-0-1371"><a id="__codelineno-0-1371" name="__codelineno-0-1371"></a>        <span class="n">M</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">number_of_nodes</span><span class="p">()</span>
-</span><span id="__span-0-1372"><a id="__codelineno-0-1372" name="__codelineno-0-1372"></a>        <span class="n">N</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">num_prepared_variables</span>
-</span><span id="__span-0-1373"><a id="__codelineno-0-1373" name="__codelineno-0-1373"></a>        <span class="n">incident</span> <span class="o">=</span> <span class="n">M</span> <span class="o">*</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="n">N</span> <span class="o">-</span> <span class="n">M</span> <span class="o">-</span> <span class="mi">1</span><span class="p">)</span>
-</span><span id="__span-0-1374"><a id="__codelineno-0-1374" name="__codelineno-0-1374"></a>        <span class="k">if</span> <span class="n">incident</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-1375"><a id="__codelineno-0-1375" name="__codelineno-0-1375"></a>            <span class="k">return</span> <span class="mi">0</span>
-</span><span id="__span-0-1376"><a id="__codelineno-0-1376" name="__codelineno-0-1376"></a>
-</span><span id="__span-0-1377"><a id="__codelineno-0-1377" name="__codelineno-0-1377"></a>        <span class="c1"># Number of edges among the incident that have been considered</span>
-</span><span id="__span-0-1378"><a id="__codelineno-0-1378" name="__codelineno-0-1378"></a>        <span class="n">graph_var_indices</span> <span class="o">=</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">idx</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="nb">list</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">nodes</span><span class="p">)]</span>
-</span><span id="__span-0-1379"><a id="__codelineno-0-1379" name="__codelineno-0-1379"></a>        <span class="n">other_indices</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">setdiff1d</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="n">N</span><span class="p">),</span> <span class="n">graph_var_indices</span><span class="p">))</span>
-</span><span id="__span-0-1380"><a id="__codelineno-0-1380" name="__codelineno-0-1380"></a>        <span class="n">considered</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span>
-</span><span id="__span-0-1381"><a id="__codelineno-0-1381" name="__codelineno-0-1381"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">m</span><span class="p">[</span><span class="n">graph_var_indices</span><span class="p">][:,</span> <span class="n">graph_var_indices</span><span class="p">]</span> <span class="o">!=</span> <span class="mi">0</span>
-</span><span id="__span-0-1382"><a id="__codelineno-0-1382" name="__codelineno-0-1382"></a>        <span class="p">)</span>
-</span><span id="__span-0-1383"><a id="__codelineno-0-1383" name="__codelineno-0-1383"></a>        <span class="n">considered</span> <span class="o">-=</span> <span class="n">M</span>  <span class="c1"># subtract self-edges</span>
-</span><span id="__span-0-1384"><a id="__codelineno-0-1384" name="__codelineno-0-1384"></a>        <span class="n">considered</span> <span class="o">+=</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span>
-</span><span id="__span-0-1385"><a id="__codelineno-0-1385" name="__codelineno-0-1385"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">m</span><span class="p">[</span><span class="n">graph_var_indices</span><span class="p">][:,</span> <span class="n">other_indices</span><span class="p">]</span> <span class="o">!=</span> <span class="mi">0</span>
-</span><span id="__span-0-1386"><a id="__codelineno-0-1386" name="__codelineno-0-1386"></a>        <span class="p">)</span>
-</span><span id="__span-0-1387"><a id="__codelineno-0-1387" name="__codelineno-0-1387"></a>        <span class="n">considered</span> <span class="o">+=</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span>
-</span><span id="__span-0-1388"><a id="__codelineno-0-1388" name="__codelineno-0-1388"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">m</span><span class="p">[</span><span class="n">other_indices</span><span class="p">][:,</span> <span class="n">graph_var_indices</span><span class="p">]</span> <span class="o">!=</span> <span class="mi">0</span>
-</span><span id="__span-0-1389"><a id="__codelineno-0-1389" name="__codelineno-0-1389"></a>        <span class="p">)</span>
-</span><span id="__span-0-1390"><a id="__codelineno-0-1390" name="__codelineno-0-1390"></a>
-</span><span id="__span-0-1391"><a id="__codelineno-0-1391" name="__codelineno-0-1391"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Considered: </span><span class="si">{</span><span class="n">considered</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1392"><a id="__codelineno-0-1392" name="__codelineno-0-1392"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Incident: </span><span class="si">{</span><span class="n">incident</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1393"><a id="__codelineno-0-1393" name="__codelineno-0-1393"></a>
-</span><span id="__span-0-1394"><a id="__codelineno-0-1394" name="__codelineno-0-1394"></a>        <span class="k">return</span> <span class="n">considered</span> <span class="o">/</span> <span class="n">incident</span>
-</span><span id="__span-0-1395"><a id="__codelineno-0-1395" name="__codelineno-0-1395"></a>
-</span><span id="__span-0-1396"><a id="__codelineno-0-1396" name="__codelineno-0-1396"></a>    <span class="k">def</span> <span class="nf">rank_candidate_causes</span><span class="p">(</span>
-</span><span id="__span-0-1397"><a id="__codelineno-0-1397" name="__codelineno-0-1397"></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-1398"><a id="__codelineno-0-1398" name="__codelineno-0-1398"></a>        <span class="n">target</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-1399"><a id="__codelineno-0-1399" name="__codelineno-0-1399"></a>        <span class="n">ignore</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">List</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-1400"><a id="__codelineno-0-1400" name="__codelineno-0-1400"></a>        <span class="n">method</span><span class="p">:</span> <span class="n">CandidateCauseRankerMethod</span> <span class="o">=</span> <span class="n">CandidateCauseRankerMethod</span><span class="o">.</span><span class="n">LOGOS</span><span class="p">,</span>
-</span><span id="__span-0-1401"><a id="__codelineno-0-1401" name="__codelineno-0-1401"></a>        <span class="n">prune_candidates</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="__span-0-1402"><a id="__codelineno-0-1402" name="__codelineno-0-1402"></a>        <span class="n">lasso_alpha</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="n">Pruner</span><span class="o">.</span><span class="n">LASSO_DEFAULT_ALPHA</span><span class="p">,</span>
-</span><span id="__span-0-1403"><a id="__codelineno-0-1403" name="__codelineno-0-1403"></a>        <span class="n">lasso_max_iter</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="n">Pruner</span><span class="o">.</span><span class="n">LASSO_DEFAULT_MAX_ITER</span><span class="p">,</span>
-</span><span id="__span-0-1404"><a id="__codelineno-0-1404" name="__codelineno-0-1404"></a>        <span class="n">model</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;gpt-4o-mini-2024-07-18&quot;</span><span class="p">,</span>
-</span><span id="__span-0-1405"><a id="__codelineno-0-1405" name="__codelineno-0-1405"></a>        <span class="n">gpt_log_path</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-1406"><a id="__codelineno-0-1406" name="__codelineno-0-1406"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="nb">str</span><span class="p">]:</span>
-</span><span id="__span-0-1407"><a id="__codelineno-0-1407" name="__codelineno-0-1407"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1408"><a id="__codelineno-0-1408" name="__codelineno-0-1408"></a><span class="sd">        Present the user with ranked candidate causes for `target`. If no `target`</span>
-</span><span id="__span-0-1409"><a id="__codelineno-0-1409" name="__codelineno-0-1409"></a><span class="sd">        is specified, the most recent suggestion of `suggest_next_exploration()` is used, if any.</span>
-</span><span id="__span-0-1410"><a id="__codelineno-0-1410" name="__codelineno-0-1410"></a><span class="sd">        If `ignore` is specified, the variables in `ignore` are not considered as candidate causes.</span>
-</span><span id="__span-0-1411"><a id="__codelineno-0-1411" name="__codelineno-0-1411"></a>
-</span><span id="__span-0-1412"><a id="__codelineno-0-1412" name="__codelineno-0-1412"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-1413"><a id="__codelineno-0-1413" name="__codelineno-0-1413"></a><span class="sd">            target: The name or tag of the target variable.</span>
-</span><span id="__span-0-1414"><a id="__codelineno-0-1414" name="__codelineno-0-1414"></a><span class="sd">            ignore: A list of variables to ignore.</span>
-</span><span id="__span-0-1415"><a id="__codelineno-0-1415" name="__codelineno-0-1415"></a><span class="sd">            method: The method to use for ranking candidate causes.</span>
-</span><span id="__span-0-1416"><a id="__codelineno-0-1416" name="__codelineno-0-1416"></a><span class="sd">            prune_candidates: Whether to prune the candidate causes using Lasso regression. Only</span>
-</span><span id="__span-0-1417"><a id="__codelineno-0-1417" name="__codelineno-0-1417"></a><span class="sd">                applies if `method` is `CandidateCauseRankerMethod.LOGOS`.</span>
-</span><span id="__span-0-1418"><a id="__codelineno-0-1418" name="__codelineno-0-1418"></a><span class="sd">            lasso_alpha: The alpha parameter to be used for Lasso regression. Only applies if</span>
-</span><span id="__span-0-1419"><a id="__codelineno-0-1419" name="__codelineno-0-1419"></a><span class="sd">                `method` is `CandidateCauseRankerMethod.LOGOS` and `prune_candidates` is True.</span>
-</span><span id="__span-0-1420"><a id="__codelineno-0-1420" name="__codelineno-0-1420"></a><span class="sd">            lasso_max_iter: The maximum number of iterations to be used for Lasso regression. Only</span>
-</span><span id="__span-0-1421"><a id="__codelineno-0-1421" name="__codelineno-0-1421"></a><span class="sd">                applies if `method` is `CandidateCauseRankerMethod.LOGOS` and `prune_candidates` is True.</span>
-</span><span id="__span-0-1422"><a id="__codelineno-0-1422" name="__codelineno-0-1422"></a><span class="sd">            model: The model to use for the langmodel method. Only applies if the method is</span>
-</span><span id="__span-0-1423"><a id="__codelineno-0-1423" name="__codelineno-0-1423"></a><span class="sd">                `CandidateCauseRankerMethod.LANGMODEL`.</span>
-</span><span id="__span-0-1424"><a id="__codelineno-0-1424" name="__codelineno-0-1424"></a><span class="sd">            gpt_log_path: The path to the log file to use for the langmodel method. Only applies if</span>
-</span><span id="__span-0-1425"><a id="__codelineno-0-1425" name="__codelineno-0-1425"></a><span class="sd">                the method is `CandidateCauseRankerMethod.LANGMODEL`.</span>
-</span><span id="__span-0-1426"><a id="__codelineno-0-1426" name="__codelineno-0-1426"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-1427"><a id="__codelineno-0-1427" name="__codelineno-0-1427"></a><span class="sd">            A tuple containing:</span>
-</span><span id="__span-0-1428"><a id="__codelineno-0-1428" name="__codelineno-0-1428"></a><span class="sd">            (1) A dataframe containing the candidate causes for `target` and</span>
-</span><span id="__span-0-1429"><a id="__codelineno-0-1429" name="__codelineno-0-1429"></a><span class="sd">            (2) The time elapsed for exploration, as a string.</span>
-</span><span id="__span-0-1430"><a id="__codelineno-0-1430" name="__codelineno-0-1430"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1431"><a id="__codelineno-0-1431" name="__codelineno-0-1431"></a>
-</span><span id="__span-0-1432"><a id="__codelineno-0-1432" name="__codelineno-0-1432"></a>        <span class="n">start_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
-</span><span id="__span-0-1433"><a id="__codelineno-0-1433" name="__codelineno-0-1433"></a>
-</span><span id="__span-0-1434"><a id="__codelineno-0-1434" name="__codelineno-0-1434"></a>        <span class="c1"># Handle the case where the user has not specified a target.</span>
-</span><span id="__span-0-1435"><a id="__codelineno-0-1435" name="__codelineno-0-1435"></a>        <span class="k">if</span> <span class="n">target</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-1436"><a id="__codelineno-0-1436" name="__codelineno-0-1436"></a>            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;No target specified.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1437"><a id="__codelineno-0-1437" name="__codelineno-0-1437"></a>            <span class="k">return</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">columns</span><span class="o">=</span><span class="n">CandidateCauseRanker</span><span class="o">.</span><span class="n">COLUMN_ORDER</span><span class="p">),</span> <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-1438"><a id="__codelineno-0-1438" name="__codelineno-0-1438"></a>        <span class="k">elif</span> <span class="n">target</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-1439"><a id="__codelineno-0-1439" name="__codelineno-0-1439"></a>            <span class="n">target</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span>
-</span><span id="__span-0-1440"><a id="__codelineno-0-1440" name="__codelineno-0-1440"></a>
-</span><span id="__span-0-1441"><a id="__codelineno-0-1441" name="__codelineno-0-1441"></a>        <span class="c1"># If the user provided the target as a tag, retrieve its name</span>
-</span><span id="__span-0-1442"><a id="__codelineno-0-1442" name="__codelineno-0-1442"></a>        <span class="n">target</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">target</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1367"><a id="__codelineno-0-1367" name="__codelineno-0-1367"></a>        <span class="k">return</span> <span class="p">(</span>
+</span><span id="__span-0-1368"><a id="__codelineno-0-1368" name="__codelineno-0-1368"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">exploration_score</span><span class="p">,</span>
+</span><span id="__span-0-1369"><a id="__codelineno-0-1369" name="__codelineno-0-1369"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">suggest_next_exploration</span><span class="p">(),</span>
+</span><span id="__span-0-1370"><a id="__codelineno-0-1370" name="__codelineno-0-1370"></a>            <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">draw_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">),</span>
+</span><span id="__span-0-1371"><a id="__codelineno-0-1371" name="__codelineno-0-1371"></a>        <span class="p">)</span>
+</span><span id="__span-0-1372"><a id="__codelineno-0-1372" name="__codelineno-0-1372"></a>
+</span><span id="__span-0-1373"><a id="__codelineno-0-1373" name="__codelineno-0-1373"></a>    <span class="nd">@property</span>
+</span><span id="__span-0-1374"><a id="__codelineno-0-1374" name="__codelineno-0-1374"></a>    <span class="k">def</span> <span class="nf">exploration_score</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
+</span><span id="__span-0-1375"><a id="__codelineno-0-1375" name="__codelineno-0-1375"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1376"><a id="__codelineno-0-1376" name="__codelineno-0-1376"></a><span class="sd">        Calculate the exploration score of the current partial causal graph,</span>
+</span><span id="__span-0-1377"><a id="__codelineno-0-1377" name="__codelineno-0-1377"></a><span class="sd">        based on the edge state matrix.</span>
+</span><span id="__span-0-1378"><a id="__codelineno-0-1378" name="__codelineno-0-1378"></a>
+</span><span id="__span-0-1379"><a id="__codelineno-0-1379" name="__codelineno-0-1379"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-1380"><a id="__codelineno-0-1380" name="__codelineno-0-1380"></a><span class="sd">            The exploration score of the current partial causal graph.</span>
+</span><span id="__span-0-1381"><a id="__codelineno-0-1381" name="__codelineno-0-1381"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1382"><a id="__codelineno-0-1382" name="__codelineno-0-1382"></a>        <span class="c1"># Number of edges incident to a node in the current partial graph</span>
+</span><span id="__span-0-1383"><a id="__codelineno-0-1383" name="__codelineno-0-1383"></a>        <span class="n">M</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">number_of_nodes</span><span class="p">()</span>
+</span><span id="__span-0-1384"><a id="__codelineno-0-1384" name="__codelineno-0-1384"></a>        <span class="n">N</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">num_prepared_variables</span>
+</span><span id="__span-0-1385"><a id="__codelineno-0-1385" name="__codelineno-0-1385"></a>        <span class="n">incident</span> <span class="o">=</span> <span class="n">M</span> <span class="o">*</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="n">N</span> <span class="o">-</span> <span class="n">M</span> <span class="o">-</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="__span-0-1386"><a id="__codelineno-0-1386" name="__codelineno-0-1386"></a>        <span class="k">if</span> <span class="n">incident</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-1387"><a id="__codelineno-0-1387" name="__codelineno-0-1387"></a>            <span class="k">return</span> <span class="mi">0</span>
+</span><span id="__span-0-1388"><a id="__codelineno-0-1388" name="__codelineno-0-1388"></a>
+</span><span id="__span-0-1389"><a id="__codelineno-0-1389" name="__codelineno-0-1389"></a>        <span class="c1"># Number of edges among the incident that have been considered</span>
+</span><span id="__span-0-1390"><a id="__codelineno-0-1390" name="__codelineno-0-1390"></a>        <span class="n">graph_var_indices</span> <span class="o">=</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">idx</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="nb">list</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">nodes</span><span class="p">)]</span>
+</span><span id="__span-0-1391"><a id="__codelineno-0-1391" name="__codelineno-0-1391"></a>        <span class="n">other_indices</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">setdiff1d</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="n">N</span><span class="p">),</span> <span class="n">graph_var_indices</span><span class="p">))</span>
+</span><span id="__span-0-1392"><a id="__codelineno-0-1392" name="__codelineno-0-1392"></a>        <span class="n">considered</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span>
+</span><span id="__span-0-1393"><a id="__codelineno-0-1393" name="__codelineno-0-1393"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">m</span><span class="p">[</span><span class="n">graph_var_indices</span><span class="p">][:,</span> <span class="n">graph_var_indices</span><span class="p">]</span> <span class="o">!=</span> <span class="mi">0</span>
+</span><span id="__span-0-1394"><a id="__codelineno-0-1394" name="__codelineno-0-1394"></a>        <span class="p">)</span>
+</span><span id="__span-0-1395"><a id="__codelineno-0-1395" name="__codelineno-0-1395"></a>        <span class="n">considered</span> <span class="o">-=</span> <span class="n">M</span>  <span class="c1"># subtract self-edges</span>
+</span><span id="__span-0-1396"><a id="__codelineno-0-1396" name="__codelineno-0-1396"></a>        <span class="n">considered</span> <span class="o">+=</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span>
+</span><span id="__span-0-1397"><a id="__codelineno-0-1397" name="__codelineno-0-1397"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">m</span><span class="p">[</span><span class="n">graph_var_indices</span><span class="p">][:,</span> <span class="n">other_indices</span><span class="p">]</span> <span class="o">!=</span> <span class="mi">0</span>
+</span><span id="__span-0-1398"><a id="__codelineno-0-1398" name="__codelineno-0-1398"></a>        <span class="p">)</span>
+</span><span id="__span-0-1399"><a id="__codelineno-0-1399" name="__codelineno-0-1399"></a>        <span class="n">considered</span> <span class="o">+=</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span>
+</span><span id="__span-0-1400"><a id="__codelineno-0-1400" name="__codelineno-0-1400"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">m</span><span class="p">[</span><span class="n">other_indices</span><span class="p">][:,</span> <span class="n">graph_var_indices</span><span class="p">]</span> <span class="o">!=</span> <span class="mi">0</span>
+</span><span id="__span-0-1401"><a id="__codelineno-0-1401" name="__codelineno-0-1401"></a>        <span class="p">)</span>
+</span><span id="__span-0-1402"><a id="__codelineno-0-1402" name="__codelineno-0-1402"></a>
+</span><span id="__span-0-1403"><a id="__codelineno-0-1403" name="__codelineno-0-1403"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Considered: </span><span class="si">{</span><span class="n">considered</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1404"><a id="__codelineno-0-1404" name="__codelineno-0-1404"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Incident: </span><span class="si">{</span><span class="n">incident</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1405"><a id="__codelineno-0-1405" name="__codelineno-0-1405"></a>
+</span><span id="__span-0-1406"><a id="__codelineno-0-1406" name="__codelineno-0-1406"></a>        <span class="k">return</span> <span class="n">considered</span> <span class="o">/</span> <span class="n">incident</span>
+</span><span id="__span-0-1407"><a id="__codelineno-0-1407" name="__codelineno-0-1407"></a>
+</span><span id="__span-0-1408"><a id="__codelineno-0-1408" name="__codelineno-0-1408"></a>    <span class="k">def</span> <span class="nf">rank_candidate_causes</span><span class="p">(</span>
+</span><span id="__span-0-1409"><a id="__codelineno-0-1409" name="__codelineno-0-1409"></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-1410"><a id="__codelineno-0-1410" name="__codelineno-0-1410"></a>        <span class="n">target</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-1411"><a id="__codelineno-0-1411" name="__codelineno-0-1411"></a>        <span class="n">ignore</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">List</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-1412"><a id="__codelineno-0-1412" name="__codelineno-0-1412"></a>        <span class="n">method</span><span class="p">:</span> <span class="n">CandidateCauseRankerMethod</span> <span class="o">=</span> <span class="n">CandidateCauseRankerMethod</span><span class="o">.</span><span class="n">LOGOS</span><span class="p">,</span>
+</span><span id="__span-0-1413"><a id="__codelineno-0-1413" name="__codelineno-0-1413"></a>        <span class="n">prune_candidates</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="__span-0-1414"><a id="__codelineno-0-1414" name="__codelineno-0-1414"></a>        <span class="n">lasso_alpha</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="n">Pruner</span><span class="o">.</span><span class="n">LASSO_DEFAULT_ALPHA</span><span class="p">,</span>
+</span><span id="__span-0-1415"><a id="__codelineno-0-1415" name="__codelineno-0-1415"></a>        <span class="n">lasso_max_iter</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="n">Pruner</span><span class="o">.</span><span class="n">LASSO_DEFAULT_MAX_ITER</span><span class="p">,</span>
+</span><span id="__span-0-1416"><a id="__codelineno-0-1416" name="__codelineno-0-1416"></a>        <span class="n">model</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;gpt-4o-mini-2024-07-18&quot;</span><span class="p">,</span>
+</span><span id="__span-0-1417"><a id="__codelineno-0-1417" name="__codelineno-0-1417"></a>        <span class="n">gpt_log_path</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-1418"><a id="__codelineno-0-1418" name="__codelineno-0-1418"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="nb">str</span><span class="p">]:</span>
+</span><span id="__span-0-1419"><a id="__codelineno-0-1419" name="__codelineno-0-1419"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1420"><a id="__codelineno-0-1420" name="__codelineno-0-1420"></a><span class="sd">        Present the user with ranked candidate causes for `target`. If no `target`</span>
+</span><span id="__span-0-1421"><a id="__codelineno-0-1421" name="__codelineno-0-1421"></a><span class="sd">        is specified, the most recent suggestion of `suggest_next_exploration()` is used, if any.</span>
+</span><span id="__span-0-1422"><a id="__codelineno-0-1422" name="__codelineno-0-1422"></a><span class="sd">        If `ignore` is specified, the variables in `ignore` are not considered as candidate causes.</span>
+</span><span id="__span-0-1423"><a id="__codelineno-0-1423" name="__codelineno-0-1423"></a>
+</span><span id="__span-0-1424"><a id="__codelineno-0-1424" name="__codelineno-0-1424"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-1425"><a id="__codelineno-0-1425" name="__codelineno-0-1425"></a><span class="sd">            target: The name or tag of the target variable.</span>
+</span><span id="__span-0-1426"><a id="__codelineno-0-1426" name="__codelineno-0-1426"></a><span class="sd">            ignore: A list of variables to ignore.</span>
+</span><span id="__span-0-1427"><a id="__codelineno-0-1427" name="__codelineno-0-1427"></a><span class="sd">            method: The method to use for ranking candidate causes.</span>
+</span><span id="__span-0-1428"><a id="__codelineno-0-1428" name="__codelineno-0-1428"></a><span class="sd">            prune_candidates: Whether to prune the candidate causes using Lasso regression. Only</span>
+</span><span id="__span-0-1429"><a id="__codelineno-0-1429" name="__codelineno-0-1429"></a><span class="sd">                applies if `method` is `CandidateCauseRankerMethod.LOGOS`.</span>
+</span><span id="__span-0-1430"><a id="__codelineno-0-1430" name="__codelineno-0-1430"></a><span class="sd">            lasso_alpha: The alpha parameter to be used for Lasso regression. Only applies if</span>
+</span><span id="__span-0-1431"><a id="__codelineno-0-1431" name="__codelineno-0-1431"></a><span class="sd">                `method` is `CandidateCauseRankerMethod.LOGOS` and `prune_candidates` is True.</span>
+</span><span id="__span-0-1432"><a id="__codelineno-0-1432" name="__codelineno-0-1432"></a><span class="sd">            lasso_max_iter: The maximum number of iterations to be used for Lasso regression. Only</span>
+</span><span id="__span-0-1433"><a id="__codelineno-0-1433" name="__codelineno-0-1433"></a><span class="sd">                applies if `method` is `CandidateCauseRankerMethod.LOGOS` and `prune_candidates` is True.</span>
+</span><span id="__span-0-1434"><a id="__codelineno-0-1434" name="__codelineno-0-1434"></a><span class="sd">            model: The model to use for the langmodel method. Only applies if the method is</span>
+</span><span id="__span-0-1435"><a id="__codelineno-0-1435" name="__codelineno-0-1435"></a><span class="sd">                `CandidateCauseRankerMethod.LANGMODEL`.</span>
+</span><span id="__span-0-1436"><a id="__codelineno-0-1436" name="__codelineno-0-1436"></a><span class="sd">            gpt_log_path: The path to the log file to use for the langmodel method. Only applies if</span>
+</span><span id="__span-0-1437"><a id="__codelineno-0-1437" name="__codelineno-0-1437"></a><span class="sd">                the method is `CandidateCauseRankerMethod.LANGMODEL`.</span>
+</span><span id="__span-0-1438"><a id="__codelineno-0-1438" name="__codelineno-0-1438"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-1439"><a id="__codelineno-0-1439" name="__codelineno-0-1439"></a><span class="sd">            A tuple containing:</span>
+</span><span id="__span-0-1440"><a id="__codelineno-0-1440" name="__codelineno-0-1440"></a><span class="sd">            (1) A dataframe containing the candidate causes for `target` and</span>
+</span><span id="__span-0-1441"><a id="__codelineno-0-1441" name="__codelineno-0-1441"></a><span class="sd">            (2) The time elapsed for exploration, as a string.</span>
+</span><span id="__span-0-1442"><a id="__codelineno-0-1442" name="__codelineno-0-1442"></a><span class="sd">        &quot;&quot;&quot;</span>
 </span><span id="__span-0-1443"><a id="__codelineno-0-1443" name="__codelineno-0-1443"></a>
-</span><span id="__span-0-1444"><a id="__codelineno-0-1444" name="__codelineno-0-1444"></a>        <span class="c1"># Use the specified method to rank candidate causes</span>
-</span><span id="__span-0-1445"><a id="__codelineno-0-1445" name="__codelineno-0-1445"></a>        <span class="n">result_df</span><span class="p">,</span> <span class="n">pruned</span> <span class="o">=</span> <span class="n">CandidateCauseRanker</span><span class="o">.</span><span class="n">rank</span><span class="p">(</span>
-</span><span id="__span-0-1446"><a id="__codelineno-0-1446" name="__codelineno-0-1446"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">prepared_log</span><span class="p">,</span>
-</span><span id="__span-0-1447"><a id="__codelineno-0-1447" name="__codelineno-0-1447"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variables</span><span class="p">,</span>
-</span><span id="__span-0-1448"><a id="__codelineno-0-1448" name="__codelineno-0-1448"></a>            <span class="n">target</span><span class="p">,</span>
-</span><span id="__span-0-1449"><a id="__codelineno-0-1449" name="__codelineno-0-1449"></a>            <span class="n">ignore</span><span class="p">,</span>
-</span><span id="__span-0-1450"><a id="__codelineno-0-1450" name="__codelineno-0-1450"></a>            <span class="n">method</span><span class="p">,</span>
-</span><span id="__span-0-1451"><a id="__codelineno-0-1451" name="__codelineno-0-1451"></a>            <span class="n">prune_candidates</span><span class="p">,</span>
-</span><span id="__span-0-1452"><a id="__codelineno-0-1452" name="__codelineno-0-1452"></a>            <span class="n">lasso_alpha</span><span class="p">,</span>
-</span><span id="__span-0-1453"><a id="__codelineno-0-1453" name="__codelineno-0-1453"></a>            <span class="n">lasso_max_iter</span><span class="p">,</span>
-</span><span id="__span-0-1454"><a id="__codelineno-0-1454" name="__codelineno-0-1454"></a>            <span class="n">model</span><span class="p">,</span>
-</span><span id="__span-0-1455"><a id="__codelineno-0-1455" name="__codelineno-0-1455"></a>            <span class="p">(</span>
-</span><span id="__span-0-1456"><a id="__codelineno-0-1456" name="__codelineno-0-1456"></a>                <span class="n">gpt_log_path</span>
-</span><span id="__span-0-1457"><a id="__codelineno-0-1457" name="__codelineno-0-1457"></a>                <span class="k">if</span> <span class="p">(</span><span class="n">gpt_log_path</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">)</span>
-</span><span id="__span-0-1458"><a id="__codelineno-0-1458" name="__codelineno-0-1458"></a>                <span class="k">else</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span>
-</span><span id="__span-0-1459"><a id="__codelineno-0-1459" name="__codelineno-0-1459"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_workdir</span><span class="p">,</span>
-</span><span id="__span-0-1460"><a id="__codelineno-0-1460" name="__codelineno-0-1460"></a>                    <span class="sa">f</span><span class="s2">&quot;ranker-gpt-</span><span class="si">{</span><span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span><span class="o">.</span><span class="n">strftime</span><span class="p">(</span><span class="s1">&#39;%Y-%m-</span><span class="si">%d</span><span class="s1">-%H-%M-%S&#39;</span><span class="p">)</span><span class="si">}</span><span class="s2">.log&quot;</span><span class="p">,</span>
-</span><span id="__span-0-1461"><a id="__codelineno-0-1461" name="__codelineno-0-1461"></a>                <span class="p">)</span>
-</span><span id="__span-0-1462"><a id="__codelineno-0-1462" name="__codelineno-0-1462"></a>            <span class="p">),</span>
-</span><span id="__span-0-1463"><a id="__codelineno-0-1463" name="__codelineno-0-1463"></a>        <span class="p">)</span>
-</span><span id="__span-0-1464"><a id="__codelineno-0-1464" name="__codelineno-0-1464"></a>
-</span><span id="__span-0-1465"><a id="__codelineno-0-1465" name="__codelineno-0-1465"></a>        <span class="c1"># Mark the edges rejected by the pruning step, if any.</span>
-</span><span id="__span-0-1466"><a id="__codelineno-0-1466" name="__codelineno-0-1466"></a>        <span class="k">for</span> <span class="n">var</span> <span class="ow">in</span> <span class="n">pruned</span><span class="p">:</span>
-</span><span id="__span-0-1467"><a id="__codelineno-0-1467" name="__codelineno-0-1467"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">mark_edge</span><span class="p">(</span><span class="n">var</span><span class="p">,</span> <span class="n">target</span><span class="p">,</span> <span class="s2">&quot;Rejected&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1468"><a id="__codelineno-0-1468" name="__codelineno-0-1468"></a>
-</span><span id="__span-0-1469"><a id="__codelineno-0-1469" name="__codelineno-0-1469"></a>        <span class="c1"># Add fields to the returned dataframe</span>
-</span><span id="__span-0-1470"><a id="__codelineno-0-1470" name="__codelineno-0-1470"></a>        <span class="n">result_df</span><span class="p">[</span><span class="s2">&quot;Candidate-&gt;Target Edge Status&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">result_df</span><span class="p">[</span><span class="s2">&quot;Candidate&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
-</span><span id="__span-0-1471"><a id="__codelineno-0-1471" name="__codelineno-0-1471"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">get_edge_state</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>
-</span><span id="__span-0-1472"><a id="__codelineno-0-1472" name="__codelineno-0-1472"></a>        <span class="p">)</span>
-</span><span id="__span-0-1473"><a id="__codelineno-0-1473" name="__codelineno-0-1473"></a>        <span class="n">result_df</span><span class="p">[</span><span class="s2">&quot;Target-&gt;Candidate Edge Status&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">result_df</span><span class="p">[</span><span class="s2">&quot;Candidate&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
-</span><span id="__span-0-1474"><a id="__codelineno-0-1474" name="__codelineno-0-1474"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">get_edge_state</span><span class="p">(</span><span class="n">target</span><span class="p">,</span> <span class="n">x</span><span class="p">)</span>
+</span><span id="__span-0-1444"><a id="__codelineno-0-1444" name="__codelineno-0-1444"></a>        <span class="n">start_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
+</span><span id="__span-0-1445"><a id="__codelineno-0-1445" name="__codelineno-0-1445"></a>
+</span><span id="__span-0-1446"><a id="__codelineno-0-1446" name="__codelineno-0-1446"></a>        <span class="c1"># Handle the case where the user has not specified a target.</span>
+</span><span id="__span-0-1447"><a id="__codelineno-0-1447" name="__codelineno-0-1447"></a>        <span class="k">if</span> <span class="n">target</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-1448"><a id="__codelineno-0-1448" name="__codelineno-0-1448"></a>            <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="s2">&quot;No target specified.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1449"><a id="__codelineno-0-1449" name="__codelineno-0-1449"></a>            <span class="k">return</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">columns</span><span class="o">=</span><span class="n">CandidateCauseRanker</span><span class="o">.</span><span class="n">COLUMN_ORDER</span><span class="p">),</span> <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-1450"><a id="__codelineno-0-1450" name="__codelineno-0-1450"></a>        <span class="k">elif</span> <span class="n">target</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-1451"><a id="__codelineno-0-1451" name="__codelineno-0-1451"></a>            <span class="n">target</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span>
+</span><span id="__span-0-1452"><a id="__codelineno-0-1452" name="__codelineno-0-1452"></a>
+</span><span id="__span-0-1453"><a id="__codelineno-0-1453" name="__codelineno-0-1453"></a>        <span class="c1"># If the user provided the target as a tag, retrieve its name</span>
+</span><span id="__span-0-1454"><a id="__codelineno-0-1454" name="__codelineno-0-1454"></a>        <span class="n">target</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">target</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1455"><a id="__codelineno-0-1455" name="__codelineno-0-1455"></a>
+</span><span id="__span-0-1456"><a id="__codelineno-0-1456" name="__codelineno-0-1456"></a>        <span class="c1"># Use the specified method to rank candidate causes</span>
+</span><span id="__span-0-1457"><a id="__codelineno-0-1457" name="__codelineno-0-1457"></a>        <span class="n">result_df</span><span class="p">,</span> <span class="n">pruned</span> <span class="o">=</span> <span class="n">CandidateCauseRanker</span><span class="o">.</span><span class="n">rank</span><span class="p">(</span>
+</span><span id="__span-0-1458"><a id="__codelineno-0-1458" name="__codelineno-0-1458"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">prepared_log</span><span class="p">,</span>
+</span><span id="__span-0-1459"><a id="__codelineno-0-1459" name="__codelineno-0-1459"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variables</span><span class="p">,</span>
+</span><span id="__span-0-1460"><a id="__codelineno-0-1460" name="__codelineno-0-1460"></a>            <span class="n">target</span><span class="p">,</span>
+</span><span id="__span-0-1461"><a id="__codelineno-0-1461" name="__codelineno-0-1461"></a>            <span class="n">ignore</span><span class="p">,</span>
+</span><span id="__span-0-1462"><a id="__codelineno-0-1462" name="__codelineno-0-1462"></a>            <span class="n">method</span><span class="p">,</span>
+</span><span id="__span-0-1463"><a id="__codelineno-0-1463" name="__codelineno-0-1463"></a>            <span class="n">prune_candidates</span><span class="p">,</span>
+</span><span id="__span-0-1464"><a id="__codelineno-0-1464" name="__codelineno-0-1464"></a>            <span class="n">lasso_alpha</span><span class="p">,</span>
+</span><span id="__span-0-1465"><a id="__codelineno-0-1465" name="__codelineno-0-1465"></a>            <span class="n">lasso_max_iter</span><span class="p">,</span>
+</span><span id="__span-0-1466"><a id="__codelineno-0-1466" name="__codelineno-0-1466"></a>            <span class="n">model</span><span class="p">,</span>
+</span><span id="__span-0-1467"><a id="__codelineno-0-1467" name="__codelineno-0-1467"></a>            <span class="p">(</span>
+</span><span id="__span-0-1468"><a id="__codelineno-0-1468" name="__codelineno-0-1468"></a>                <span class="n">gpt_log_path</span>
+</span><span id="__span-0-1469"><a id="__codelineno-0-1469" name="__codelineno-0-1469"></a>                <span class="k">if</span> <span class="p">(</span><span class="n">gpt_log_path</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">)</span>
+</span><span id="__span-0-1470"><a id="__codelineno-0-1470" name="__codelineno-0-1470"></a>                <span class="k">else</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span>
+</span><span id="__span-0-1471"><a id="__codelineno-0-1471" name="__codelineno-0-1471"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_workdir</span><span class="p">,</span>
+</span><span id="__span-0-1472"><a id="__codelineno-0-1472" name="__codelineno-0-1472"></a>                    <span class="sa">f</span><span class="s2">&quot;ranker-gpt-</span><span class="si">{</span><span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span><span class="o">.</span><span class="n">strftime</span><span class="p">(</span><span class="s1">&#39;%Y-%m-</span><span class="si">%d</span><span class="s1">-%H-%M-%S&#39;</span><span class="p">)</span><span class="si">}</span><span class="s2">.log&quot;</span><span class="p">,</span>
+</span><span id="__span-0-1473"><a id="__codelineno-0-1473" name="__codelineno-0-1473"></a>                <span class="p">)</span>
+</span><span id="__span-0-1474"><a id="__codelineno-0-1474" name="__codelineno-0-1474"></a>            <span class="p">),</span>
 </span><span id="__span-0-1475"><a id="__codelineno-0-1475" name="__codelineno-0-1475"></a>        <span class="p">)</span>
 </span><span id="__span-0-1476"><a id="__codelineno-0-1476" name="__codelineno-0-1476"></a>
-</span><span id="__span-0-1477"><a id="__codelineno-0-1477" name="__codelineno-0-1477"></a>        <span class="n">ret_val</span> <span class="o">=</span> <span class="n">result_df</span><span class="p">[</span><span class="n">CandidateCauseRanker</span><span class="o">.</span><span class="n">COLUMN_ORDER</span><span class="p">]</span>
-</span><span id="__span-0-1478"><a id="__codelineno-0-1478" name="__codelineno-0-1478"></a>
-</span><span id="__span-0-1479"><a id="__codelineno-0-1479" name="__codelineno-0-1479"></a>        <span class="n">end_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
-</span><span id="__span-0-1480"><a id="__codelineno-0-1480" name="__codelineno-0-1480"></a>        <span class="n">elapsed</span> <span class="o">=</span> <span class="s2">&quot;</span><span class="si">{:.6f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">((</span><span class="n">end_time</span> <span class="o">-</span> <span class="n">start_time</span><span class="p">)</span><span class="o">.</span><span class="n">total_seconds</span><span class="p">())</span>
-</span><span id="__span-0-1481"><a id="__codelineno-0-1481" name="__codelineno-0-1481"></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Candidate cause exploration complete in </span><span class="si">{</span><span class="n">elapsed</span><span class="si">}</span><span class="s2"> seconds!&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1482"><a id="__codelineno-0-1482" name="__codelineno-0-1482"></a>
-</span><span id="__span-0-1483"><a id="__codelineno-0-1483" name="__codelineno-0-1483"></a>        <span class="k">return</span> <span class="n">ret_val</span><span class="p">,</span> <span class="n">elapsed</span>
-</span><span id="__span-0-1484"><a id="__codelineno-0-1484" name="__codelineno-0-1484"></a>
-</span><span id="__span-0-1485"><a id="__codelineno-0-1485" name="__codelineno-0-1485"></a>    <span class="k">def</span> <span class="nf">get_causal_graph_refinement_suggestion</span><span class="p">(</span>
-</span><span id="__span-0-1486"><a id="__codelineno-0-1486" name="__codelineno-0-1486"></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-1487"><a id="__codelineno-0-1487" name="__codelineno-0-1487"></a>        <span class="n">method</span><span class="p">:</span> <span class="n">InteractiveCausalGraphRefinerMethod</span> <span class="o">=</span> <span class="n">InteractiveCausalGraphRefinerMethod</span><span class="o">.</span><span class="n">LOGOS</span><span class="p">,</span>
-</span><span id="__span-0-1488"><a id="__codelineno-0-1488" name="__codelineno-0-1488"></a>        <span class="n">treatment</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-1489"><a id="__codelineno-0-1489" name="__codelineno-0-1489"></a>        <span class="n">outcome</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-1490"><a id="__codelineno-0-1490" name="__codelineno-0-1490"></a>        <span class="n">model</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;gpt-4o-mini-2024-07-18&quot;</span><span class="p">,</span>
-</span><span id="__span-0-1491"><a id="__codelineno-0-1491" name="__codelineno-0-1491"></a>        <span class="n">gpt_log_path</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-1492"><a id="__codelineno-0-1492" name="__codelineno-0-1492"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="n">Edge</span><span class="p">,</span> <span class="nb">str</span><span class="p">]:</span>
-</span><span id="__span-0-1493"><a id="__codelineno-0-1493" name="__codelineno-0-1493"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1494"><a id="__codelineno-0-1494" name="__codelineno-0-1494"></a><span class="sd">        Present the user with an edge, the presence and direction of which they should assess.</span>
-</span><span id="__span-0-1495"><a id="__codelineno-0-1495" name="__codelineno-0-1495"></a>
-</span><span id="__span-0-1496"><a id="__codelineno-0-1496" name="__codelineno-0-1496"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-1497"><a id="__codelineno-0-1497" name="__codelineno-0-1497"></a><span class="sd">            method: The method to use for producing a causal graph refinement suggestion.</span>
-</span><span id="__span-0-1498"><a id="__codelineno-0-1498" name="__codelineno-0-1498"></a><span class="sd">            treatment: The name or tag of the treatment variable. Only applies if the method is</span>
-</span><span id="__span-0-1499"><a id="__codelineno-0-1499" name="__codelineno-0-1499"></a><span class="sd">                `InteractiveCausalGraphRefinerMethod.LOGOS`.</span>
-</span><span id="__span-0-1500"><a id="__codelineno-0-1500" name="__codelineno-0-1500"></a><span class="sd">            outcome: The name or tag of the outcome variable. Only applies if the method is</span>
-</span><span id="__span-0-1501"><a id="__codelineno-0-1501" name="__codelineno-0-1501"></a><span class="sd">                `InteractiveCausalGraphRefinerMethod.LOGOS`.</span>
-</span><span id="__span-0-1502"><a id="__codelineno-0-1502" name="__codelineno-0-1502"></a><span class="sd">            model: The model to use for the langmodel method. Only applies if the method is</span>
-</span><span id="__span-0-1503"><a id="__codelineno-0-1503" name="__codelineno-0-1503"></a><span class="sd">                `CandidateCauseRankerMethod.LANGMODEL`.</span>
-</span><span id="__span-0-1504"><a id="__codelineno-0-1504" name="__codelineno-0-1504"></a><span class="sd">            gpt_log_path: The path to the log file to use for the langmodel method. Only applies if</span>
-</span><span id="__span-0-1505"><a id="__codelineno-0-1505" name="__codelineno-0-1505"></a><span class="sd">                the method is `CandidateCauseRankerMethod.LANGMODEL`.</span>
-</span><span id="__span-0-1506"><a id="__codelineno-0-1506" name="__codelineno-0-1506"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-1507"><a id="__codelineno-0-1507" name="__codelineno-0-1507"></a><span class="sd">            A tuple containing:</span>
-</span><span id="__span-0-1508"><a id="__codelineno-0-1508" name="__codelineno-0-1508"></a><span class="sd">            (1) The edge to assess, as an Edge object, and</span>
-</span><span id="__span-0-1509"><a id="__codelineno-0-1509" name="__codelineno-0-1509"></a><span class="sd">            (2) The time elapsed for generating the suggestion, as a string.</span>
-</span><span id="__span-0-1510"><a id="__codelineno-0-1510" name="__codelineno-0-1510"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1511"><a id="__codelineno-0-1511" name="__codelineno-0-1511"></a>
-</span><span id="__span-0-1512"><a id="__codelineno-0-1512" name="__codelineno-0-1512"></a>        <span class="n">start_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
-</span><span id="__span-0-1513"><a id="__codelineno-0-1513" name="__codelineno-0-1513"></a>
-</span><span id="__span-0-1514"><a id="__codelineno-0-1514" name="__codelineno-0-1514"></a>        <span class="n">treatment_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span>
-</span><span id="__span-0-1515"><a id="__codelineno-0-1515" name="__codelineno-0-1515"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">treatment</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span>
-</span><span id="__span-0-1516"><a id="__codelineno-0-1516" name="__codelineno-0-1516"></a>        <span class="p">)</span>
-</span><span id="__span-0-1517"><a id="__codelineno-0-1517" name="__codelineno-0-1517"></a>        <span class="n">outcome_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">outcome</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1518"><a id="__codelineno-0-1518" name="__codelineno-0-1518"></a>
-</span><span id="__span-0-1519"><a id="__codelineno-0-1519" name="__codelineno-0-1519"></a>        <span class="n">edge</span> <span class="o">=</span> <span class="n">InteractiveCausalGraphRefiner</span><span class="o">.</span><span class="n">get_suggestion</span><span class="p">(</span>
-</span><span id="__span-0-1520"><a id="__codelineno-0-1520" name="__codelineno-0-1520"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">prepared_log</span><span class="p">,</span>
-</span><span id="__span-0-1521"><a id="__codelineno-0-1521" name="__codelineno-0-1521"></a>            <span class="n">method</span><span class="p">,</span>
-</span><span id="__span-0-1522"><a id="__codelineno-0-1522" name="__codelineno-0-1522"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="p">,</span>
-</span><span id="__span-0-1523"><a id="__codelineno-0-1523" name="__codelineno-0-1523"></a>            <span class="n">treatment_name</span><span class="p">,</span>
-</span><span id="__span-0-1524"><a id="__codelineno-0-1524" name="__codelineno-0-1524"></a>            <span class="n">outcome_name</span><span class="p">,</span>
-</span><span id="__span-0-1525"><a id="__codelineno-0-1525" name="__codelineno-0-1525"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span>
-</span><span id="__span-0-1526"><a id="__codelineno-0-1526" name="__codelineno-0-1526"></a>            <span class="n">model</span><span class="p">,</span>
-</span><span id="__span-0-1527"><a id="__codelineno-0-1527" name="__codelineno-0-1527"></a>            <span class="p">(</span>
-</span><span id="__span-0-1528"><a id="__codelineno-0-1528" name="__codelineno-0-1528"></a>                <span class="n">gpt_log_path</span>
-</span><span id="__span-0-1529"><a id="__codelineno-0-1529" name="__codelineno-0-1529"></a>                <span class="k">if</span> <span class="p">(</span><span class="n">gpt_log_path</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">)</span>
-</span><span id="__span-0-1530"><a id="__codelineno-0-1530" name="__codelineno-0-1530"></a>                <span class="k">else</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span>
-</span><span id="__span-0-1531"><a id="__codelineno-0-1531" name="__codelineno-0-1531"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_workdir</span><span class="p">,</span>
-</span><span id="__span-0-1532"><a id="__codelineno-0-1532" name="__codelineno-0-1532"></a>                    <span class="sa">f</span><span class="s2">&quot;refiner-gpt-</span><span class="si">{</span><span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span><span class="o">.</span><span class="n">strftime</span><span class="p">(</span><span class="s1">&#39;%Y-%m-</span><span class="si">%d</span><span class="s1">-%H-%M-%S&#39;</span><span class="p">)</span><span class="si">}</span><span class="s2">.log&quot;</span><span class="p">,</span>
-</span><span id="__span-0-1533"><a id="__codelineno-0-1533" name="__codelineno-0-1533"></a>                <span class="p">)</span>
-</span><span id="__span-0-1534"><a id="__codelineno-0-1534" name="__codelineno-0-1534"></a>            <span class="p">),</span>
-</span><span id="__span-0-1535"><a id="__codelineno-0-1535" name="__codelineno-0-1535"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variables</span>
-</span><span id="__span-0-1536"><a id="__codelineno-0-1536" name="__codelineno-0-1536"></a>        <span class="p">)</span>
-</span><span id="__span-0-1537"><a id="__codelineno-0-1537" name="__codelineno-0-1537"></a>
-</span><span id="__span-0-1538"><a id="__codelineno-0-1538" name="__codelineno-0-1538"></a>        <span class="n">edge_tags</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-1539"><a id="__codelineno-0-1539" name="__codelineno-0-1539"></a>        <span class="k">if</span> <span class="n">edge</span><span class="p">:</span>
-</span><span id="__span-0-1540"><a id="__codelineno-0-1540" name="__codelineno-0-1540"></a>            <span class="n">edge_tags</span> <span class="o">=</span> <span class="nb">tuple</span><span class="p">(</span>
-</span><span id="__span-0-1541"><a id="__codelineno-0-1541" name="__codelineno-0-1541"></a>                <span class="n">TagUtils</span><span class="o">.</span><span class="n">tag_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">edge</span>
-</span><span id="__span-0-1542"><a id="__codelineno-0-1542" name="__codelineno-0-1542"></a>            <span class="p">)</span>
-</span><span id="__span-0-1543"><a id="__codelineno-0-1543" name="__codelineno-0-1543"></a>
-</span><span id="__span-0-1544"><a id="__codelineno-0-1544" name="__codelineno-0-1544"></a>        <span class="n">end_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
-</span><span id="__span-0-1545"><a id="__codelineno-0-1545" name="__codelineno-0-1545"></a>        <span class="n">elapsed</span> <span class="o">=</span> <span class="s2">&quot;</span><span class="si">{:.6f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">((</span><span class="n">end_time</span> <span class="o">-</span> <span class="n">start_time</span><span class="p">)</span><span class="o">.</span><span class="n">total_seconds</span><span class="p">())</span>
-</span><span id="__span-0-1546"><a id="__codelineno-0-1546" name="__codelineno-0-1546"></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Candidate cause exploration complete in </span><span class="si">{</span><span class="n">elapsed</span><span class="si">}</span><span class="s2"> seconds!&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1547"><a id="__codelineno-0-1547" name="__codelineno-0-1547"></a>
-</span><span id="__span-0-1548"><a id="__codelineno-0-1548" name="__codelineno-0-1548"></a>        <span class="k">return</span> <span class="n">edge_tags</span><span class="p">,</span> <span class="n">elapsed</span>
+</span><span id="__span-0-1477"><a id="__codelineno-0-1477" name="__codelineno-0-1477"></a>        <span class="c1"># Mark the edges rejected by the pruning step, if any.</span>
+</span><span id="__span-0-1478"><a id="__codelineno-0-1478" name="__codelineno-0-1478"></a>        <span class="k">for</span> <span class="n">var</span> <span class="ow">in</span> <span class="n">pruned</span><span class="p">:</span>
+</span><span id="__span-0-1479"><a id="__codelineno-0-1479" name="__codelineno-0-1479"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">mark_edge</span><span class="p">(</span><span class="n">var</span><span class="p">,</span> <span class="n">target</span><span class="p">,</span> <span class="s2">&quot;Rejected&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1480"><a id="__codelineno-0-1480" name="__codelineno-0-1480"></a>
+</span><span id="__span-0-1481"><a id="__codelineno-0-1481" name="__codelineno-0-1481"></a>        <span class="c1"># Add fields to the returned dataframe</span>
+</span><span id="__span-0-1482"><a id="__codelineno-0-1482" name="__codelineno-0-1482"></a>        <span class="n">result_df</span><span class="p">[</span><span class="s2">&quot;Candidate-&gt;Target Edge Status&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">result_df</span><span class="p">[</span><span class="s2">&quot;Candidate&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
+</span><span id="__span-0-1483"><a id="__codelineno-0-1483" name="__codelineno-0-1483"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">get_edge_state</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>
+</span><span id="__span-0-1484"><a id="__codelineno-0-1484" name="__codelineno-0-1484"></a>        <span class="p">)</span>
+</span><span id="__span-0-1485"><a id="__codelineno-0-1485" name="__codelineno-0-1485"></a>        <span class="n">result_df</span><span class="p">[</span><span class="s2">&quot;Target-&gt;Candidate Edge Status&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">result_df</span><span class="p">[</span><span class="s2">&quot;Candidate&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
+</span><span id="__span-0-1486"><a id="__codelineno-0-1486" name="__codelineno-0-1486"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">get_edge_state</span><span class="p">(</span><span class="n">target</span><span class="p">,</span> <span class="n">x</span><span class="p">)</span>
+</span><span id="__span-0-1487"><a id="__codelineno-0-1487" name="__codelineno-0-1487"></a>        <span class="p">)</span>
+</span><span id="__span-0-1488"><a id="__codelineno-0-1488" name="__codelineno-0-1488"></a>
+</span><span id="__span-0-1489"><a id="__codelineno-0-1489" name="__codelineno-0-1489"></a>        <span class="n">ret_val</span> <span class="o">=</span> <span class="n">result_df</span><span class="p">[</span><span class="n">CandidateCauseRanker</span><span class="o">.</span><span class="n">COLUMN_ORDER</span><span class="p">]</span>
+</span><span id="__span-0-1490"><a id="__codelineno-0-1490" name="__codelineno-0-1490"></a>
+</span><span id="__span-0-1491"><a id="__codelineno-0-1491" name="__codelineno-0-1491"></a>        <span class="n">end_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
+</span><span id="__span-0-1492"><a id="__codelineno-0-1492" name="__codelineno-0-1492"></a>        <span class="n">elapsed</span> <span class="o">=</span> <span class="s2">&quot;</span><span class="si">{:.6f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">((</span><span class="n">end_time</span> <span class="o">-</span> <span class="n">start_time</span><span class="p">)</span><span class="o">.</span><span class="n">total_seconds</span><span class="p">())</span>
+</span><span id="__span-0-1493"><a id="__codelineno-0-1493" name="__codelineno-0-1493"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Candidate cause exploration complete in </span><span class="si">{</span><span class="n">elapsed</span><span class="si">}</span><span class="s2"> seconds!&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1494"><a id="__codelineno-0-1494" name="__codelineno-0-1494"></a>
+</span><span id="__span-0-1495"><a id="__codelineno-0-1495" name="__codelineno-0-1495"></a>        <span class="k">return</span> <span class="n">ret_val</span><span class="p">,</span> <span class="n">elapsed</span>
+</span><span id="__span-0-1496"><a id="__codelineno-0-1496" name="__codelineno-0-1496"></a>
+</span><span id="__span-0-1497"><a id="__codelineno-0-1497" name="__codelineno-0-1497"></a>    <span class="k">def</span> <span class="nf">get_causal_graph_refinement_suggestion</span><span class="p">(</span>
+</span><span id="__span-0-1498"><a id="__codelineno-0-1498" name="__codelineno-0-1498"></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-1499"><a id="__codelineno-0-1499" name="__codelineno-0-1499"></a>        <span class="n">method</span><span class="p">:</span> <span class="n">InteractiveCausalGraphRefinerMethod</span> <span class="o">=</span> <span class="n">InteractiveCausalGraphRefinerMethod</span><span class="o">.</span><span class="n">LOGOS</span><span class="p">,</span>
+</span><span id="__span-0-1500"><a id="__codelineno-0-1500" name="__codelineno-0-1500"></a>        <span class="n">treatment</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-1501"><a id="__codelineno-0-1501" name="__codelineno-0-1501"></a>        <span class="n">outcome</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-1502"><a id="__codelineno-0-1502" name="__codelineno-0-1502"></a>        <span class="n">model</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;gpt-4o-mini-2024-07-18&quot;</span><span class="p">,</span>
+</span><span id="__span-0-1503"><a id="__codelineno-0-1503" name="__codelineno-0-1503"></a>        <span class="n">gpt_log_path</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-1504"><a id="__codelineno-0-1504" name="__codelineno-0-1504"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="n">Edge</span><span class="p">,</span> <span class="nb">str</span><span class="p">]:</span>
+</span><span id="__span-0-1505"><a id="__codelineno-0-1505" name="__codelineno-0-1505"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1506"><a id="__codelineno-0-1506" name="__codelineno-0-1506"></a><span class="sd">        Present the user with an edge, the presence and direction of which they should assess.</span>
+</span><span id="__span-0-1507"><a id="__codelineno-0-1507" name="__codelineno-0-1507"></a>
+</span><span id="__span-0-1508"><a id="__codelineno-0-1508" name="__codelineno-0-1508"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-1509"><a id="__codelineno-0-1509" name="__codelineno-0-1509"></a><span class="sd">            method: The method to use for producing a causal graph refinement suggestion.</span>
+</span><span id="__span-0-1510"><a id="__codelineno-0-1510" name="__codelineno-0-1510"></a><span class="sd">            treatment: The name or tag of the treatment variable. Only applies if the method is</span>
+</span><span id="__span-0-1511"><a id="__codelineno-0-1511" name="__codelineno-0-1511"></a><span class="sd">                `InteractiveCausalGraphRefinerMethod.LOGOS`.</span>
+</span><span id="__span-0-1512"><a id="__codelineno-0-1512" name="__codelineno-0-1512"></a><span class="sd">            outcome: The name or tag of the outcome variable. Only applies if the method is</span>
+</span><span id="__span-0-1513"><a id="__codelineno-0-1513" name="__codelineno-0-1513"></a><span class="sd">                `InteractiveCausalGraphRefinerMethod.LOGOS`.</span>
+</span><span id="__span-0-1514"><a id="__codelineno-0-1514" name="__codelineno-0-1514"></a><span class="sd">            model: The model to use for the langmodel method. Only applies if the method is</span>
+</span><span id="__span-0-1515"><a id="__codelineno-0-1515" name="__codelineno-0-1515"></a><span class="sd">                `CandidateCauseRankerMethod.LANGMODEL`.</span>
+</span><span id="__span-0-1516"><a id="__codelineno-0-1516" name="__codelineno-0-1516"></a><span class="sd">            gpt_log_path: The path to the log file to use for the langmodel method. Only applies if</span>
+</span><span id="__span-0-1517"><a id="__codelineno-0-1517" name="__codelineno-0-1517"></a><span class="sd">                the method is `CandidateCauseRankerMethod.LANGMODEL`.</span>
+</span><span id="__span-0-1518"><a id="__codelineno-0-1518" name="__codelineno-0-1518"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-1519"><a id="__codelineno-0-1519" name="__codelineno-0-1519"></a><span class="sd">            A tuple containing:</span>
+</span><span id="__span-0-1520"><a id="__codelineno-0-1520" name="__codelineno-0-1520"></a><span class="sd">            (1) The edge to assess, as an Edge object, and</span>
+</span><span id="__span-0-1521"><a id="__codelineno-0-1521" name="__codelineno-0-1521"></a><span class="sd">            (2) The time elapsed for generating the suggestion, as a string.</span>
+</span><span id="__span-0-1522"><a id="__codelineno-0-1522" name="__codelineno-0-1522"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1523"><a id="__codelineno-0-1523" name="__codelineno-0-1523"></a>
+</span><span id="__span-0-1524"><a id="__codelineno-0-1524" name="__codelineno-0-1524"></a>        <span class="n">start_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
+</span><span id="__span-0-1525"><a id="__codelineno-0-1525" name="__codelineno-0-1525"></a>
+</span><span id="__span-0-1526"><a id="__codelineno-0-1526" name="__codelineno-0-1526"></a>        <span class="n">treatment_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span>
+</span><span id="__span-0-1527"><a id="__codelineno-0-1527" name="__codelineno-0-1527"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">treatment</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span>
+</span><span id="__span-0-1528"><a id="__codelineno-0-1528" name="__codelineno-0-1528"></a>        <span class="p">)</span>
+</span><span id="__span-0-1529"><a id="__codelineno-0-1529" name="__codelineno-0-1529"></a>        <span class="n">outcome_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">outcome</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1530"><a id="__codelineno-0-1530" name="__codelineno-0-1530"></a>
+</span><span id="__span-0-1531"><a id="__codelineno-0-1531" name="__codelineno-0-1531"></a>        <span class="n">edge</span> <span class="o">=</span> <span class="n">InteractiveCausalGraphRefiner</span><span class="o">.</span><span class="n">get_suggestion</span><span class="p">(</span>
+</span><span id="__span-0-1532"><a id="__codelineno-0-1532" name="__codelineno-0-1532"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">prepared_log</span><span class="p">,</span>
+</span><span id="__span-0-1533"><a id="__codelineno-0-1533" name="__codelineno-0-1533"></a>            <span class="n">method</span><span class="p">,</span>
+</span><span id="__span-0-1534"><a id="__codelineno-0-1534" name="__codelineno-0-1534"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="p">,</span>
+</span><span id="__span-0-1535"><a id="__codelineno-0-1535" name="__codelineno-0-1535"></a>            <span class="n">treatment_name</span><span class="p">,</span>
+</span><span id="__span-0-1536"><a id="__codelineno-0-1536" name="__codelineno-0-1536"></a>            <span class="n">outcome_name</span><span class="p">,</span>
+</span><span id="__span-0-1537"><a id="__codelineno-0-1537" name="__codelineno-0-1537"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span>
+</span><span id="__span-0-1538"><a id="__codelineno-0-1538" name="__codelineno-0-1538"></a>            <span class="n">model</span><span class="p">,</span>
+</span><span id="__span-0-1539"><a id="__codelineno-0-1539" name="__codelineno-0-1539"></a>            <span class="p">(</span>
+</span><span id="__span-0-1540"><a id="__codelineno-0-1540" name="__codelineno-0-1540"></a>                <span class="n">gpt_log_path</span>
+</span><span id="__span-0-1541"><a id="__codelineno-0-1541" name="__codelineno-0-1541"></a>                <span class="k">if</span> <span class="p">(</span><span class="n">gpt_log_path</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">)</span>
+</span><span id="__span-0-1542"><a id="__codelineno-0-1542" name="__codelineno-0-1542"></a>                <span class="k">else</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span>
+</span><span id="__span-0-1543"><a id="__codelineno-0-1543" name="__codelineno-0-1543"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_workdir</span><span class="p">,</span>
+</span><span id="__span-0-1544"><a id="__codelineno-0-1544" name="__codelineno-0-1544"></a>                    <span class="sa">f</span><span class="s2">&quot;refiner-gpt-</span><span class="si">{</span><span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span><span class="o">.</span><span class="n">strftime</span><span class="p">(</span><span class="s1">&#39;%Y-%m-</span><span class="si">%d</span><span class="s1">-%H-%M-%S&#39;</span><span class="p">)</span><span class="si">}</span><span class="s2">.log&quot;</span><span class="p">,</span>
+</span><span id="__span-0-1545"><a id="__codelineno-0-1545" name="__codelineno-0-1545"></a>                <span class="p">)</span>
+</span><span id="__span-0-1546"><a id="__codelineno-0-1546" name="__codelineno-0-1546"></a>            <span class="p">),</span>
+</span><span id="__span-0-1547"><a id="__codelineno-0-1547" name="__codelineno-0-1547"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variables</span><span class="p">,</span>
+</span><span id="__span-0-1548"><a id="__codelineno-0-1548" name="__codelineno-0-1548"></a>        <span class="p">)</span>
 </span><span id="__span-0-1549"><a id="__codelineno-0-1549" name="__codelineno-0-1549"></a>
-</span><span id="__span-0-1550"><a id="__codelineno-0-1550" name="__codelineno-0-1550"></a>    <span class="k">def</span> <span class="nf">suggest_next_exploration</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]:</span>
-</span><span id="__span-0-1551"><a id="__codelineno-0-1551" name="__codelineno-0-1551"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1552"><a id="__codelineno-0-1552" name="__codelineno-0-1552"></a><span class="sd">        Suggest the variable that should be explored next. Suggest the prepared variable in the partial causal graph</span>
-</span><span id="__span-0-1553"><a id="__codelineno-0-1553" name="__codelineno-0-1553"></a><span class="sd">        that has the most (nonzero) Unexplored incoming edges, if any; otherwise suggest the prepared variable</span>
-</span><span id="__span-0-1554"><a id="__codelineno-0-1554" name="__codelineno-0-1554"></a><span class="sd">        with the most (nonzero) Undecided incoming edges, even if it is not in the partial causal graph.</span>
+</span><span id="__span-0-1550"><a id="__codelineno-0-1550" name="__codelineno-0-1550"></a>        <span class="n">edge_tags</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-1551"><a id="__codelineno-0-1551" name="__codelineno-0-1551"></a>        <span class="k">if</span> <span class="n">edge</span><span class="p">:</span>
+</span><span id="__span-0-1552"><a id="__codelineno-0-1552" name="__codelineno-0-1552"></a>            <span class="n">edge_tags</span> <span class="o">=</span> <span class="nb">tuple</span><span class="p">(</span>
+</span><span id="__span-0-1553"><a id="__codelineno-0-1553" name="__codelineno-0-1553"></a>                <span class="n">TagUtils</span><span class="o">.</span><span class="n">tag_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">edge</span>
+</span><span id="__span-0-1554"><a id="__codelineno-0-1554" name="__codelineno-0-1554"></a>            <span class="p">)</span>
 </span><span id="__span-0-1555"><a id="__codelineno-0-1555" name="__codelineno-0-1555"></a>
-</span><span id="__span-0-1556"><a id="__codelineno-0-1556" name="__codelineno-0-1556"></a><span class="sd">        If all edges are decided, return None.</span>
-</span><span id="__span-0-1557"><a id="__codelineno-0-1557" name="__codelineno-0-1557"></a>
-</span><span id="__span-0-1558"><a id="__codelineno-0-1558" name="__codelineno-0-1558"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-1559"><a id="__codelineno-0-1559" name="__codelineno-0-1559"></a><span class="sd">            The name of the variable to explore next.</span>
-</span><span id="__span-0-1560"><a id="__codelineno-0-1560" name="__codelineno-0-1560"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1556"><a id="__codelineno-0-1556" name="__codelineno-0-1556"></a>        <span class="n">end_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
+</span><span id="__span-0-1557"><a id="__codelineno-0-1557" name="__codelineno-0-1557"></a>        <span class="n">elapsed</span> <span class="o">=</span> <span class="s2">&quot;</span><span class="si">{:.6f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">((</span><span class="n">end_time</span> <span class="o">-</span> <span class="n">start_time</span><span class="p">)</span><span class="o">.</span><span class="n">total_seconds</span><span class="p">())</span>
+</span><span id="__span-0-1558"><a id="__codelineno-0-1558" name="__codelineno-0-1558"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Candidate cause exploration complete in </span><span class="si">{</span><span class="n">elapsed</span><span class="si">}</span><span class="s2"> seconds!&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1559"><a id="__codelineno-0-1559" name="__codelineno-0-1559"></a>
+</span><span id="__span-0-1560"><a id="__codelineno-0-1560" name="__codelineno-0-1560"></a>        <span class="k">return</span> <span class="n">edge_tags</span><span class="p">,</span> <span class="n">elapsed</span>
 </span><span id="__span-0-1561"><a id="__codelineno-0-1561" name="__codelineno-0-1561"></a>
-</span><span id="__span-0-1562"><a id="__codelineno-0-1562" name="__codelineno-0-1562"></a>        <span class="c1"># Try to find a suggestion from the partial causal graph.</span>
-</span><span id="__span-0-1563"><a id="__codelineno-0-1563" name="__codelineno-0-1563"></a>        <span class="n">node_names</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">nodes</span><span class="p">)</span>
-</span><span id="__span-0-1564"><a id="__codelineno-0-1564" name="__codelineno-0-1564"></a>        <span class="n">graph_var_indices</span> <span class="o">=</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">idx</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">node_names</span><span class="p">]</span>
-</span><span id="__span-0-1565"><a id="__codelineno-0-1565" name="__codelineno-0-1565"></a>        <span class="n">graph_var_incoming_edge_states</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">m</span><span class="p">[:,</span> <span class="n">graph_var_indices</span><span class="p">]</span>
-</span><span id="__span-0-1566"><a id="__codelineno-0-1566" name="__codelineno-0-1566"></a>        <span class="n">undecided_edges_per_col</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-1567"><a id="__codelineno-0-1567" name="__codelineno-0-1567"></a>            <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">graph_var_incoming_edge_states</span> <span class="o">==</span> <span class="mi">0</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-</span><span id="__span-0-1568"><a id="__codelineno-0-1568" name="__codelineno-0-1568"></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">graph_var_incoming_edge_states</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span>
-</span><span id="__span-0-1569"><a id="__codelineno-0-1569" name="__codelineno-0-1569"></a>            <span class="k">else</span> <span class="p">[]</span>
-</span><span id="__span-0-1570"><a id="__codelineno-0-1570" name="__codelineno-0-1570"></a>        <span class="p">)</span>
-</span><span id="__span-0-1571"><a id="__codelineno-0-1571" name="__codelineno-0-1571"></a>        <span class="n">max_undecided</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-1572"><a id="__codelineno-0-1572" name="__codelineno-0-1572"></a>            <span class="n">np</span><span class="o">.</span><span class="n">max</span><span class="p">(</span><span class="n">undecided_edges_per_col</span><span class="p">)</span> <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">undecided_edges_per_col</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
-</span><span id="__span-0-1573"><a id="__codelineno-0-1573" name="__codelineno-0-1573"></a>        <span class="p">)</span>
-</span><span id="__span-0-1574"><a id="__codelineno-0-1574" name="__codelineno-0-1574"></a>
-</span><span id="__span-0-1575"><a id="__codelineno-0-1575" name="__codelineno-0-1575"></a>        <span class="k">if</span> <span class="n">max_undecided</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-1576"><a id="__codelineno-0-1576" name="__codelineno-0-1576"></a>            <span class="n">max_undecided_idx</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argmax</span><span class="p">(</span><span class="n">undecided_edges_per_col</span><span class="p">)</span>
-</span><span id="__span-0-1577"><a id="__codelineno-0-1577" name="__codelineno-0-1577"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span> <span class="o">=</span> <span class="n">node_names</span><span class="p">[</span><span class="n">max_undecided_idx</span><span class="p">]</span>
-</span><span id="__span-0-1578"><a id="__codelineno-0-1578" name="__codelineno-0-1578"></a>            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span>
-</span><span id="__span-0-1579"><a id="__codelineno-0-1579" name="__codelineno-0-1579"></a>
-</span><span id="__span-0-1580"><a id="__codelineno-0-1580" name="__codelineno-0-1580"></a>        <span class="c1"># If no suggestion was found, try to find a suggestion from the entire collection of prepared variables.</span>
-</span><span id="__span-0-1581"><a id="__codelineno-0-1581" name="__codelineno-0-1581"></a>        <span class="n">undecided_edges_per_col</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">m</span> <span class="o">==</span> <span class="mi">0</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-</span><span id="__span-0-1582"><a id="__codelineno-0-1582" name="__codelineno-0-1582"></a>        <span class="n">max_undecided</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">max</span><span class="p">(</span><span class="n">undecided_edges_per_col</span><span class="p">)</span>
-</span><span id="__span-0-1583"><a id="__codelineno-0-1583" name="__codelineno-0-1583"></a>
-</span><span id="__span-0-1584"><a id="__codelineno-0-1584" name="__codelineno-0-1584"></a>        <span class="k">if</span> <span class="n">max_undecided</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-1585"><a id="__codelineno-0-1585" name="__codelineno-0-1585"></a>            <span class="n">max_undecided_idx</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argmax</span><span class="p">(</span><span class="n">undecided_edges_per_col</span><span class="p">)</span>
-</span><span id="__span-0-1586"><a id="__codelineno-0-1586" name="__codelineno-0-1586"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-1587"><a id="__codelineno-0-1587" name="__codelineno-0-1587"></a>                <span class="n">max_undecided_idx</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span>
-</span><span id="__span-0-1588"><a id="__codelineno-0-1588" name="__codelineno-0-1588"></a>            <span class="p">]</span>
-</span><span id="__span-0-1589"><a id="__codelineno-0-1589" name="__codelineno-0-1589"></a>            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span>
-</span><span id="__span-0-1590"><a id="__codelineno-0-1590" name="__codelineno-0-1590"></a>
-</span><span id="__span-0-1591"><a id="__codelineno-0-1591" name="__codelineno-0-1591"></a>        <span class="c1"># If no suggestion was found, return None.</span>
-</span><span id="__span-0-1592"><a id="__codelineno-0-1592" name="__codelineno-0-1592"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-1593"><a id="__codelineno-0-1593" name="__codelineno-0-1593"></a>        <span class="k">return</span> <span class="kc">None</span>
-</span><span id="__span-0-1594"><a id="__codelineno-0-1594" name="__codelineno-0-1594"></a>
-</span><span id="__span-0-1595"><a id="__codelineno-0-1595" name="__codelineno-0-1595"></a>    <span class="k">def</span> <span class="nf">discover_graph</span><span class="p">(</span>
-</span><span id="__span-0-1596"><a id="__codelineno-0-1596" name="__codelineno-0-1596"></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-1597"><a id="__codelineno-0-1597" name="__codelineno-0-1597"></a>        <span class="n">method</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;hill_climb&quot;</span><span class="p">,</span>
-</span><span id="__span-0-1598"><a id="__codelineno-0-1598" name="__codelineno-0-1598"></a>        <span class="n">max_cond_vars</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">3</span><span class="p">,</span>
-</span><span id="__span-0-1599"><a id="__codelineno-0-1599" name="__codelineno-0-1599"></a>        <span class="n">model</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;gpt-3.5-turbo&quot;</span><span class="p">,</span>
-</span><span id="__span-0-1600"><a id="__codelineno-0-1600" name="__codelineno-0-1600"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-1601"><a id="__codelineno-0-1601" name="__codelineno-0-1601"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1602"><a id="__codelineno-0-1602" name="__codelineno-0-1602"></a><span class="sd">        Discover a causal graph based on the prepared table automatically.</span>
-</span><span id="__span-0-1603"><a id="__codelineno-0-1603" name="__codelineno-0-1603"></a>
-</span><span id="__span-0-1604"><a id="__codelineno-0-1604" name="__codelineno-0-1604"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-1605"><a id="__codelineno-0-1605" name="__codelineno-0-1605"></a><span class="sd">            method: The method to be used for graph discovery, among &quot;PC&quot;, &quot;hill_climb&quot;, &quot;exhaustive&quot; and &quot;GPT&quot;.</span>
-</span><span id="__span-0-1606"><a id="__codelineno-0-1606" name="__codelineno-0-1606"></a><span class="sd">            max_cond_vars: The maximum number of conditioning variables to be used for PC.</span>
-</span><span id="__span-0-1607"><a id="__codelineno-0-1607" name="__codelineno-0-1607"></a><span class="sd">            model: The model to be used for GPT-based graph discovery.</span>
-</span><span id="__span-0-1608"><a id="__codelineno-0-1608" name="__codelineno-0-1608"></a>
-</span><span id="__span-0-1609"><a id="__codelineno-0-1609" name="__codelineno-0-1609"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1610"><a id="__codelineno-0-1610" name="__codelineno-0-1610"></a>
-</span><span id="__span-0-1611"><a id="__codelineno-0-1611" name="__codelineno-0-1611"></a>        <span class="k">if</span> <span class="n">method</span> <span class="o">==</span> <span class="s2">&quot;PC&quot;</span><span class="p">:</span>
-</span><span id="__span-0-1612"><a id="__codelineno-0-1612" name="__codelineno-0-1612"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span> <span class="o">=</span> <span class="n">CausalDiscoverer</span><span class="o">.</span><span class="n">pc</span><span class="p">(</span>
-</span><span id="__span-0-1613"><a id="__codelineno-0-1613" name="__codelineno-0-1613"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span> <span class="n">max_cond_vars</span><span class="o">=</span><span class="n">max_cond_vars</span>
-</span><span id="__span-0-1614"><a id="__codelineno-0-1614" name="__codelineno-0-1614"></a>            <span class="p">)</span>
-</span><span id="__span-0-1615"><a id="__codelineno-0-1615" name="__codelineno-0-1615"></a>        <span class="k">elif</span> <span class="n">method</span> <span class="o">==</span> <span class="s2">&quot;hill_climb&quot;</span><span class="p">:</span>
-</span><span id="__span-0-1616"><a id="__codelineno-0-1616" name="__codelineno-0-1616"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span> <span class="o">=</span> <span class="n">CausalDiscoverer</span><span class="o">.</span><span class="n">hill_climb</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">)</span>
-</span><span id="__span-0-1617"><a id="__codelineno-0-1617" name="__codelineno-0-1617"></a>        <span class="k">elif</span> <span class="n">method</span> <span class="o">==</span> <span class="s2">&quot;exhaustive&quot;</span><span class="p">:</span>
-</span><span id="__span-0-1618"><a id="__codelineno-0-1618" name="__codelineno-0-1618"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span> <span class="o">=</span> <span class="n">CausalDiscoverer</span><span class="o">.</span><span class="n">exhaustive</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">)</span>
-</span><span id="__span-0-1619"><a id="__codelineno-0-1619" name="__codelineno-0-1619"></a>        <span class="k">elif</span> <span class="n">method</span> <span class="o">==</span> <span class="s2">&quot;GPT&quot;</span><span class="p">:</span>
-</span><span id="__span-0-1620"><a id="__codelineno-0-1620" name="__codelineno-0-1620"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span> <span class="o">=</span> <span class="n">CausalDiscoverer</span><span class="o">.</span><span class="n">gpt</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span> <span class="n">model</span><span class="o">=</span><span class="n">model</span><span class="p">)</span>
-</span><span id="__span-0-1621"><a id="__codelineno-0-1621" name="__codelineno-0-1621"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-1622"><a id="__codelineno-0-1622" name="__codelineno-0-1622"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Invalid graph discovery method </span><span class="si">{</span><span class="n">method</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1623"><a id="__codelineno-0-1623" name="__codelineno-0-1623"></a>
-</span><span id="__span-0-1624"><a id="__codelineno-0-1624" name="__codelineno-0-1624"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">clear_and_set_from_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">)</span>
-</span><span id="__span-0-1625"><a id="__codelineno-0-1625" name="__codelineno-0-1625"></a>
-</span><span id="__span-0-1626"><a id="__codelineno-0-1626" name="__codelineno-0-1626"></a>    <span class="k">def</span> <span class="nf">get_adjusted_ate</span><span class="p">(</span>
-</span><span id="__span-0-1627"><a id="__codelineno-0-1627" name="__codelineno-0-1627"></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-1628"><a id="__codelineno-0-1628" name="__codelineno-0-1628"></a>        <span class="n">treatment</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="__span-0-1629"><a id="__codelineno-0-1629" name="__codelineno-0-1629"></a>        <span class="n">outcome</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="__span-0-1630"><a id="__codelineno-0-1630" name="__codelineno-0-1630"></a>        <span class="n">confounder</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-1631"><a id="__codelineno-0-1631" name="__codelineno-0-1631"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
-</span><span id="__span-0-1632"><a id="__codelineno-0-1632" name="__codelineno-0-1632"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1633"><a id="__codelineno-0-1633" name="__codelineno-0-1633"></a><span class="sd">        Calculate the adjusted ATE of `treatment` on `outcome`, given the current partial causal graph.</span>
-</span><span id="__span-0-1634"><a id="__codelineno-0-1634" name="__codelineno-0-1634"></a>
-</span><span id="__span-0-1635"><a id="__codelineno-0-1635" name="__codelineno-0-1635"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-1636"><a id="__codelineno-0-1636" name="__codelineno-0-1636"></a><span class="sd">            treatment: The name or tag of the treatment variable.</span>
-</span><span id="__span-0-1637"><a id="__codelineno-0-1637" name="__codelineno-0-1637"></a><span class="sd">            outcome: The name or tag of the outcome variable.</span>
-</span><span id="__span-0-1638"><a id="__codelineno-0-1638" name="__codelineno-0-1638"></a><span class="sd">            confounder: The name or tag of a confounder variable. If specified, overrides the current partial</span>
-</span><span id="__span-0-1639"><a id="__codelineno-0-1639" name="__codelineno-0-1639"></a><span class="sd">                causal graph in favor of a three-node graph with `treatment`, `outcome` and `confounder`.</span>
-</span><span id="__span-0-1640"><a id="__codelineno-0-1640" name="__codelineno-0-1640"></a>
-</span><span id="__span-0-1641"><a id="__codelineno-0-1641" name="__codelineno-0-1641"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-1642"><a id="__codelineno-0-1642" name="__codelineno-0-1642"></a><span class="sd">            The adjusted ATE of `treatment` on `outcome`.</span>
-</span><span id="__span-0-1643"><a id="__codelineno-0-1643" name="__codelineno-0-1643"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1644"><a id="__codelineno-0-1644" name="__codelineno-0-1644"></a>        <span class="k">return</span> <span class="n">ATECalculator</span><span class="o">.</span><span class="n">get_ate_and_confidence</span><span class="p">(</span>
-</span><span id="__span-0-1645"><a id="__codelineno-0-1645" name="__codelineno-0-1645"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">prepared_log</span><span class="p">,</span>
-</span><span id="__span-0-1646"><a id="__codelineno-0-1646" name="__codelineno-0-1646"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variables</span><span class="p">,</span>
-</span><span id="__span-0-1647"><a id="__codelineno-0-1647" name="__codelineno-0-1647"></a>            <span class="n">treatment</span><span class="p">,</span>
-</span><span id="__span-0-1648"><a id="__codelineno-0-1648" name="__codelineno-0-1648"></a>            <span class="n">outcome</span><span class="p">,</span>
-</span><span id="__span-0-1649"><a id="__codelineno-0-1649" name="__codelineno-0-1649"></a>            <span class="n">confounder</span><span class="p">,</span>
-</span><span id="__span-0-1650"><a id="__codelineno-0-1650" name="__codelineno-0-1650"></a>            <span class="n">graph</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span>
-</span><span id="__span-0-1651"><a id="__codelineno-0-1651" name="__codelineno-0-1651"></a>            <span class="n">calculate_p_value</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-</span><span id="__span-0-1652"><a id="__codelineno-0-1652" name="__codelineno-0-1652"></a>            <span class="n">calculate_std_error</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-</span><span id="__span-0-1653"><a id="__codelineno-0-1653" name="__codelineno-0-1653"></a>        <span class="p">)[</span><span class="s2">&quot;ATE&quot;</span><span class="p">]</span>
-</span><span id="__span-0-1654"><a id="__codelineno-0-1654" name="__codelineno-0-1654"></a>
-</span><span id="__span-0-1655"><a id="__codelineno-0-1655" name="__codelineno-0-1655"></a>    <span class="k">def</span> <span class="nf">get_unadjusted_ate</span><span class="p">(</span>
-</span><span id="__span-0-1656"><a id="__codelineno-0-1656" name="__codelineno-0-1656"></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-1657"><a id="__codelineno-0-1657" name="__codelineno-0-1657"></a>        <span class="n">treatment</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="__span-0-1658"><a id="__codelineno-0-1658" name="__codelineno-0-1658"></a>        <span class="n">outcome</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="__span-0-1659"><a id="__codelineno-0-1659" name="__codelineno-0-1659"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
-</span><span id="__span-0-1660"><a id="__codelineno-0-1660" name="__codelineno-0-1660"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1661"><a id="__codelineno-0-1661" name="__codelineno-0-1661"></a><span class="sd">        Calculate the unadjusted ATE of `treatment` on `outcome`, ignoring the current partial causal graph</span>
-</span><span id="__span-0-1662"><a id="__codelineno-0-1662" name="__codelineno-0-1662"></a><span class="sd">        in favor of a two-node graph with just `treatment` and `outcome`.</span>
-</span><span id="__span-0-1663"><a id="__codelineno-0-1663" name="__codelineno-0-1663"></a>
-</span><span id="__span-0-1664"><a id="__codelineno-0-1664" name="__codelineno-0-1664"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-1665"><a id="__codelineno-0-1665" name="__codelineno-0-1665"></a><span class="sd">            treatment: The name or tag of the treatment variable.</span>
-</span><span id="__span-0-1666"><a id="__codelineno-0-1666" name="__codelineno-0-1666"></a><span class="sd">            outcome: The name or tag of the outcome variable.</span>
-</span><span id="__span-0-1667"><a id="__codelineno-0-1667" name="__codelineno-0-1667"></a>
-</span><span id="__span-0-1668"><a id="__codelineno-0-1668" name="__codelineno-0-1668"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-1669"><a id="__codelineno-0-1669" name="__codelineno-0-1669"></a><span class="sd">            The unadjusted ATE of `treatment` on `outcome`.</span>
-</span><span id="__span-0-1670"><a id="__codelineno-0-1670" name="__codelineno-0-1670"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1671"><a id="__codelineno-0-1671" name="__codelineno-0-1671"></a>        <span class="k">return</span> <span class="n">ATECalculator</span><span class="o">.</span><span class="n">get_ate_and_confidence</span><span class="p">(</span>
-</span><span id="__span-0-1672"><a id="__codelineno-0-1672" name="__codelineno-0-1672"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">prepared_log</span><span class="p">,</span>
-</span><span id="__span-0-1673"><a id="__codelineno-0-1673" name="__codelineno-0-1673"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variables</span><span class="p">,</span>
-</span><span id="__span-0-1674"><a id="__codelineno-0-1674" name="__codelineno-0-1674"></a>            <span class="n">treatment</span><span class="p">,</span>
-</span><span id="__span-0-1675"><a id="__codelineno-0-1675" name="__codelineno-0-1675"></a>            <span class="n">outcome</span><span class="p">,</span>
-</span><span id="__span-0-1676"><a id="__codelineno-0-1676" name="__codelineno-0-1676"></a>            <span class="n">calculate_p_value</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-</span><span id="__span-0-1677"><a id="__codelineno-0-1677" name="__codelineno-0-1677"></a>            <span class="n">calculate_std_error</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-</span><span id="__span-0-1678"><a id="__codelineno-0-1678" name="__codelineno-0-1678"></a>        <span class="p">)[</span><span class="s2">&quot;ATE&quot;</span><span class="p">]</span>
+</span><span id="__span-0-1562"><a id="__codelineno-0-1562" name="__codelineno-0-1562"></a>    <span class="k">def</span> <span class="nf">suggest_next_exploration</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]:</span>
+</span><span id="__span-0-1563"><a id="__codelineno-0-1563" name="__codelineno-0-1563"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1564"><a id="__codelineno-0-1564" name="__codelineno-0-1564"></a><span class="sd">        Suggest the variable that should be explored next. Suggest the prepared variable in the partial causal graph</span>
+</span><span id="__span-0-1565"><a id="__codelineno-0-1565" name="__codelineno-0-1565"></a><span class="sd">        that has the most (nonzero) Unexplored incoming edges, if any; otherwise suggest the prepared variable</span>
+</span><span id="__span-0-1566"><a id="__codelineno-0-1566" name="__codelineno-0-1566"></a><span class="sd">        with the most (nonzero) Undecided incoming edges, even if it is not in the partial causal graph.</span>
+</span><span id="__span-0-1567"><a id="__codelineno-0-1567" name="__codelineno-0-1567"></a>
+</span><span id="__span-0-1568"><a id="__codelineno-0-1568" name="__codelineno-0-1568"></a><span class="sd">        If all edges are decided, return None.</span>
+</span><span id="__span-0-1569"><a id="__codelineno-0-1569" name="__codelineno-0-1569"></a>
+</span><span id="__span-0-1570"><a id="__codelineno-0-1570" name="__codelineno-0-1570"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-1571"><a id="__codelineno-0-1571" name="__codelineno-0-1571"></a><span class="sd">            The name of the variable to explore next.</span>
+</span><span id="__span-0-1572"><a id="__codelineno-0-1572" name="__codelineno-0-1572"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1573"><a id="__codelineno-0-1573" name="__codelineno-0-1573"></a>
+</span><span id="__span-0-1574"><a id="__codelineno-0-1574" name="__codelineno-0-1574"></a>        <span class="c1"># Try to find a suggestion from the partial causal graph.</span>
+</span><span id="__span-0-1575"><a id="__codelineno-0-1575" name="__codelineno-0-1575"></a>        <span class="n">node_names</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">nodes</span><span class="p">)</span>
+</span><span id="__span-0-1576"><a id="__codelineno-0-1576" name="__codelineno-0-1576"></a>        <span class="n">graph_var_indices</span> <span class="o">=</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">idx</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">node_names</span><span class="p">]</span>
+</span><span id="__span-0-1577"><a id="__codelineno-0-1577" name="__codelineno-0-1577"></a>        <span class="n">graph_var_incoming_edge_states</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">m</span><span class="p">[:,</span> <span class="n">graph_var_indices</span><span class="p">]</span>
+</span><span id="__span-0-1578"><a id="__codelineno-0-1578" name="__codelineno-0-1578"></a>        <span class="n">undecided_edges_per_col</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-1579"><a id="__codelineno-0-1579" name="__codelineno-0-1579"></a>            <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">graph_var_incoming_edge_states</span> <span class="o">==</span> <span class="mi">0</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="__span-0-1580"><a id="__codelineno-0-1580" name="__codelineno-0-1580"></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">graph_var_incoming_edge_states</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span>
+</span><span id="__span-0-1581"><a id="__codelineno-0-1581" name="__codelineno-0-1581"></a>            <span class="k">else</span> <span class="p">[]</span>
+</span><span id="__span-0-1582"><a id="__codelineno-0-1582" name="__codelineno-0-1582"></a>        <span class="p">)</span>
+</span><span id="__span-0-1583"><a id="__codelineno-0-1583" name="__codelineno-0-1583"></a>        <span class="n">max_undecided</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-1584"><a id="__codelineno-0-1584" name="__codelineno-0-1584"></a>            <span class="n">np</span><span class="o">.</span><span class="n">max</span><span class="p">(</span><span class="n">undecided_edges_per_col</span><span class="p">)</span> <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">undecided_edges_per_col</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
+</span><span id="__span-0-1585"><a id="__codelineno-0-1585" name="__codelineno-0-1585"></a>        <span class="p">)</span>
+</span><span id="__span-0-1586"><a id="__codelineno-0-1586" name="__codelineno-0-1586"></a>
+</span><span id="__span-0-1587"><a id="__codelineno-0-1587" name="__codelineno-0-1587"></a>        <span class="k">if</span> <span class="n">max_undecided</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-1588"><a id="__codelineno-0-1588" name="__codelineno-0-1588"></a>            <span class="n">max_undecided_idx</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argmax</span><span class="p">(</span><span class="n">undecided_edges_per_col</span><span class="p">)</span>
+</span><span id="__span-0-1589"><a id="__codelineno-0-1589" name="__codelineno-0-1589"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span> <span class="o">=</span> <span class="n">node_names</span><span class="p">[</span><span class="n">max_undecided_idx</span><span class="p">]</span>
+</span><span id="__span-0-1590"><a id="__codelineno-0-1590" name="__codelineno-0-1590"></a>            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span>
+</span><span id="__span-0-1591"><a id="__codelineno-0-1591" name="__codelineno-0-1591"></a>
+</span><span id="__span-0-1592"><a id="__codelineno-0-1592" name="__codelineno-0-1592"></a>        <span class="c1"># If no suggestion was found, try to find a suggestion from the entire collection of prepared variables.</span>
+</span><span id="__span-0-1593"><a id="__codelineno-0-1593" name="__codelineno-0-1593"></a>        <span class="n">undecided_edges_per_col</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">m</span> <span class="o">==</span> <span class="mi">0</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="__span-0-1594"><a id="__codelineno-0-1594" name="__codelineno-0-1594"></a>        <span class="n">max_undecided</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">max</span><span class="p">(</span><span class="n">undecided_edges_per_col</span><span class="p">)</span>
+</span><span id="__span-0-1595"><a id="__codelineno-0-1595" name="__codelineno-0-1595"></a>
+</span><span id="__span-0-1596"><a id="__codelineno-0-1596" name="__codelineno-0-1596"></a>        <span class="k">if</span> <span class="n">max_undecided</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-1597"><a id="__codelineno-0-1597" name="__codelineno-0-1597"></a>            <span class="n">max_undecided_idx</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argmax</span><span class="p">(</span><span class="n">undecided_edges_per_col</span><span class="p">)</span>
+</span><span id="__span-0-1598"><a id="__codelineno-0-1598" name="__codelineno-0-1598"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-1599"><a id="__codelineno-0-1599" name="__codelineno-0-1599"></a>                <span class="n">max_undecided_idx</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span>
+</span><span id="__span-0-1600"><a id="__codelineno-0-1600" name="__codelineno-0-1600"></a>            <span class="p">]</span>
+</span><span id="__span-0-1601"><a id="__codelineno-0-1601" name="__codelineno-0-1601"></a>            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span>
+</span><span id="__span-0-1602"><a id="__codelineno-0-1602" name="__codelineno-0-1602"></a>
+</span><span id="__span-0-1603"><a id="__codelineno-0-1603" name="__codelineno-0-1603"></a>        <span class="c1"># If no suggestion was found, return None.</span>
+</span><span id="__span-0-1604"><a id="__codelineno-0-1604" name="__codelineno-0-1604"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-1605"><a id="__codelineno-0-1605" name="__codelineno-0-1605"></a>        <span class="k">return</span> <span class="kc">None</span>
+</span><span id="__span-0-1606"><a id="__codelineno-0-1606" name="__codelineno-0-1606"></a>
+</span><span id="__span-0-1607"><a id="__codelineno-0-1607" name="__codelineno-0-1607"></a>    <span class="k">def</span> <span class="nf">discover_graph</span><span class="p">(</span>
+</span><span id="__span-0-1608"><a id="__codelineno-0-1608" name="__codelineno-0-1608"></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-1609"><a id="__codelineno-0-1609" name="__codelineno-0-1609"></a>        <span class="n">method</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;hill_climb&quot;</span><span class="p">,</span>
+</span><span id="__span-0-1610"><a id="__codelineno-0-1610" name="__codelineno-0-1610"></a>        <span class="n">max_cond_vars</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">3</span><span class="p">,</span>
+</span><span id="__span-0-1611"><a id="__codelineno-0-1611" name="__codelineno-0-1611"></a>        <span class="n">model</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;gpt-3.5-turbo&quot;</span><span class="p">,</span>
+</span><span id="__span-0-1612"><a id="__codelineno-0-1612" name="__codelineno-0-1612"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-1613"><a id="__codelineno-0-1613" name="__codelineno-0-1613"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1614"><a id="__codelineno-0-1614" name="__codelineno-0-1614"></a><span class="sd">        Discover a causal graph based on the prepared table automatically.</span>
+</span><span id="__span-0-1615"><a id="__codelineno-0-1615" name="__codelineno-0-1615"></a>
+</span><span id="__span-0-1616"><a id="__codelineno-0-1616" name="__codelineno-0-1616"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-1617"><a id="__codelineno-0-1617" name="__codelineno-0-1617"></a><span class="sd">            method: The method to be used for graph discovery, among &quot;PC&quot;, &quot;hill_climb&quot;, &quot;exhaustive&quot; and &quot;GPT&quot;.</span>
+</span><span id="__span-0-1618"><a id="__codelineno-0-1618" name="__codelineno-0-1618"></a><span class="sd">            max_cond_vars: The maximum number of conditioning variables to be used for PC.</span>
+</span><span id="__span-0-1619"><a id="__codelineno-0-1619" name="__codelineno-0-1619"></a><span class="sd">            model: The model to be used for GPT-based graph discovery.</span>
+</span><span id="__span-0-1620"><a id="__codelineno-0-1620" name="__codelineno-0-1620"></a>
+</span><span id="__span-0-1621"><a id="__codelineno-0-1621" name="__codelineno-0-1621"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1622"><a id="__codelineno-0-1622" name="__codelineno-0-1622"></a>
+</span><span id="__span-0-1623"><a id="__codelineno-0-1623" name="__codelineno-0-1623"></a>        <span class="k">if</span> <span class="n">method</span> <span class="o">==</span> <span class="s2">&quot;PC&quot;</span><span class="p">:</span>
+</span><span id="__span-0-1624"><a id="__codelineno-0-1624" name="__codelineno-0-1624"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span> <span class="o">=</span> <span class="n">CausalDiscoverer</span><span class="o">.</span><span class="n">pc</span><span class="p">(</span>
+</span><span id="__span-0-1625"><a id="__codelineno-0-1625" name="__codelineno-0-1625"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span> <span class="n">max_cond_vars</span><span class="o">=</span><span class="n">max_cond_vars</span>
+</span><span id="__span-0-1626"><a id="__codelineno-0-1626" name="__codelineno-0-1626"></a>            <span class="p">)</span>
+</span><span id="__span-0-1627"><a id="__codelineno-0-1627" name="__codelineno-0-1627"></a>        <span class="k">elif</span> <span class="n">method</span> <span class="o">==</span> <span class="s2">&quot;hill_climb&quot;</span><span class="p">:</span>
+</span><span id="__span-0-1628"><a id="__codelineno-0-1628" name="__codelineno-0-1628"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span> <span class="o">=</span> <span class="n">CausalDiscoverer</span><span class="o">.</span><span class="n">hill_climb</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">)</span>
+</span><span id="__span-0-1629"><a id="__codelineno-0-1629" name="__codelineno-0-1629"></a>        <span class="k">elif</span> <span class="n">method</span> <span class="o">==</span> <span class="s2">&quot;exhaustive&quot;</span><span class="p">:</span>
+</span><span id="__span-0-1630"><a id="__codelineno-0-1630" name="__codelineno-0-1630"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span> <span class="o">=</span> <span class="n">CausalDiscoverer</span><span class="o">.</span><span class="n">exhaustive</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">)</span>
+</span><span id="__span-0-1631"><a id="__codelineno-0-1631" name="__codelineno-0-1631"></a>        <span class="k">elif</span> <span class="n">method</span> <span class="o">==</span> <span class="s2">&quot;GPT&quot;</span><span class="p">:</span>
+</span><span id="__span-0-1632"><a id="__codelineno-0-1632" name="__codelineno-0-1632"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span> <span class="o">=</span> <span class="n">CausalDiscoverer</span><span class="o">.</span><span class="n">gpt</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span> <span class="n">model</span><span class="o">=</span><span class="n">model</span><span class="p">)</span>
+</span><span id="__span-0-1633"><a id="__codelineno-0-1633" name="__codelineno-0-1633"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-1634"><a id="__codelineno-0-1634" name="__codelineno-0-1634"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Invalid graph discovery method </span><span class="si">{</span><span class="n">method</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1635"><a id="__codelineno-0-1635" name="__codelineno-0-1635"></a>
+</span><span id="__span-0-1636"><a id="__codelineno-0-1636" name="__codelineno-0-1636"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">clear_and_set_from_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">)</span>
+</span><span id="__span-0-1637"><a id="__codelineno-0-1637" name="__codelineno-0-1637"></a>
+</span><span id="__span-0-1638"><a id="__codelineno-0-1638" name="__codelineno-0-1638"></a>    <span class="k">def</span> <span class="nf">get_adjusted_ate</span><span class="p">(</span>
+</span><span id="__span-0-1639"><a id="__codelineno-0-1639" name="__codelineno-0-1639"></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-1640"><a id="__codelineno-0-1640" name="__codelineno-0-1640"></a>        <span class="n">treatment</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-1641"><a id="__codelineno-0-1641" name="__codelineno-0-1641"></a>        <span class="n">outcome</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-1642"><a id="__codelineno-0-1642" name="__codelineno-0-1642"></a>        <span class="n">confounder</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-1643"><a id="__codelineno-0-1643" name="__codelineno-0-1643"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
+</span><span id="__span-0-1644"><a id="__codelineno-0-1644" name="__codelineno-0-1644"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1645"><a id="__codelineno-0-1645" name="__codelineno-0-1645"></a><span class="sd">        Calculate the adjusted ATE of `treatment` on `outcome`, given the current partial causal graph.</span>
+</span><span id="__span-0-1646"><a id="__codelineno-0-1646" name="__codelineno-0-1646"></a>
+</span><span id="__span-0-1647"><a id="__codelineno-0-1647" name="__codelineno-0-1647"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-1648"><a id="__codelineno-0-1648" name="__codelineno-0-1648"></a><span class="sd">            treatment: The name or tag of the treatment variable.</span>
+</span><span id="__span-0-1649"><a id="__codelineno-0-1649" name="__codelineno-0-1649"></a><span class="sd">            outcome: The name or tag of the outcome variable.</span>
+</span><span id="__span-0-1650"><a id="__codelineno-0-1650" name="__codelineno-0-1650"></a><span class="sd">            confounder: The name or tag of a confounder variable. If specified, overrides the current partial</span>
+</span><span id="__span-0-1651"><a id="__codelineno-0-1651" name="__codelineno-0-1651"></a><span class="sd">                causal graph in favor of a three-node graph with `treatment`, `outcome` and `confounder`.</span>
+</span><span id="__span-0-1652"><a id="__codelineno-0-1652" name="__codelineno-0-1652"></a>
+</span><span id="__span-0-1653"><a id="__codelineno-0-1653" name="__codelineno-0-1653"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-1654"><a id="__codelineno-0-1654" name="__codelineno-0-1654"></a><span class="sd">            The adjusted ATE of `treatment` on `outcome`.</span>
+</span><span id="__span-0-1655"><a id="__codelineno-0-1655" name="__codelineno-0-1655"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1656"><a id="__codelineno-0-1656" name="__codelineno-0-1656"></a>        <span class="k">return</span> <span class="n">ATECalculator</span><span class="o">.</span><span class="n">get_ate_and_confidence</span><span class="p">(</span>
+</span><span id="__span-0-1657"><a id="__codelineno-0-1657" name="__codelineno-0-1657"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">prepared_log</span><span class="p">,</span>
+</span><span id="__span-0-1658"><a id="__codelineno-0-1658" name="__codelineno-0-1658"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variables</span><span class="p">,</span>
+</span><span id="__span-0-1659"><a id="__codelineno-0-1659" name="__codelineno-0-1659"></a>            <span class="n">treatment</span><span class="p">,</span>
+</span><span id="__span-0-1660"><a id="__codelineno-0-1660" name="__codelineno-0-1660"></a>            <span class="n">outcome</span><span class="p">,</span>
+</span><span id="__span-0-1661"><a id="__codelineno-0-1661" name="__codelineno-0-1661"></a>            <span class="n">confounder</span><span class="p">,</span>
+</span><span id="__span-0-1662"><a id="__codelineno-0-1662" name="__codelineno-0-1662"></a>            <span class="n">graph</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span>
+</span><span id="__span-0-1663"><a id="__codelineno-0-1663" name="__codelineno-0-1663"></a>            <span class="n">calculate_p_value</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-1664"><a id="__codelineno-0-1664" name="__codelineno-0-1664"></a>            <span class="n">calculate_std_error</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-1665"><a id="__codelineno-0-1665" name="__codelineno-0-1665"></a>        <span class="p">)[</span><span class="s2">&quot;ATE&quot;</span><span class="p">]</span>
+</span><span id="__span-0-1666"><a id="__codelineno-0-1666" name="__codelineno-0-1666"></a>
+</span><span id="__span-0-1667"><a id="__codelineno-0-1667" name="__codelineno-0-1667"></a>    <span class="k">def</span> <span class="nf">get_unadjusted_ate</span><span class="p">(</span>
+</span><span id="__span-0-1668"><a id="__codelineno-0-1668" name="__codelineno-0-1668"></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-1669"><a id="__codelineno-0-1669" name="__codelineno-0-1669"></a>        <span class="n">treatment</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-1670"><a id="__codelineno-0-1670" name="__codelineno-0-1670"></a>        <span class="n">outcome</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-1671"><a id="__codelineno-0-1671" name="__codelineno-0-1671"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
+</span><span id="__span-0-1672"><a id="__codelineno-0-1672" name="__codelineno-0-1672"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1673"><a id="__codelineno-0-1673" name="__codelineno-0-1673"></a><span class="sd">        Calculate the unadjusted ATE of `treatment` on `outcome`, ignoring the current partial causal graph</span>
+</span><span id="__span-0-1674"><a id="__codelineno-0-1674" name="__codelineno-0-1674"></a><span class="sd">        in favor of a two-node graph with just `treatment` and `outcome`.</span>
+</span><span id="__span-0-1675"><a id="__codelineno-0-1675" name="__codelineno-0-1675"></a>
+</span><span id="__span-0-1676"><a id="__codelineno-0-1676" name="__codelineno-0-1676"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-1677"><a id="__codelineno-0-1677" name="__codelineno-0-1677"></a><span class="sd">            treatment: The name or tag of the treatment variable.</span>
+</span><span id="__span-0-1678"><a id="__codelineno-0-1678" name="__codelineno-0-1678"></a><span class="sd">            outcome: The name or tag of the outcome variable.</span>
+</span><span id="__span-0-1679"><a id="__codelineno-0-1679" name="__codelineno-0-1679"></a>
+</span><span id="__span-0-1680"><a id="__codelineno-0-1680" name="__codelineno-0-1680"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-1681"><a id="__codelineno-0-1681" name="__codelineno-0-1681"></a><span class="sd">            The unadjusted ATE of `treatment` on `outcome`.</span>
+</span><span id="__span-0-1682"><a id="__codelineno-0-1682" name="__codelineno-0-1682"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1683"><a id="__codelineno-0-1683" name="__codelineno-0-1683"></a>        <span class="k">return</span> <span class="n">ATECalculator</span><span class="o">.</span><span class="n">get_ate_and_confidence</span><span class="p">(</span>
+</span><span id="__span-0-1684"><a id="__codelineno-0-1684" name="__codelineno-0-1684"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">prepared_log</span><span class="p">,</span>
+</span><span id="__span-0-1685"><a id="__codelineno-0-1685" name="__codelineno-0-1685"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variables</span><span class="p">,</span>
+</span><span id="__span-0-1686"><a id="__codelineno-0-1686" name="__codelineno-0-1686"></a>            <span class="n">treatment</span><span class="p">,</span>
+</span><span id="__span-0-1687"><a id="__codelineno-0-1687" name="__codelineno-0-1687"></a>            <span class="n">outcome</span><span class="p">,</span>
+</span><span id="__span-0-1688"><a id="__codelineno-0-1688" name="__codelineno-0-1688"></a>            <span class="n">calculate_p_value</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-1689"><a id="__codelineno-0-1689" name="__codelineno-0-1689"></a>            <span class="n">calculate_std_error</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-1690"><a id="__codelineno-0-1690" name="__codelineno-0-1690"></a>        <span class="p">)[</span><span class="s2">&quot;ATE&quot;</span><span class="p">]</span>
 </span></code></pre></div></td></tr></table></div>
               </details>
 
@@ -5728,13 +5770,13 @@ <h3 id="logos.logos.LOGos.__init__" class="doc doc-heading">
 </span><span id="__span-0-179"><a id="__codelineno-0-179" name="__codelineno-0-179"></a>
 </span><span id="__span-0-180"><a id="__codelineno-0-180" name="__codelineno-0-180"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_set_vars_to_defaults</span><span class="p">()</span>
 </span><span id="__span-0-181"><a id="__codelineno-0-181" name="__codelineno-0-181"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_filename</span> <span class="o">=</span> <span class="n">filename</span>
-</span><span id="__span-0-182"><a id="__codelineno-0-182" name="__codelineno-0-182"></a>    <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Initialized LOGos with log file </span><span class="si">{</span><span class="n">filename</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-182"><a id="__codelineno-0-182" name="__codelineno-0-182"></a>    <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Initialized LOGos with log file </span><span class="si">{</span><span class="n">filename</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
 </span><span id="__span-0-183"><a id="__codelineno-0-183" name="__codelineno-0-183"></a>
 </span><span id="__span-0-184"><a id="__codelineno-0-184" name="__codelineno-0-184"></a>    <span class="c1"># Set and create working directory</span>
 </span><span id="__span-0-185"><a id="__codelineno-0-185" name="__codelineno-0-185"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_workdir</span> <span class="o">=</span> <span class="n">workdir</span>
 </span><span id="__span-0-186"><a id="__codelineno-0-186" name="__codelineno-0-186"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">exists</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_workdir</span><span class="p">):</span>
 </span><span id="__span-0-187"><a id="__codelineno-0-187" name="__codelineno-0-187"></a>        <span class="n">os</span><span class="o">.</span><span class="n">makedirs</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_workdir</span><span class="p">,</span> <span class="n">exist_ok</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-188"><a id="__codelineno-0-188" name="__codelineno-0-188"></a>    <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Work directory set to </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_workdir</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-188"><a id="__codelineno-0-188" name="__codelineno-0-188"></a>    <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Work directory set to </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_workdir</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
 </span><span id="__span-0-189"><a id="__codelineno-0-189" name="__codelineno-0-189"></a>
 </span><span id="__span-0-190"><a id="__codelineno-0-190" name="__codelineno-0-190"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_skip_writeout</span> <span class="o">=</span> <span class="n">skip_writeout</span>
 </span></code></pre></div></td></tr></table></div>
@@ -5746,6 +5788,75 @@ <h3 id="logos.logos.LOGos.__init__" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
+<h3 id="logos.logos.LOGos.set_verbose_to" class="doc doc-heading">
+            <code class="highlight language-python"><span class="n">set_verbose_to</span><span class="p">(</span><span class="n">val</span><span class="p">)</span></code>
+
+</h3>
+
+
+    <div class="doc doc-contents ">
+
+      <p>Set the verbosity of the printer.</p>
+
+
+<p><span class="doc-section-title">Parameters:</span></p>
+    <table>
+      <thead>
+        <tr>
+          <th>Name</th>
+          <th>Type</th>
+          <th>Description</th>
+          <th>Default</th>
+        </tr>
+      </thead>
+      <tbody>
+          <tr class="doc-section-item">
+            <td><code>val</code></td>
+            <td>
+                  <code>bool</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>The new verbosity value.</p>
+              </div>
+            </td>
+            <td>
+                <em>required</em>
+            </td>
+          </tr>
+      </tbody>
+    </table>
+
+            <details class="quote">
+              <summary>Source code in <code>src/logos/logos.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-192">192</a></span>
+<span class="normal"><a href="#__codelineno-0-193">193</a></span>
+<span class="normal"><a href="#__codelineno-0-194">194</a></span>
+<span class="normal"><a href="#__codelineno-0-195">195</a></span>
+<span class="normal"><a href="#__codelineno-0-196">196</a></span>
+<span class="normal"><a href="#__codelineno-0-197">197</a></span>
+<span class="normal"><a href="#__codelineno-0-198">198</a></span>
+<span class="normal"><a href="#__codelineno-0-199">199</a></span>
+<span class="normal"><a href="#__codelineno-0-200">200</a></span>
+<span class="normal"><a href="#__codelineno-0-201">201</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-192"><a id="__codelineno-0-192" name="__codelineno-0-192"></a><span class="k">def</span> <span class="nf">set_verbose_to</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">val</span><span class="p">:</span> <span class="nb">bool</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-193"><a id="__codelineno-0-193" name="__codelineno-0-193"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-194"><a id="__codelineno-0-194" name="__codelineno-0-194"></a><span class="sd">    Set the verbosity of the printer.</span>
+</span><span id="__span-0-195"><a id="__codelineno-0-195" name="__codelineno-0-195"></a>
+</span><span id="__span-0-196"><a id="__codelineno-0-196" name="__codelineno-0-196"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-197"><a id="__codelineno-0-197" name="__codelineno-0-197"></a><span class="sd">        val: The new verbosity value.</span>
+</span><span id="__span-0-198"><a id="__codelineno-0-198" name="__codelineno-0-198"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-199"><a id="__codelineno-0-199" name="__codelineno-0-199"></a>    <span class="n">Printer</span><span class="o">.</span><span class="n">set_verbose</span><span class="p">(</span><span class="n">val</span><span class="p">)</span>
+</span><span id="__span-0-200"><a id="__codelineno-0-200" name="__codelineno-0-200"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="p">:</span>
+</span><span id="__span-0-201"><a id="__codelineno-0-201" name="__codelineno-0-201"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">set_verbose_to</span><span class="p">(</span><span class="n">val</span><span class="p">)</span>
+</span></code></pre></div></td></tr></table></div>
+            </details>
+    </div>
+
+</div>
+
+<div class="doc doc-object doc-function">
+
+
 <h3 id="logos.logos.LOGos._get_filename" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">_get_filename</span><span class="p">(</span><span class="n">var_name</span><span class="p">)</span></code>
 
@@ -5810,35 +5921,35 @@ <h3 id="logos.logos.LOGos._get_filename" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-192">192</a></span>
-<span class="normal"><a href="#__codelineno-0-193">193</a></span>
-<span class="normal"><a href="#__codelineno-0-194">194</a></span>
-<span class="normal"><a href="#__codelineno-0-195">195</a></span>
-<span class="normal"><a href="#__codelineno-0-196">196</a></span>
-<span class="normal"><a href="#__codelineno-0-197">197</a></span>
-<span class="normal"><a href="#__codelineno-0-198">198</a></span>
-<span class="normal"><a href="#__codelineno-0-199">199</a></span>
-<span class="normal"><a href="#__codelineno-0-200">200</a></span>
-<span class="normal"><a href="#__codelineno-0-201">201</a></span>
-<span class="normal"><a href="#__codelineno-0-202">202</a></span>
-<span class="normal"><a href="#__codelineno-0-203">203</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-203">203</a></span>
 <span class="normal"><a href="#__codelineno-0-204">204</a></span>
 <span class="normal"><a href="#__codelineno-0-205">205</a></span>
-<span class="normal"><a href="#__codelineno-0-206">206</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-192"><a id="__codelineno-0-192" name="__codelineno-0-192"></a><span class="k">def</span> <span class="nf">_get_filename</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">var_name</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-</span><span id="__span-0-193"><a id="__codelineno-0-193" name="__codelineno-0-193"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-194"><a id="__codelineno-0-194" name="__codelineno-0-194"></a><span class="sd">    Create the file name string for dumping/loading pkl files.</span>
-</span><span id="__span-0-195"><a id="__codelineno-0-195" name="__codelineno-0-195"></a>
-</span><span id="__span-0-196"><a id="__codelineno-0-196" name="__codelineno-0-196"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-197"><a id="__codelineno-0-197" name="__codelineno-0-197"></a><span class="sd">        var_name: The name of the variable to be dumped/loaded.</span>
-</span><span id="__span-0-198"><a id="__codelineno-0-198" name="__codelineno-0-198"></a>
-</span><span id="__span-0-199"><a id="__codelineno-0-199" name="__codelineno-0-199"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-200"><a id="__codelineno-0-200" name="__codelineno-0-200"></a><span class="sd">        The file name string.</span>
-</span><span id="__span-0-201"><a id="__codelineno-0-201" name="__codelineno-0-201"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-202"><a id="__codelineno-0-202" name="__codelineno-0-202"></a>    <span class="k">return</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span>
-</span><span id="__span-0-203"><a id="__codelineno-0-203" name="__codelineno-0-203"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_workdir</span><span class="p">,</span>
-</span><span id="__span-0-204"><a id="__codelineno-0-204" name="__codelineno-0-204"></a>        <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">basename</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_filename</span><span class="p">)</span>
-</span><span id="__span-0-205"><a id="__codelineno-0-205" name="__codelineno-0-205"></a>        <span class="o">+</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">var_name</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span><span class="si">}</span><span class="s2">.pkl&quot;</span><span class="p">,</span>
-</span><span id="__span-0-206"><a id="__codelineno-0-206" name="__codelineno-0-206"></a>    <span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-206">206</a></span>
+<span class="normal"><a href="#__codelineno-0-207">207</a></span>
+<span class="normal"><a href="#__codelineno-0-208">208</a></span>
+<span class="normal"><a href="#__codelineno-0-209">209</a></span>
+<span class="normal"><a href="#__codelineno-0-210">210</a></span>
+<span class="normal"><a href="#__codelineno-0-211">211</a></span>
+<span class="normal"><a href="#__codelineno-0-212">212</a></span>
+<span class="normal"><a href="#__codelineno-0-213">213</a></span>
+<span class="normal"><a href="#__codelineno-0-214">214</a></span>
+<span class="normal"><a href="#__codelineno-0-215">215</a></span>
+<span class="normal"><a href="#__codelineno-0-216">216</a></span>
+<span class="normal"><a href="#__codelineno-0-217">217</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-203"><a id="__codelineno-0-203" name="__codelineno-0-203"></a><span class="k">def</span> <span class="nf">_get_filename</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">var_name</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-204"><a id="__codelineno-0-204" name="__codelineno-0-204"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-205"><a id="__codelineno-0-205" name="__codelineno-0-205"></a><span class="sd">    Create the file name string for dumping/loading pkl files.</span>
+</span><span id="__span-0-206"><a id="__codelineno-0-206" name="__codelineno-0-206"></a>
+</span><span id="__span-0-207"><a id="__codelineno-0-207" name="__codelineno-0-207"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-208"><a id="__codelineno-0-208" name="__codelineno-0-208"></a><span class="sd">        var_name: The name of the variable to be dumped/loaded.</span>
+</span><span id="__span-0-209"><a id="__codelineno-0-209" name="__codelineno-0-209"></a>
+</span><span id="__span-0-210"><a id="__codelineno-0-210" name="__codelineno-0-210"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-211"><a id="__codelineno-0-211" name="__codelineno-0-211"></a><span class="sd">        The file name string.</span>
+</span><span id="__span-0-212"><a id="__codelineno-0-212" name="__codelineno-0-212"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-213"><a id="__codelineno-0-213" name="__codelineno-0-213"></a>    <span class="k">return</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span>
+</span><span id="__span-0-214"><a id="__codelineno-0-214" name="__codelineno-0-214"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_workdir</span><span class="p">,</span>
+</span><span id="__span-0-215"><a id="__codelineno-0-215" name="__codelineno-0-215"></a>        <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">basename</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_filename</span><span class="p">)</span>
+</span><span id="__span-0-216"><a id="__codelineno-0-216" name="__codelineno-0-216"></a>        <span class="o">+</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">var_name</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span><span class="si">}</span><span class="s2">.pkl&quot;</span><span class="p">,</span>
+</span><span id="__span-0-217"><a id="__codelineno-0-217" name="__codelineno-0-217"></a>    <span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -5912,18 +6023,7 @@ <h3 id="logos.logos.LOGos._find_type" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-208">208</a></span>
-<span class="normal"><a href="#__codelineno-0-209">209</a></span>
-<span class="normal"><a href="#__codelineno-0-210">210</a></span>
-<span class="normal"><a href="#__codelineno-0-211">211</a></span>
-<span class="normal"><a href="#__codelineno-0-212">212</a></span>
-<span class="normal"><a href="#__codelineno-0-213">213</a></span>
-<span class="normal"><a href="#__codelineno-0-214">214</a></span>
-<span class="normal"><a href="#__codelineno-0-215">215</a></span>
-<span class="normal"><a href="#__codelineno-0-216">216</a></span>
-<span class="normal"><a href="#__codelineno-0-217">217</a></span>
-<span class="normal"><a href="#__codelineno-0-218">218</a></span>
-<span class="normal"><a href="#__codelineno-0-219">219</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-219">219</a></span>
 <span class="normal"><a href="#__codelineno-0-220">220</a></span>
 <span class="normal"><a href="#__codelineno-0-221">221</a></span>
 <span class="normal"><a href="#__codelineno-0-222">222</a></span>
@@ -5938,33 +6038,44 @@ <h3 id="logos.logos.LOGos._find_type" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-231">231</a></span>
 <span class="normal"><a href="#__codelineno-0-232">232</a></span>
 <span class="normal"><a href="#__codelineno-0-233">233</a></span>
-<span class="normal"><a href="#__codelineno-0-234">234</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-208"><a id="__codelineno-0-208" name="__codelineno-0-208"></a><span class="k">def</span> <span class="nf">_find_type</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">row</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-</span><span id="__span-0-209"><a id="__codelineno-0-209" name="__codelineno-0-209"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-210"><a id="__codelineno-0-210" name="__codelineno-0-210"></a><span class="sd">    Identify the type of a parsed variable.</span>
-</span><span id="__span-0-211"><a id="__codelineno-0-211" name="__codelineno-0-211"></a>
-</span><span id="__span-0-212"><a id="__codelineno-0-212" name="__codelineno-0-212"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-213"><a id="__codelineno-0-213" name="__codelineno-0-213"></a><span class="sd">        row: A row of the parsed variables dataframe.</span>
-</span><span id="__span-0-214"><a id="__codelineno-0-214" name="__codelineno-0-214"></a>
-</span><span id="__span-0-215"><a id="__codelineno-0-215" name="__codelineno-0-215"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-216"><a id="__codelineno-0-216" name="__codelineno-0-216"></a><span class="sd">        The type of the parsed variable as a string. Options are &quot;date&quot;, &quot;time&quot;, &quot;num&quot; and &quot;str&quot;.</span>
-</span><span id="__span-0-217"><a id="__codelineno-0-217" name="__codelineno-0-217"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-218"><a id="__codelineno-0-218" name="__codelineno-0-218"></a>
-</span><span id="__span-0-219"><a id="__codelineno-0-219" name="__codelineno-0-219"></a>    <span class="k">with</span> <span class="n">warnings</span><span class="o">.</span><span class="n">catch_warnings</span><span class="p">():</span>
-</span><span id="__span-0-220"><a id="__codelineno-0-220" name="__codelineno-0-220"></a>        <span class="n">warnings</span><span class="o">.</span><span class="n">filterwarnings</span><span class="p">(</span><span class="s2">&quot;error&quot;</span><span class="p">,</span> <span class="n">category</span><span class="o">=</span><span class="ne">UserWarning</span><span class="p">)</span>
-</span><span id="__span-0-221"><a id="__codelineno-0-221" name="__codelineno-0-221"></a>
-</span><span id="__span-0-222"><a id="__codelineno-0-222" name="__codelineno-0-222"></a>        <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-223"><a id="__codelineno-0-223" name="__codelineno-0-223"></a>            <span class="n">y</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">to_numeric</span><span class="p">(</span><span class="n">row</span><span class="p">[</span><span class="s2">&quot;Examples&quot;</span><span class="p">],</span> <span class="n">errors</span><span class="o">=</span><span class="s2">&quot;raise&quot;</span><span class="p">)</span>
-</span><span id="__span-0-224"><a id="__codelineno-0-224" name="__codelineno-0-224"></a>            <span class="k">return</span> <span class="s2">&quot;num&quot;</span>
-</span><span id="__span-0-225"><a id="__codelineno-0-225" name="__codelineno-0-225"></a>        <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
-</span><span id="__span-0-226"><a id="__codelineno-0-226" name="__codelineno-0-226"></a>            <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-227"><a id="__codelineno-0-227" name="__codelineno-0-227"></a>                <span class="n">y</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">to_timedelta</span><span class="p">(</span><span class="n">row</span><span class="p">[</span><span class="s2">&quot;Examples&quot;</span><span class="p">],</span> <span class="n">errors</span><span class="o">=</span><span class="s2">&quot;raise&quot;</span><span class="p">)</span>
-</span><span id="__span-0-228"><a id="__codelineno-0-228" name="__codelineno-0-228"></a>                <span class="k">return</span> <span class="s2">&quot;time&quot;</span>
-</span><span id="__span-0-229"><a id="__codelineno-0-229" name="__codelineno-0-229"></a>            <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
-</span><span id="__span-0-230"><a id="__codelineno-0-230" name="__codelineno-0-230"></a>                <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-231"><a id="__codelineno-0-231" name="__codelineno-0-231"></a>                    <span class="n">y</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">to_datetime</span><span class="p">(</span><span class="n">row</span><span class="p">[</span><span class="s2">&quot;Examples&quot;</span><span class="p">],</span> <span class="n">errors</span><span class="o">=</span><span class="s2">&quot;raise&quot;</span><span class="p">)</span>
-</span><span id="__span-0-232"><a id="__codelineno-0-232" name="__codelineno-0-232"></a>                    <span class="k">return</span> <span class="s2">&quot;date&quot;</span>
-</span><span id="__span-0-233"><a id="__codelineno-0-233" name="__codelineno-0-233"></a>                <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
-</span><span id="__span-0-234"><a id="__codelineno-0-234" name="__codelineno-0-234"></a>                    <span class="k">return</span> <span class="s2">&quot;str&quot;</span>
+<span class="normal"><a href="#__codelineno-0-234">234</a></span>
+<span class="normal"><a href="#__codelineno-0-235">235</a></span>
+<span class="normal"><a href="#__codelineno-0-236">236</a></span>
+<span class="normal"><a href="#__codelineno-0-237">237</a></span>
+<span class="normal"><a href="#__codelineno-0-238">238</a></span>
+<span class="normal"><a href="#__codelineno-0-239">239</a></span>
+<span class="normal"><a href="#__codelineno-0-240">240</a></span>
+<span class="normal"><a href="#__codelineno-0-241">241</a></span>
+<span class="normal"><a href="#__codelineno-0-242">242</a></span>
+<span class="normal"><a href="#__codelineno-0-243">243</a></span>
+<span class="normal"><a href="#__codelineno-0-244">244</a></span>
+<span class="normal"><a href="#__codelineno-0-245">245</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-219"><a id="__codelineno-0-219" name="__codelineno-0-219"></a><span class="k">def</span> <span class="nf">_find_type</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">row</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-220"><a id="__codelineno-0-220" name="__codelineno-0-220"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-221"><a id="__codelineno-0-221" name="__codelineno-0-221"></a><span class="sd">    Identify the type of a parsed variable.</span>
+</span><span id="__span-0-222"><a id="__codelineno-0-222" name="__codelineno-0-222"></a>
+</span><span id="__span-0-223"><a id="__codelineno-0-223" name="__codelineno-0-223"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-224"><a id="__codelineno-0-224" name="__codelineno-0-224"></a><span class="sd">        row: A row of the parsed variables dataframe.</span>
+</span><span id="__span-0-225"><a id="__codelineno-0-225" name="__codelineno-0-225"></a>
+</span><span id="__span-0-226"><a id="__codelineno-0-226" name="__codelineno-0-226"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-227"><a id="__codelineno-0-227" name="__codelineno-0-227"></a><span class="sd">        The type of the parsed variable as a string. Options are &quot;date&quot;, &quot;time&quot;, &quot;num&quot; and &quot;str&quot;.</span>
+</span><span id="__span-0-228"><a id="__codelineno-0-228" name="__codelineno-0-228"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-229"><a id="__codelineno-0-229" name="__codelineno-0-229"></a>
+</span><span id="__span-0-230"><a id="__codelineno-0-230" name="__codelineno-0-230"></a>    <span class="k">with</span> <span class="n">warnings</span><span class="o">.</span><span class="n">catch_warnings</span><span class="p">():</span>
+</span><span id="__span-0-231"><a id="__codelineno-0-231" name="__codelineno-0-231"></a>        <span class="n">warnings</span><span class="o">.</span><span class="n">filterwarnings</span><span class="p">(</span><span class="s2">&quot;error&quot;</span><span class="p">,</span> <span class="n">category</span><span class="o">=</span><span class="ne">UserWarning</span><span class="p">)</span>
+</span><span id="__span-0-232"><a id="__codelineno-0-232" name="__codelineno-0-232"></a>
+</span><span id="__span-0-233"><a id="__codelineno-0-233" name="__codelineno-0-233"></a>        <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-234"><a id="__codelineno-0-234" name="__codelineno-0-234"></a>            <span class="n">y</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">to_numeric</span><span class="p">(</span><span class="n">row</span><span class="p">[</span><span class="s2">&quot;Examples&quot;</span><span class="p">],</span> <span class="n">errors</span><span class="o">=</span><span class="s2">&quot;raise&quot;</span><span class="p">)</span>
+</span><span id="__span-0-235"><a id="__codelineno-0-235" name="__codelineno-0-235"></a>            <span class="k">return</span> <span class="s2">&quot;num&quot;</span>
+</span><span id="__span-0-236"><a id="__codelineno-0-236" name="__codelineno-0-236"></a>        <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-237"><a id="__codelineno-0-237" name="__codelineno-0-237"></a>            <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-238"><a id="__codelineno-0-238" name="__codelineno-0-238"></a>                <span class="n">y</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">to_timedelta</span><span class="p">(</span><span class="n">row</span><span class="p">[</span><span class="s2">&quot;Examples&quot;</span><span class="p">],</span> <span class="n">errors</span><span class="o">=</span><span class="s2">&quot;raise&quot;</span><span class="p">)</span>
+</span><span id="__span-0-239"><a id="__codelineno-0-239" name="__codelineno-0-239"></a>                <span class="k">return</span> <span class="s2">&quot;time&quot;</span>
+</span><span id="__span-0-240"><a id="__codelineno-0-240" name="__codelineno-0-240"></a>            <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-241"><a id="__codelineno-0-241" name="__codelineno-0-241"></a>                <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-242"><a id="__codelineno-0-242" name="__codelineno-0-242"></a>                    <span class="n">y</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">to_datetime</span><span class="p">(</span><span class="n">row</span><span class="p">[</span><span class="s2">&quot;Examples&quot;</span><span class="p">],</span> <span class="n">errors</span><span class="o">=</span><span class="s2">&quot;raise&quot;</span><span class="p">)</span>
+</span><span id="__span-0-243"><a id="__codelineno-0-243" name="__codelineno-0-243"></a>                    <span class="k">return</span> <span class="s2">&quot;date&quot;</span>
+</span><span id="__span-0-244"><a id="__codelineno-0-244" name="__codelineno-0-244"></a>                <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-245"><a id="__codelineno-0-245" name="__codelineno-0-245"></a>                    <span class="k">return</span> <span class="s2">&quot;str&quot;</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -6038,33 +6149,33 @@ <h3 id="logos.logos.LOGos._find_uninteresting" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-236">236</a></span>
-<span class="normal"><a href="#__codelineno-0-237">237</a></span>
-<span class="normal"><a href="#__codelineno-0-238">238</a></span>
-<span class="normal"><a href="#__codelineno-0-239">239</a></span>
-<span class="normal"><a href="#__codelineno-0-240">240</a></span>
-<span class="normal"><a href="#__codelineno-0-241">241</a></span>
-<span class="normal"><a href="#__codelineno-0-242">242</a></span>
-<span class="normal"><a href="#__codelineno-0-243">243</a></span>
-<span class="normal"><a href="#__codelineno-0-244">244</a></span>
-<span class="normal"><a href="#__codelineno-0-245">245</a></span>
-<span class="normal"><a href="#__codelineno-0-246">246</a></span>
-<span class="normal"><a href="#__codelineno-0-247">247</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-247">247</a></span>
 <span class="normal"><a href="#__codelineno-0-248">248</a></span>
-<span class="normal"><a href="#__codelineno-0-249">249</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-236"><a id="__codelineno-0-236" name="__codelineno-0-236"></a><span class="k">def</span> <span class="nf">_find_uninteresting</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">row</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">bool</span><span class="p">:</span>
-</span><span id="__span-0-237"><a id="__codelineno-0-237" name="__codelineno-0-237"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-238"><a id="__codelineno-0-238" name="__codelineno-0-238"></a><span class="sd">    Identify whether a parsed variable is likely to be uninteresting.</span>
-</span><span id="__span-0-239"><a id="__codelineno-0-239" name="__codelineno-0-239"></a>
-</span><span id="__span-0-240"><a id="__codelineno-0-240" name="__codelineno-0-240"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-241"><a id="__codelineno-0-241" name="__codelineno-0-241"></a><span class="sd">        row: A row of the parsed variables dataframe.</span>
-</span><span id="__span-0-242"><a id="__codelineno-0-242" name="__codelineno-0-242"></a>
-</span><span id="__span-0-243"><a id="__codelineno-0-243" name="__codelineno-0-243"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-244"><a id="__codelineno-0-244" name="__codelineno-0-244"></a><span class="sd">        True if the variable is likely to be uninteresting, False otherwise.</span>
-</span><span id="__span-0-245"><a id="__codelineno-0-245" name="__codelineno-0-245"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-246"><a id="__codelineno-0-246" name="__codelineno-0-246"></a>    <span class="k">return</span> <span class="p">(</span>
-</span><span id="__span-0-247"><a id="__codelineno-0-247" name="__codelineno-0-247"></a>        <span class="n">row</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;num&quot;</span>
-</span><span id="__span-0-248"><a id="__codelineno-0-248" name="__codelineno-0-248"></a>        <span class="ow">and</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]]</span><span class="o">.</span><span class="n">nunique</span><span class="p">()</span> <span class="o">&gt;=</span> <span class="mf">0.15</span> <span class="o">*</span> <span class="n">row</span><span class="p">[</span><span class="s2">&quot;Occurrences&quot;</span><span class="p">])</span>
-</span><span id="__span-0-249"><a id="__codelineno-0-249" name="__codelineno-0-249"></a>    <span class="p">)</span> <span class="ow">or</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]]</span><span class="o">.</span><span class="n">nunique</span><span class="p">()</span> <span class="o">==</span> <span class="mi">1</span><span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-249">249</a></span>
+<span class="normal"><a href="#__codelineno-0-250">250</a></span>
+<span class="normal"><a href="#__codelineno-0-251">251</a></span>
+<span class="normal"><a href="#__codelineno-0-252">252</a></span>
+<span class="normal"><a href="#__codelineno-0-253">253</a></span>
+<span class="normal"><a href="#__codelineno-0-254">254</a></span>
+<span class="normal"><a href="#__codelineno-0-255">255</a></span>
+<span class="normal"><a href="#__codelineno-0-256">256</a></span>
+<span class="normal"><a href="#__codelineno-0-257">257</a></span>
+<span class="normal"><a href="#__codelineno-0-258">258</a></span>
+<span class="normal"><a href="#__codelineno-0-259">259</a></span>
+<span class="normal"><a href="#__codelineno-0-260">260</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-247"><a id="__codelineno-0-247" name="__codelineno-0-247"></a><span class="k">def</span> <span class="nf">_find_uninteresting</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">row</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">bool</span><span class="p">:</span>
+</span><span id="__span-0-248"><a id="__codelineno-0-248" name="__codelineno-0-248"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-249"><a id="__codelineno-0-249" name="__codelineno-0-249"></a><span class="sd">    Identify whether a parsed variable is likely to be uninteresting.</span>
+</span><span id="__span-0-250"><a id="__codelineno-0-250" name="__codelineno-0-250"></a>
+</span><span id="__span-0-251"><a id="__codelineno-0-251" name="__codelineno-0-251"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-252"><a id="__codelineno-0-252" name="__codelineno-0-252"></a><span class="sd">        row: A row of the parsed variables dataframe.</span>
+</span><span id="__span-0-253"><a id="__codelineno-0-253" name="__codelineno-0-253"></a>
+</span><span id="__span-0-254"><a id="__codelineno-0-254" name="__codelineno-0-254"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-255"><a id="__codelineno-0-255" name="__codelineno-0-255"></a><span class="sd">        True if the variable is likely to be uninteresting, False otherwise.</span>
+</span><span id="__span-0-256"><a id="__codelineno-0-256" name="__codelineno-0-256"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-257"><a id="__codelineno-0-257" name="__codelineno-0-257"></a>    <span class="k">return</span> <span class="p">(</span>
+</span><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a>        <span class="n">row</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;num&quot;</span>
+</span><span id="__span-0-259"><a id="__codelineno-0-259" name="__codelineno-0-259"></a>        <span class="ow">and</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]]</span><span class="o">.</span><span class="n">nunique</span><span class="p">()</span> <span class="o">&gt;=</span> <span class="mf">0.15</span> <span class="o">*</span> <span class="n">row</span><span class="p">[</span><span class="s2">&quot;Occurrences&quot;</span><span class="p">])</span>
+</span><span id="__span-0-260"><a id="__codelineno-0-260" name="__codelineno-0-260"></a>    <span class="p">)</span> <span class="ow">or</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]]</span><span class="o">.</span><span class="n">nunique</span><span class="p">()</span> <span class="o">==</span> <span class="mi">1</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -6210,18 +6321,7 @@ <h3 id="logos.logos.LOGos.parse" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-258">258</a></span>
-<span class="normal"><a href="#__codelineno-0-259">259</a></span>
-<span class="normal"><a href="#__codelineno-0-260">260</a></span>
-<span class="normal"><a href="#__codelineno-0-261">261</a></span>
-<span class="normal"><a href="#__codelineno-0-262">262</a></span>
-<span class="normal"><a href="#__codelineno-0-263">263</a></span>
-<span class="normal"><a href="#__codelineno-0-264">264</a></span>
-<span class="normal"><a href="#__codelineno-0-265">265</a></span>
-<span class="normal"><a href="#__codelineno-0-266">266</a></span>
-<span class="normal"><a href="#__codelineno-0-267">267</a></span>
-<span class="normal"><a href="#__codelineno-0-268">268</a></span>
-<span class="normal"><a href="#__codelineno-0-269">269</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-269">269</a></span>
 <span class="normal"><a href="#__codelineno-0-270">270</a></span>
 <span class="normal"><a href="#__codelineno-0-271">271</a></span>
 <span class="normal"><a href="#__codelineno-0-272">272</a></span>
@@ -6360,157 +6460,168 @@ <h3 id="logos.logos.LOGos.parse" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-405">405</a></span>
 <span class="normal"><a href="#__codelineno-0-406">406</a></span>
 <span class="normal"><a href="#__codelineno-0-407">407</a></span>
-<span class="normal"><a href="#__codelineno-0-408">408</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a><span class="k">def</span> <span class="nf">parse</span><span class="p">(</span>
-</span><span id="__span-0-259"><a id="__codelineno-0-259" name="__codelineno-0-259"></a>    <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-260"><a id="__codelineno-0-260" name="__codelineno-0-260"></a>    <span class="n">regex_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="n">DEFAULT_REGEX_DICT</span><span class="p">,</span>
-</span><span id="__span-0-261"><a id="__codelineno-0-261" name="__codelineno-0-261"></a>    <span class="n">sim_thresh</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.65</span><span class="p">,</span>
-</span><span id="__span-0-262"><a id="__codelineno-0-262" name="__codelineno-0-262"></a>    <span class="n">depth</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">5</span><span class="p">,</span>
-</span><span id="__span-0-263"><a id="__codelineno-0-263" name="__codelineno-0-263"></a>    <span class="n">force</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="__span-0-264"><a id="__codelineno-0-264" name="__codelineno-0-264"></a>    <span class="n">message_prefix</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="sa">r</span><span class="s2">&quot;.*&quot;</span><span class="p">,</span>
-</span><span id="__span-0-265"><a id="__codelineno-0-265" name="__codelineno-0-265"></a>    <span class="n">enable_gpt_tagging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="__span-0-266"><a id="__codelineno-0-266" name="__codelineno-0-266"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-</span><span id="__span-0-267"><a id="__codelineno-0-267" name="__codelineno-0-267"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-268"><a id="__codelineno-0-268" name="__codelineno-0-268"></a><span class="sd">    Parse the log file into a dataframe.</span>
-</span><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a>
-</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a><span class="sd">        regex_dict: (for Drain) A dictionary of regular expressions to be used for parsing.</span>
-</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a><span class="sd">        sim_thresh: (for Drain) The similarity threshold to be used for parsing.</span>
-</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a><span class="sd">        depth: (for Drain) The parse tree depth to be used for parsing.</span>
-</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a><span class="sd">        force: Whether to force re-parsing of the log file.</span>
-</span><span id="__span-0-275"><a id="__codelineno-0-275" name="__codelineno-0-275"></a><span class="sd">        message_prefix: A prefix used to identify the beginning of each log message.</span>
-</span><span id="__span-0-276"><a id="__codelineno-0-276" name="__codelineno-0-276"></a><span class="sd">            Can be used to collapse multiple lines into a single message. Each line that doesn&#39;t start with this</span>
-</span><span id="__span-0-277"><a id="__codelineno-0-277" name="__codelineno-0-277"></a><span class="sd">            prefix will be concatenated to the previous log message.</span>
-</span><span id="__span-0-278"><a id="__codelineno-0-278" name="__codelineno-0-278"></a><span class="sd">        enable_gpt_tagging: A boolean indicating whether GPT tagging should be enabled.</span>
-</span><span id="__span-0-279"><a id="__codelineno-0-279" name="__codelineno-0-279"></a>
-</span><span id="__span-0-280"><a id="__codelineno-0-280" name="__codelineno-0-280"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-281"><a id="__codelineno-0-281" name="__codelineno-0-281"></a><span class="sd">        The time elapsed for parsing, as a string.</span>
-</span><span id="__span-0-282"><a id="__codelineno-0-282" name="__codelineno-0-282"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-283"><a id="__codelineno-0-283" name="__codelineno-0-283"></a>    <span class="n">start_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
-</span><span id="__span-0-284"><a id="__codelineno-0-284" name="__codelineno-0-284"></a>    <span class="n">parser</span> <span class="o">=</span> <span class="n">Drain</span><span class="p">(</span>
-</span><span id="__span-0-285"><a id="__codelineno-0-285" name="__codelineno-0-285"></a>        <span class="n">indir</span><span class="o">=</span><span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">dirname</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_filename</span><span class="p">),</span>
-</span><span id="__span-0-286"><a id="__codelineno-0-286" name="__codelineno-0-286"></a>        <span class="n">depth</span><span class="o">=</span><span class="n">depth</span><span class="p">,</span>
-</span><span id="__span-0-287"><a id="__codelineno-0-287" name="__codelineno-0-287"></a>        <span class="n">st</span><span class="o">=</span><span class="n">sim_thresh</span><span class="p">,</span>
-</span><span id="__span-0-288"><a id="__codelineno-0-288" name="__codelineno-0-288"></a>        <span class="n">rex</span><span class="o">=</span><span class="n">regex_dict</span><span class="p">,</span>
-</span><span id="__span-0-289"><a id="__codelineno-0-289" name="__codelineno-0-289"></a>        <span class="n">skip_writeout</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_skip_writeout</span><span class="p">,</span>
-</span><span id="__span-0-290"><a id="__codelineno-0-290" name="__codelineno-0-290"></a>        <span class="n">message_prefix</span><span class="o">=</span><span class="n">message_prefix</span><span class="p">,</span>
-</span><span id="__span-0-291"><a id="__codelineno-0-291" name="__codelineno-0-291"></a>    <span class="p">)</span>
-</span><span id="__span-0-292"><a id="__codelineno-0-292" name="__codelineno-0-292"></a>
-</span><span id="__span-0-293"><a id="__codelineno-0-293" name="__codelineno-0-293"></a>    <span class="c1"># Check if the parsed files already exist.</span>
-</span><span id="__span-0-294"><a id="__codelineno-0-294" name="__codelineno-0-294"></a>    <span class="n">files_exist</span> <span class="o">=</span> <span class="ow">not</span> <span class="n">force</span>
-</span><span id="__span-0-295"><a id="__codelineno-0-295" name="__codelineno-0-295"></a>    <span class="n">parsed_df_names</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="__span-0-296"><a id="__codelineno-0-296" name="__codelineno-0-296"></a>        <span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">),</span>
-</span><span id="__span-0-297"><a id="__codelineno-0-297" name="__codelineno-0-297"></a>        <span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">),</span>
-</span><span id="__span-0-298"><a id="__codelineno-0-298" name="__codelineno-0-298"></a>        <span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">),</span>
-</span><span id="__span-0-299"><a id="__codelineno-0-299" name="__codelineno-0-299"></a>    <span class="p">]</span>
-</span><span id="__span-0-300"><a id="__codelineno-0-300" name="__codelineno-0-300"></a>    <span class="k">for</span> <span class="n">var_name</span> <span class="ow">in</span> <span class="n">parsed_df_names</span><span class="p">:</span>
-</span><span id="__span-0-301"><a id="__codelineno-0-301" name="__codelineno-0-301"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">isfile</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">var_name</span><span class="p">)):</span>
-</span><span id="__span-0-302"><a id="__codelineno-0-302" name="__codelineno-0-302"></a>            <span class="n">files_exist</span> <span class="o">=</span> <span class="kc">False</span>
-</span><span id="__span-0-303"><a id="__codelineno-0-303" name="__codelineno-0-303"></a>            <span class="k">break</span>
-</span><span id="__span-0-304"><a id="__codelineno-0-304" name="__codelineno-0-304"></a>
-</span><span id="__span-0-305"><a id="__codelineno-0-305" name="__codelineno-0-305"></a>    <span class="k">if</span> <span class="n">files_exist</span><span class="p">:</span>
-</span><span id="__span-0-306"><a id="__codelineno-0-306" name="__codelineno-0-306"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span> <span class="o">=</span> <span class="n">Pickler</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">parsed_df_names</span><span class="p">[</span><span class="mi">0</span><span class="p">]))</span>
-</span><span id="__span-0-307"><a id="__codelineno-0-307" name="__codelineno-0-307"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span> <span class="o">=</span> <span class="n">Pickler</span><span class="o">.</span><span class="n">load</span><span class="p">(</span>
-</span><span id="__span-0-308"><a id="__codelineno-0-308" name="__codelineno-0-308"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">parsed_df_names</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
-</span><span id="__span-0-309"><a id="__codelineno-0-309" name="__codelineno-0-309"></a>        <span class="p">)</span>
-</span><span id="__span-0-310"><a id="__codelineno-0-310" name="__codelineno-0-310"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span> <span class="o">=</span> <span class="n">Pickler</span><span class="o">.</span><span class="n">load</span><span class="p">(</span>
-</span><span id="__span-0-311"><a id="__codelineno-0-311" name="__codelineno-0-311"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">parsed_df_names</span><span class="p">[</span><span class="mi">2</span><span class="p">])</span>
-</span><span id="__span-0-312"><a id="__codelineno-0-312" name="__codelineno-0-312"></a>        <span class="p">)</span>
-</span><span id="__span-0-313"><a id="__codelineno-0-313" name="__codelineno-0-313"></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-314"><a id="__codelineno-0-314" name="__codelineno-0-314"></a>        <span class="p">(</span>
-</span><span id="__span-0-315"><a id="__codelineno-0-315" name="__codelineno-0-315"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">,</span>
-</span><span id="__span-0-316"><a id="__codelineno-0-316" name="__codelineno-0-316"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">,</span>
-</span><span id="__span-0-317"><a id="__codelineno-0-317" name="__codelineno-0-317"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span>
-</span><span id="__span-0-318"><a id="__codelineno-0-318" name="__codelineno-0-318"></a>        <span class="p">)</span> <span class="o">=</span> <span class="n">parser</span><span class="o">.</span><span class="n">parse</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_filename</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;/&quot;</span><span class="p">)[</span><span class="o">-</span><span class="mi">1</span><span class="p">])</span>
-</span><span id="__span-0-319"><a id="__codelineno-0-319" name="__codelineno-0-319"></a>        <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Determining variable types...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-320"><a id="__codelineno-0-320" name="__codelineno-0-320"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span>
-</span><span id="__span-0-321"><a id="__codelineno-0-321" name="__codelineno-0-321"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_find_type</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span>
-</span><span id="__span-0-322"><a id="__codelineno-0-322" name="__codelineno-0-322"></a>        <span class="p">)</span>
-</span><span id="__span-0-323"><a id="__codelineno-0-323" name="__codelineno-0-323"></a>
-</span><span id="__span-0-324"><a id="__codelineno-0-324" name="__codelineno-0-324"></a>        <span class="c1"># Cast and convert date columns</span>
-</span><span id="__span-0-325"><a id="__codelineno-0-325" name="__codelineno-0-325"></a>        <span class="n">is_date</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="s2">&quot;date&quot;</span>
-</span><span id="__span-0-326"><a id="__codelineno-0-326" name="__codelineno-0-326"></a>        <span class="n">date_cols</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">is_date</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span><span class="p">]</span>
-</span><span id="__span-0-327"><a id="__codelineno-0-327" name="__codelineno-0-327"></a>        <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Casting date variables...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-328"><a id="__codelineno-0-328" name="__codelineno-0-328"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">date_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">date_cols</span><span class="p">]</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span>
-</span><span id="__span-0-329"><a id="__codelineno-0-329" name="__codelineno-0-329"></a>            <span class="n">pd</span><span class="o">.</span><span class="n">to_datetime</span><span class="p">,</span> <span class="n">errors</span><span class="o">=</span><span class="s2">&quot;coerce&quot;</span>
-</span><span id="__span-0-330"><a id="__codelineno-0-330" name="__codelineno-0-330"></a>        <span class="p">)</span>
-</span><span id="__span-0-331"><a id="__codelineno-0-331" name="__codelineno-0-331"></a>        <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Casting date variables round 2...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-332"><a id="__codelineno-0-332" name="__codelineno-0-332"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">date_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">date_cols</span><span class="p">]</span><span class="o">.</span><span class="n">progress_applymap</span><span class="p">(</span>
-</span><span id="__span-0-333"><a id="__codelineno-0-333" name="__codelineno-0-333"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">x</span><span class="o">.</span><span class="n">timestamp</span><span class="p">()</span> <span class="k">if</span> <span class="ow">not</span> <span class="n">pd</span><span class="o">.</span><span class="n">isnull</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="k">else</span> <span class="kc">None</span>
-</span><span id="__span-0-334"><a id="__codelineno-0-334" name="__codelineno-0-334"></a>        <span class="p">)</span>
-</span><span id="__span-0-335"><a id="__codelineno-0-335" name="__codelineno-0-335"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">is_date</span><span class="p">,</span> <span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;num&quot;</span>
-</span><span id="__span-0-336"><a id="__codelineno-0-336" name="__codelineno-0-336"></a>
-</span><span id="__span-0-337"><a id="__codelineno-0-337" name="__codelineno-0-337"></a>        <span class="c1"># Cast and convert time columns</span>
-</span><span id="__span-0-338"><a id="__codelineno-0-338" name="__codelineno-0-338"></a>        <span class="n">is_time</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="s2">&quot;time&quot;</span>
-</span><span id="__span-0-339"><a id="__codelineno-0-339" name="__codelineno-0-339"></a>        <span class="n">time_cols</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">is_time</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span><span class="p">]</span>
-</span><span id="__span-0-340"><a id="__codelineno-0-340" name="__codelineno-0-340"></a>        <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Casting time variables...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-341"><a id="__codelineno-0-341" name="__codelineno-0-341"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">time_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">time_cols</span><span class="p">]</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span>
-</span><span id="__span-0-342"><a id="__codelineno-0-342" name="__codelineno-0-342"></a>            <span class="n">pd</span><span class="o">.</span><span class="n">to_timedelta</span><span class="p">,</span> <span class="n">errors</span><span class="o">=</span><span class="s2">&quot;coerce&quot;</span>
-</span><span id="__span-0-343"><a id="__codelineno-0-343" name="__codelineno-0-343"></a>        <span class="p">)</span>
-</span><span id="__span-0-344"><a id="__codelineno-0-344" name="__codelineno-0-344"></a>        <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Casting time variables round 2...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-345"><a id="__codelineno-0-345" name="__codelineno-0-345"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">time_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">time_cols</span><span class="p">]</span><span class="o">.</span><span class="n">progress_applymap</span><span class="p">(</span>
-</span><span id="__span-0-346"><a id="__codelineno-0-346" name="__codelineno-0-346"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">x</span><span class="o">.</span><span class="n">total_seconds</span><span class="p">()</span> <span class="k">if</span> <span class="ow">not</span> <span class="n">pd</span><span class="o">.</span><span class="n">isnull</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="k">else</span> <span class="kc">None</span>
-</span><span id="__span-0-347"><a id="__codelineno-0-347" name="__codelineno-0-347"></a>        <span class="p">)</span>
-</span><span id="__span-0-348"><a id="__codelineno-0-348" name="__codelineno-0-348"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">is_time</span><span class="p">,</span> <span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;num&quot;</span>
-</span><span id="__span-0-349"><a id="__codelineno-0-349" name="__codelineno-0-349"></a>
-</span><span id="__span-0-350"><a id="__codelineno-0-350" name="__codelineno-0-350"></a>        <span class="c1"># Cast numeric columns</span>
-</span><span id="__span-0-351"><a id="__codelineno-0-351" name="__codelineno-0-351"></a>        <span class="n">is_num</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="s2">&quot;num&quot;</span>
-</span><span id="__span-0-352"><a id="__codelineno-0-352" name="__codelineno-0-352"></a>        <span class="n">numeric_cols</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">is_num</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span><span class="p">]</span>
-</span><span id="__span-0-353"><a id="__codelineno-0-353" name="__codelineno-0-353"></a>        <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Casting numerical variables...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-354"><a id="__codelineno-0-354" name="__codelineno-0-354"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">numeric_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span>
-</span><span id="__span-0-355"><a id="__codelineno-0-355" name="__codelineno-0-355"></a>            <span class="n">numeric_cols</span>
-</span><span id="__span-0-356"><a id="__codelineno-0-356" name="__codelineno-0-356"></a>        <span class="p">]</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span><span class="n">pd</span><span class="o">.</span><span class="n">to_numeric</span><span class="p">,</span> <span class="n">errors</span><span class="o">=</span><span class="s2">&quot;coerce&quot;</span><span class="p">)</span>
-</span><span id="__span-0-357"><a id="__codelineno-0-357" name="__codelineno-0-357"></a>
-</span><span id="__span-0-358"><a id="__codelineno-0-358" name="__codelineno-0-358"></a>        <span class="c1"># Tag variables.</span>
-</span><span id="__span-0-359"><a id="__codelineno-0-359" name="__codelineno-0-359"></a>        <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Tagging variables...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-360"><a id="__codelineno-0-360" name="__codelineno-0-360"></a>        <span class="k">if</span> <span class="n">enable_gpt_tagging</span><span class="p">:</span>
-</span><span id="__span-0-361"><a id="__codelineno-0-361" name="__codelineno-0-361"></a>            <span class="n">tag</span><span class="p">,</span> <span class="n">tag_origin</span> <span class="o">=</span> <span class="nb">zip</span><span class="p">(</span>
-</span><span id="__span-0-362"><a id="__codelineno-0-362" name="__codelineno-0-362"></a>                <span class="o">*</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span>
-</span><span id="__span-0-363"><a id="__codelineno-0-363" name="__codelineno-0-363"></a>                    <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">waterfall_tag</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="p">,</span> <span class="n">x</span><span class="p">),</span>
-</span><span id="__span-0-364"><a id="__codelineno-0-364" name="__codelineno-0-364"></a>                    <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-</span><span id="__span-0-365"><a id="__codelineno-0-365" name="__codelineno-0-365"></a>                <span class="p">)</span>
-</span><span id="__span-0-366"><a id="__codelineno-0-366" name="__codelineno-0-366"></a>            <span class="p">)</span>
-</span><span id="__span-0-367"><a id="__codelineno-0-367" name="__codelineno-0-367"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-368"><a id="__codelineno-0-368" name="__codelineno-0-368"></a>            <span class="n">tag</span><span class="p">,</span> <span class="n">tag_origin</span> <span class="o">=</span> <span class="nb">zip</span><span class="p">(</span>
-</span><span id="__span-0-369"><a id="__codelineno-0-369" name="__codelineno-0-369"></a>                <span class="o">*</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span>
-</span><span id="__span-0-370"><a id="__codelineno-0-370" name="__codelineno-0-370"></a>                    <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">preceding_tokens_tag</span><span class="p">(</span><span class="n">x</span><span class="p">),</span>
-</span><span id="__span-0-371"><a id="__codelineno-0-371" name="__codelineno-0-371"></a>                    <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-</span><span id="__span-0-372"><a id="__codelineno-0-372" name="__codelineno-0-372"></a>                <span class="p">)</span>
-</span><span id="__span-0-373"><a id="__codelineno-0-373" name="__codelineno-0-373"></a>            <span class="p">)</span>
-</span><span id="__span-0-374"><a id="__codelineno-0-374" name="__codelineno-0-374"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">tag</span>
-</span><span id="__span-0-375"><a id="__codelineno-0-375" name="__codelineno-0-375"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;TagOrigin&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">tag_origin</span>
-</span><span id="__span-0-376"><a id="__codelineno-0-376" name="__codelineno-0-376"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">deduplicate_tags</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">)</span>
-</span><span id="__span-0-377"><a id="__codelineno-0-377" name="__codelineno-0-377"></a>
-</span><span id="__span-0-378"><a id="__codelineno-0-378" name="__codelineno-0-378"></a>        <span class="c1"># Detect identifiers.</span>
-</span><span id="__span-0-379"><a id="__codelineno-0-379" name="__codelineno-0-379"></a>        <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Detecting identifiers...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-380"><a id="__codelineno-0-380" name="__codelineno-0-380"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;IsUninteresting&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-381"><a id="__codelineno-0-381" name="__codelineno-0-381"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_find_uninteresting</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="__span-0-382"><a id="__codelineno-0-382" name="__codelineno-0-382"></a>        <span class="p">)</span>
-</span><span id="__span-0-383"><a id="__codelineno-0-383" name="__codelineno-0-383"></a>
-</span><span id="__span-0-384"><a id="__codelineno-0-384" name="__codelineno-0-384"></a>        <span class="c1"># Reorder columns.</span>
-</span><span id="__span-0-385"><a id="__codelineno-0-385" name="__codelineno-0-385"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span>
-</span><span id="__span-0-386"><a id="__codelineno-0-386" name="__codelineno-0-386"></a>            <span class="p">[</span>
-</span><span id="__span-0-387"><a id="__codelineno-0-387" name="__codelineno-0-387"></a>                <span class="s2">&quot;Name&quot;</span><span class="p">,</span>
-</span><span id="__span-0-388"><a id="__codelineno-0-388" name="__codelineno-0-388"></a>                <span class="s2">&quot;Tag&quot;</span><span class="p">,</span>
-</span><span id="__span-0-389"><a id="__codelineno-0-389" name="__codelineno-0-389"></a>                <span class="s2">&quot;TagOrigin&quot;</span><span class="p">,</span>
-</span><span id="__span-0-390"><a id="__codelineno-0-390" name="__codelineno-0-390"></a>                <span class="s2">&quot;Type&quot;</span><span class="p">,</span>
-</span><span id="__span-0-391"><a id="__codelineno-0-391" name="__codelineno-0-391"></a>                <span class="s2">&quot;IsUninteresting&quot;</span><span class="p">,</span>
-</span><span id="__span-0-392"><a id="__codelineno-0-392" name="__codelineno-0-392"></a>                <span class="s2">&quot;Occurrences&quot;</span><span class="p">,</span>
-</span><span id="__span-0-393"><a id="__codelineno-0-393" name="__codelineno-0-393"></a>                <span class="s2">&quot;Preceding 3 tokens&quot;</span><span class="p">,</span>
-</span><span id="__span-0-394"><a id="__codelineno-0-394" name="__codelineno-0-394"></a>                <span class="s2">&quot;Examples&quot;</span><span class="p">,</span>
-</span><span id="__span-0-395"><a id="__codelineno-0-395" name="__codelineno-0-395"></a>                <span class="s2">&quot;From regex&quot;</span><span class="p">,</span>
-</span><span id="__span-0-396"><a id="__codelineno-0-396" name="__codelineno-0-396"></a>            <span class="p">]</span>
-</span><span id="__span-0-397"><a id="__codelineno-0-397" name="__codelineno-0-397"></a>        <span class="p">]</span>
-</span><span id="__span-0-398"><a id="__codelineno-0-398" name="__codelineno-0-398"></a>
-</span><span id="__span-0-399"><a id="__codelineno-0-399" name="__codelineno-0-399"></a>    <span class="c1"># Write out files if appropriate.</span>
-</span><span id="__span-0-400"><a id="__codelineno-0-400" name="__codelineno-0-400"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_skip_writeout</span> <span class="ow">and</span> <span class="ow">not</span> <span class="n">files_exist</span><span class="p">:</span>
-</span><span id="__span-0-401"><a id="__codelineno-0-401" name="__codelineno-0-401"></a>        <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">parsed_df_names</span><span class="p">[</span><span class="mi">0</span><span class="p">]))</span>
-</span><span id="__span-0-402"><a id="__codelineno-0-402" name="__codelineno-0-402"></a>        <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">parsed_df_names</span><span class="p">[</span><span class="mi">1</span><span class="p">]))</span>
-</span><span id="__span-0-403"><a id="__codelineno-0-403" name="__codelineno-0-403"></a>        <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">parsed_df_names</span><span class="p">[</span><span class="mi">2</span><span class="p">]))</span>
-</span><span id="__span-0-404"><a id="__codelineno-0-404" name="__codelineno-0-404"></a>
-</span><span id="__span-0-405"><a id="__codelineno-0-405" name="__codelineno-0-405"></a>    <span class="n">end_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
-</span><span id="__span-0-406"><a id="__codelineno-0-406" name="__codelineno-0-406"></a>    <span class="n">elapsed</span> <span class="o">=</span> <span class="s2">&quot;</span><span class="si">{:.6f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">((</span><span class="n">end_time</span> <span class="o">-</span> <span class="n">start_time</span><span class="p">)</span><span class="o">.</span><span class="n">total_seconds</span><span class="p">())</span>
-</span><span id="__span-0-407"><a id="__codelineno-0-407" name="__codelineno-0-407"></a>    <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Parsing complete in </span><span class="si">{</span><span class="n">elapsed</span><span class="si">}</span><span class="s2"> seconds!&quot;</span><span class="p">)</span>
-</span><span id="__span-0-408"><a id="__codelineno-0-408" name="__codelineno-0-408"></a>    <span class="k">return</span> <span class="n">elapsed</span>
+<span class="normal"><a href="#__codelineno-0-408">408</a></span>
+<span class="normal"><a href="#__codelineno-0-409">409</a></span>
+<span class="normal"><a href="#__codelineno-0-410">410</a></span>
+<span class="normal"><a href="#__codelineno-0-411">411</a></span>
+<span class="normal"><a href="#__codelineno-0-412">412</a></span>
+<span class="normal"><a href="#__codelineno-0-413">413</a></span>
+<span class="normal"><a href="#__codelineno-0-414">414</a></span>
+<span class="normal"><a href="#__codelineno-0-415">415</a></span>
+<span class="normal"><a href="#__codelineno-0-416">416</a></span>
+<span class="normal"><a href="#__codelineno-0-417">417</a></span>
+<span class="normal"><a href="#__codelineno-0-418">418</a></span>
+<span class="normal"><a href="#__codelineno-0-419">419</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a><span class="k">def</span> <span class="nf">parse</span><span class="p">(</span>
+</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a>    <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a>    <span class="n">regex_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="n">DEFAULT_REGEX_DICT</span><span class="p">,</span>
+</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a>    <span class="n">sim_thresh</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.65</span><span class="p">,</span>
+</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a>    <span class="n">depth</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">5</span><span class="p">,</span>
+</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a>    <span class="n">force</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-275"><a id="__codelineno-0-275" name="__codelineno-0-275"></a>    <span class="n">message_prefix</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="sa">r</span><span class="s2">&quot;.*&quot;</span><span class="p">,</span>
+</span><span id="__span-0-276"><a id="__codelineno-0-276" name="__codelineno-0-276"></a>    <span class="n">enable_gpt_tagging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-277"><a id="__codelineno-0-277" name="__codelineno-0-277"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-278"><a id="__codelineno-0-278" name="__codelineno-0-278"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-279"><a id="__codelineno-0-279" name="__codelineno-0-279"></a><span class="sd">    Parse the log file into a dataframe.</span>
+</span><span id="__span-0-280"><a id="__codelineno-0-280" name="__codelineno-0-280"></a>
+</span><span id="__span-0-281"><a id="__codelineno-0-281" name="__codelineno-0-281"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-282"><a id="__codelineno-0-282" name="__codelineno-0-282"></a><span class="sd">        regex_dict: (for Drain) A dictionary of regular expressions to be used for parsing.</span>
+</span><span id="__span-0-283"><a id="__codelineno-0-283" name="__codelineno-0-283"></a><span class="sd">        sim_thresh: (for Drain) The similarity threshold to be used for parsing.</span>
+</span><span id="__span-0-284"><a id="__codelineno-0-284" name="__codelineno-0-284"></a><span class="sd">        depth: (for Drain) The parse tree depth to be used for parsing.</span>
+</span><span id="__span-0-285"><a id="__codelineno-0-285" name="__codelineno-0-285"></a><span class="sd">        force: Whether to force re-parsing of the log file.</span>
+</span><span id="__span-0-286"><a id="__codelineno-0-286" name="__codelineno-0-286"></a><span class="sd">        message_prefix: A prefix used to identify the beginning of each log message.</span>
+</span><span id="__span-0-287"><a id="__codelineno-0-287" name="__codelineno-0-287"></a><span class="sd">            Can be used to collapse multiple lines into a single message. Each line that doesn&#39;t start with this</span>
+</span><span id="__span-0-288"><a id="__codelineno-0-288" name="__codelineno-0-288"></a><span class="sd">            prefix will be concatenated to the previous log message.</span>
+</span><span id="__span-0-289"><a id="__codelineno-0-289" name="__codelineno-0-289"></a><span class="sd">        enable_gpt_tagging: A boolean indicating whether GPT tagging should be enabled.</span>
+</span><span id="__span-0-290"><a id="__codelineno-0-290" name="__codelineno-0-290"></a>
+</span><span id="__span-0-291"><a id="__codelineno-0-291" name="__codelineno-0-291"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-292"><a id="__codelineno-0-292" name="__codelineno-0-292"></a><span class="sd">        The time elapsed for parsing, as a string.</span>
+</span><span id="__span-0-293"><a id="__codelineno-0-293" name="__codelineno-0-293"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-294"><a id="__codelineno-0-294" name="__codelineno-0-294"></a>    <span class="n">start_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
+</span><span id="__span-0-295"><a id="__codelineno-0-295" name="__codelineno-0-295"></a>    <span class="n">parser</span> <span class="o">=</span> <span class="n">Drain</span><span class="p">(</span>
+</span><span id="__span-0-296"><a id="__codelineno-0-296" name="__codelineno-0-296"></a>        <span class="n">indir</span><span class="o">=</span><span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">dirname</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_filename</span><span class="p">),</span>
+</span><span id="__span-0-297"><a id="__codelineno-0-297" name="__codelineno-0-297"></a>        <span class="n">depth</span><span class="o">=</span><span class="n">depth</span><span class="p">,</span>
+</span><span id="__span-0-298"><a id="__codelineno-0-298" name="__codelineno-0-298"></a>        <span class="n">st</span><span class="o">=</span><span class="n">sim_thresh</span><span class="p">,</span>
+</span><span id="__span-0-299"><a id="__codelineno-0-299" name="__codelineno-0-299"></a>        <span class="n">rex</span><span class="o">=</span><span class="n">regex_dict</span><span class="p">,</span>
+</span><span id="__span-0-300"><a id="__codelineno-0-300" name="__codelineno-0-300"></a>        <span class="n">skip_writeout</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_skip_writeout</span><span class="p">,</span>
+</span><span id="__span-0-301"><a id="__codelineno-0-301" name="__codelineno-0-301"></a>        <span class="n">message_prefix</span><span class="o">=</span><span class="n">message_prefix</span><span class="p">,</span>
+</span><span id="__span-0-302"><a id="__codelineno-0-302" name="__codelineno-0-302"></a>    <span class="p">)</span>
+</span><span id="__span-0-303"><a id="__codelineno-0-303" name="__codelineno-0-303"></a>
+</span><span id="__span-0-304"><a id="__codelineno-0-304" name="__codelineno-0-304"></a>    <span class="c1"># Check if the parsed files already exist.</span>
+</span><span id="__span-0-305"><a id="__codelineno-0-305" name="__codelineno-0-305"></a>    <span class="n">files_exist</span> <span class="o">=</span> <span class="ow">not</span> <span class="n">force</span>
+</span><span id="__span-0-306"><a id="__codelineno-0-306" name="__codelineno-0-306"></a>    <span class="n">parsed_df_names</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="__span-0-307"><a id="__codelineno-0-307" name="__codelineno-0-307"></a>        <span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">),</span>
+</span><span id="__span-0-308"><a id="__codelineno-0-308" name="__codelineno-0-308"></a>        <span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">),</span>
+</span><span id="__span-0-309"><a id="__codelineno-0-309" name="__codelineno-0-309"></a>        <span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">),</span>
+</span><span id="__span-0-310"><a id="__codelineno-0-310" name="__codelineno-0-310"></a>    <span class="p">]</span>
+</span><span id="__span-0-311"><a id="__codelineno-0-311" name="__codelineno-0-311"></a>    <span class="k">for</span> <span class="n">var_name</span> <span class="ow">in</span> <span class="n">parsed_df_names</span><span class="p">:</span>
+</span><span id="__span-0-312"><a id="__codelineno-0-312" name="__codelineno-0-312"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">isfile</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">var_name</span><span class="p">)):</span>
+</span><span id="__span-0-313"><a id="__codelineno-0-313" name="__codelineno-0-313"></a>            <span class="n">files_exist</span> <span class="o">=</span> <span class="kc">False</span>
+</span><span id="__span-0-314"><a id="__codelineno-0-314" name="__codelineno-0-314"></a>            <span class="k">break</span>
+</span><span id="__span-0-315"><a id="__codelineno-0-315" name="__codelineno-0-315"></a>
+</span><span id="__span-0-316"><a id="__codelineno-0-316" name="__codelineno-0-316"></a>    <span class="k">if</span> <span class="n">files_exist</span><span class="p">:</span>
+</span><span id="__span-0-317"><a id="__codelineno-0-317" name="__codelineno-0-317"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span> <span class="o">=</span> <span class="n">Pickler</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">parsed_df_names</span><span class="p">[</span><span class="mi">0</span><span class="p">]))</span>
+</span><span id="__span-0-318"><a id="__codelineno-0-318" name="__codelineno-0-318"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span> <span class="o">=</span> <span class="n">Pickler</span><span class="o">.</span><span class="n">load</span><span class="p">(</span>
+</span><span id="__span-0-319"><a id="__codelineno-0-319" name="__codelineno-0-319"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">parsed_df_names</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+</span><span id="__span-0-320"><a id="__codelineno-0-320" name="__codelineno-0-320"></a>        <span class="p">)</span>
+</span><span id="__span-0-321"><a id="__codelineno-0-321" name="__codelineno-0-321"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span> <span class="o">=</span> <span class="n">Pickler</span><span class="o">.</span><span class="n">load</span><span class="p">(</span>
+</span><span id="__span-0-322"><a id="__codelineno-0-322" name="__codelineno-0-322"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">parsed_df_names</span><span class="p">[</span><span class="mi">2</span><span class="p">])</span>
+</span><span id="__span-0-323"><a id="__codelineno-0-323" name="__codelineno-0-323"></a>        <span class="p">)</span>
+</span><span id="__span-0-324"><a id="__codelineno-0-324" name="__codelineno-0-324"></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-325"><a id="__codelineno-0-325" name="__codelineno-0-325"></a>        <span class="p">(</span>
+</span><span id="__span-0-326"><a id="__codelineno-0-326" name="__codelineno-0-326"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">,</span>
+</span><span id="__span-0-327"><a id="__codelineno-0-327" name="__codelineno-0-327"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">,</span>
+</span><span id="__span-0-328"><a id="__codelineno-0-328" name="__codelineno-0-328"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span>
+</span><span id="__span-0-329"><a id="__codelineno-0-329" name="__codelineno-0-329"></a>        <span class="p">)</span> <span class="o">=</span> <span class="n">parser</span><span class="o">.</span><span class="n">parse</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_filename</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;/&quot;</span><span class="p">)[</span><span class="o">-</span><span class="mi">1</span><span class="p">])</span>
+</span><span id="__span-0-330"><a id="__codelineno-0-330" name="__codelineno-0-330"></a>        <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Determining variable types...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-331"><a id="__codelineno-0-331" name="__codelineno-0-331"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span>
+</span><span id="__span-0-332"><a id="__codelineno-0-332" name="__codelineno-0-332"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_find_type</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span>
+</span><span id="__span-0-333"><a id="__codelineno-0-333" name="__codelineno-0-333"></a>        <span class="p">)</span>
+</span><span id="__span-0-334"><a id="__codelineno-0-334" name="__codelineno-0-334"></a>
+</span><span id="__span-0-335"><a id="__codelineno-0-335" name="__codelineno-0-335"></a>        <span class="c1"># Cast and convert date columns</span>
+</span><span id="__span-0-336"><a id="__codelineno-0-336" name="__codelineno-0-336"></a>        <span class="n">is_date</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="s2">&quot;date&quot;</span>
+</span><span id="__span-0-337"><a id="__codelineno-0-337" name="__codelineno-0-337"></a>        <span class="n">date_cols</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">is_date</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span><span class="p">]</span>
+</span><span id="__span-0-338"><a id="__codelineno-0-338" name="__codelineno-0-338"></a>        <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Casting date variables...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-339"><a id="__codelineno-0-339" name="__codelineno-0-339"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">date_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">date_cols</span><span class="p">]</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span>
+</span><span id="__span-0-340"><a id="__codelineno-0-340" name="__codelineno-0-340"></a>            <span class="n">pd</span><span class="o">.</span><span class="n">to_datetime</span><span class="p">,</span> <span class="n">errors</span><span class="o">=</span><span class="s2">&quot;coerce&quot;</span>
+</span><span id="__span-0-341"><a id="__codelineno-0-341" name="__codelineno-0-341"></a>        <span class="p">)</span>
+</span><span id="__span-0-342"><a id="__codelineno-0-342" name="__codelineno-0-342"></a>        <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Casting date variables round 2...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-343"><a id="__codelineno-0-343" name="__codelineno-0-343"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">date_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">date_cols</span><span class="p">]</span><span class="o">.</span><span class="n">progress_applymap</span><span class="p">(</span>
+</span><span id="__span-0-344"><a id="__codelineno-0-344" name="__codelineno-0-344"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">x</span><span class="o">.</span><span class="n">timestamp</span><span class="p">()</span> <span class="k">if</span> <span class="ow">not</span> <span class="n">pd</span><span class="o">.</span><span class="n">isnull</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="k">else</span> <span class="kc">None</span>
+</span><span id="__span-0-345"><a id="__codelineno-0-345" name="__codelineno-0-345"></a>        <span class="p">)</span>
+</span><span id="__span-0-346"><a id="__codelineno-0-346" name="__codelineno-0-346"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">is_date</span><span class="p">,</span> <span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;num&quot;</span>
+</span><span id="__span-0-347"><a id="__codelineno-0-347" name="__codelineno-0-347"></a>
+</span><span id="__span-0-348"><a id="__codelineno-0-348" name="__codelineno-0-348"></a>        <span class="c1"># Cast and convert time columns</span>
+</span><span id="__span-0-349"><a id="__codelineno-0-349" name="__codelineno-0-349"></a>        <span class="n">is_time</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="s2">&quot;time&quot;</span>
+</span><span id="__span-0-350"><a id="__codelineno-0-350" name="__codelineno-0-350"></a>        <span class="n">time_cols</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">is_time</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span><span class="p">]</span>
+</span><span id="__span-0-351"><a id="__codelineno-0-351" name="__codelineno-0-351"></a>        <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Casting time variables...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-352"><a id="__codelineno-0-352" name="__codelineno-0-352"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">time_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">time_cols</span><span class="p">]</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span>
+</span><span id="__span-0-353"><a id="__codelineno-0-353" name="__codelineno-0-353"></a>            <span class="n">pd</span><span class="o">.</span><span class="n">to_timedelta</span><span class="p">,</span> <span class="n">errors</span><span class="o">=</span><span class="s2">&quot;coerce&quot;</span>
+</span><span id="__span-0-354"><a id="__codelineno-0-354" name="__codelineno-0-354"></a>        <span class="p">)</span>
+</span><span id="__span-0-355"><a id="__codelineno-0-355" name="__codelineno-0-355"></a>        <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Casting time variables round 2...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-356"><a id="__codelineno-0-356" name="__codelineno-0-356"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">time_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">time_cols</span><span class="p">]</span><span class="o">.</span><span class="n">progress_applymap</span><span class="p">(</span>
+</span><span id="__span-0-357"><a id="__codelineno-0-357" name="__codelineno-0-357"></a>            <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">x</span><span class="o">.</span><span class="n">total_seconds</span><span class="p">()</span> <span class="k">if</span> <span class="ow">not</span> <span class="n">pd</span><span class="o">.</span><span class="n">isnull</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="k">else</span> <span class="kc">None</span>
+</span><span id="__span-0-358"><a id="__codelineno-0-358" name="__codelineno-0-358"></a>        <span class="p">)</span>
+</span><span id="__span-0-359"><a id="__codelineno-0-359" name="__codelineno-0-359"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">is_time</span><span class="p">,</span> <span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;num&quot;</span>
+</span><span id="__span-0-360"><a id="__codelineno-0-360" name="__codelineno-0-360"></a>
+</span><span id="__span-0-361"><a id="__codelineno-0-361" name="__codelineno-0-361"></a>        <span class="c1"># Cast numeric columns</span>
+</span><span id="__span-0-362"><a id="__codelineno-0-362" name="__codelineno-0-362"></a>        <span class="n">is_num</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="s2">&quot;num&quot;</span>
+</span><span id="__span-0-363"><a id="__codelineno-0-363" name="__codelineno-0-363"></a>        <span class="n">numeric_cols</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">is_num</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span><span class="p">]</span>
+</span><span id="__span-0-364"><a id="__codelineno-0-364" name="__codelineno-0-364"></a>        <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Casting numerical variables...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-365"><a id="__codelineno-0-365" name="__codelineno-0-365"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">numeric_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span>
+</span><span id="__span-0-366"><a id="__codelineno-0-366" name="__codelineno-0-366"></a>            <span class="n">numeric_cols</span>
+</span><span id="__span-0-367"><a id="__codelineno-0-367" name="__codelineno-0-367"></a>        <span class="p">]</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span><span class="n">pd</span><span class="o">.</span><span class="n">to_numeric</span><span class="p">,</span> <span class="n">errors</span><span class="o">=</span><span class="s2">&quot;coerce&quot;</span><span class="p">)</span>
+</span><span id="__span-0-368"><a id="__codelineno-0-368" name="__codelineno-0-368"></a>
+</span><span id="__span-0-369"><a id="__codelineno-0-369" name="__codelineno-0-369"></a>        <span class="c1"># Tag variables.</span>
+</span><span id="__span-0-370"><a id="__codelineno-0-370" name="__codelineno-0-370"></a>        <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Tagging variables...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-371"><a id="__codelineno-0-371" name="__codelineno-0-371"></a>        <span class="k">if</span> <span class="n">enable_gpt_tagging</span><span class="p">:</span>
+</span><span id="__span-0-372"><a id="__codelineno-0-372" name="__codelineno-0-372"></a>            <span class="n">tag</span><span class="p">,</span> <span class="n">tag_origin</span> <span class="o">=</span> <span class="nb">zip</span><span class="p">(</span>
+</span><span id="__span-0-373"><a id="__codelineno-0-373" name="__codelineno-0-373"></a>                <span class="o">*</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span>
+</span><span id="__span-0-374"><a id="__codelineno-0-374" name="__codelineno-0-374"></a>                    <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">waterfall_tag</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="p">,</span> <span class="n">x</span><span class="p">),</span>
+</span><span id="__span-0-375"><a id="__codelineno-0-375" name="__codelineno-0-375"></a>                    <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+</span><span id="__span-0-376"><a id="__codelineno-0-376" name="__codelineno-0-376"></a>                <span class="p">)</span>
+</span><span id="__span-0-377"><a id="__codelineno-0-377" name="__codelineno-0-377"></a>            <span class="p">)</span>
+</span><span id="__span-0-378"><a id="__codelineno-0-378" name="__codelineno-0-378"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-379"><a id="__codelineno-0-379" name="__codelineno-0-379"></a>            <span class="n">tag</span><span class="p">,</span> <span class="n">tag_origin</span> <span class="o">=</span> <span class="nb">zip</span><span class="p">(</span>
+</span><span id="__span-0-380"><a id="__codelineno-0-380" name="__codelineno-0-380"></a>                <span class="o">*</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span>
+</span><span id="__span-0-381"><a id="__codelineno-0-381" name="__codelineno-0-381"></a>                    <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">preceding_tokens_tag</span><span class="p">(</span><span class="n">x</span><span class="p">),</span>
+</span><span id="__span-0-382"><a id="__codelineno-0-382" name="__codelineno-0-382"></a>                    <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+</span><span id="__span-0-383"><a id="__codelineno-0-383" name="__codelineno-0-383"></a>                <span class="p">)</span>
+</span><span id="__span-0-384"><a id="__codelineno-0-384" name="__codelineno-0-384"></a>            <span class="p">)</span>
+</span><span id="__span-0-385"><a id="__codelineno-0-385" name="__codelineno-0-385"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">tag</span>
+</span><span id="__span-0-386"><a id="__codelineno-0-386" name="__codelineno-0-386"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;TagOrigin&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">tag_origin</span>
+</span><span id="__span-0-387"><a id="__codelineno-0-387" name="__codelineno-0-387"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">deduplicate_tags</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">)</span>
+</span><span id="__span-0-388"><a id="__codelineno-0-388" name="__codelineno-0-388"></a>
+</span><span id="__span-0-389"><a id="__codelineno-0-389" name="__codelineno-0-389"></a>        <span class="c1"># Detect identifiers.</span>
+</span><span id="__span-0-390"><a id="__codelineno-0-390" name="__codelineno-0-390"></a>        <span class="n">tqdm</span><span class="o">.</span><span class="n">pandas</span><span class="p">(</span><span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Detecting identifiers...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-391"><a id="__codelineno-0-391" name="__codelineno-0-391"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;IsUninteresting&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-392"><a id="__codelineno-0-392" name="__codelineno-0-392"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">progress_apply</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_find_uninteresting</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="__span-0-393"><a id="__codelineno-0-393" name="__codelineno-0-393"></a>        <span class="p">)</span>
+</span><span id="__span-0-394"><a id="__codelineno-0-394" name="__codelineno-0-394"></a>
+</span><span id="__span-0-395"><a id="__codelineno-0-395" name="__codelineno-0-395"></a>        <span class="c1"># Reorder columns.</span>
+</span><span id="__span-0-396"><a id="__codelineno-0-396" name="__codelineno-0-396"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span>
+</span><span id="__span-0-397"><a id="__codelineno-0-397" name="__codelineno-0-397"></a>            <span class="p">[</span>
+</span><span id="__span-0-398"><a id="__codelineno-0-398" name="__codelineno-0-398"></a>                <span class="s2">&quot;Name&quot;</span><span class="p">,</span>
+</span><span id="__span-0-399"><a id="__codelineno-0-399" name="__codelineno-0-399"></a>                <span class="s2">&quot;Tag&quot;</span><span class="p">,</span>
+</span><span id="__span-0-400"><a id="__codelineno-0-400" name="__codelineno-0-400"></a>                <span class="s2">&quot;TagOrigin&quot;</span><span class="p">,</span>
+</span><span id="__span-0-401"><a id="__codelineno-0-401" name="__codelineno-0-401"></a>                <span class="s2">&quot;Type&quot;</span><span class="p">,</span>
+</span><span id="__span-0-402"><a id="__codelineno-0-402" name="__codelineno-0-402"></a>                <span class="s2">&quot;IsUninteresting&quot;</span><span class="p">,</span>
+</span><span id="__span-0-403"><a id="__codelineno-0-403" name="__codelineno-0-403"></a>                <span class="s2">&quot;Occurrences&quot;</span><span class="p">,</span>
+</span><span id="__span-0-404"><a id="__codelineno-0-404" name="__codelineno-0-404"></a>                <span class="s2">&quot;Preceding 3 tokens&quot;</span><span class="p">,</span>
+</span><span id="__span-0-405"><a id="__codelineno-0-405" name="__codelineno-0-405"></a>                <span class="s2">&quot;Examples&quot;</span><span class="p">,</span>
+</span><span id="__span-0-406"><a id="__codelineno-0-406" name="__codelineno-0-406"></a>                <span class="s2">&quot;From regex&quot;</span><span class="p">,</span>
+</span><span id="__span-0-407"><a id="__codelineno-0-407" name="__codelineno-0-407"></a>            <span class="p">]</span>
+</span><span id="__span-0-408"><a id="__codelineno-0-408" name="__codelineno-0-408"></a>        <span class="p">]</span>
+</span><span id="__span-0-409"><a id="__codelineno-0-409" name="__codelineno-0-409"></a>
+</span><span id="__span-0-410"><a id="__codelineno-0-410" name="__codelineno-0-410"></a>    <span class="c1"># Write out files if appropriate.</span>
+</span><span id="__span-0-411"><a id="__codelineno-0-411" name="__codelineno-0-411"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_skip_writeout</span> <span class="ow">and</span> <span class="ow">not</span> <span class="n">files_exist</span><span class="p">:</span>
+</span><span id="__span-0-412"><a id="__codelineno-0-412" name="__codelineno-0-412"></a>        <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">parsed_df_names</span><span class="p">[</span><span class="mi">0</span><span class="p">]))</span>
+</span><span id="__span-0-413"><a id="__codelineno-0-413" name="__codelineno-0-413"></a>        <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">parsed_df_names</span><span class="p">[</span><span class="mi">1</span><span class="p">]))</span>
+</span><span id="__span-0-414"><a id="__codelineno-0-414" name="__codelineno-0-414"></a>        <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">parsed_df_names</span><span class="p">[</span><span class="mi">2</span><span class="p">]))</span>
+</span><span id="__span-0-415"><a id="__codelineno-0-415" name="__codelineno-0-415"></a>
+</span><span id="__span-0-416"><a id="__codelineno-0-416" name="__codelineno-0-416"></a>    <span class="n">end_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
+</span><span id="__span-0-417"><a id="__codelineno-0-417" name="__codelineno-0-417"></a>    <span class="n">elapsed</span> <span class="o">=</span> <span class="s2">&quot;</span><span class="si">{:.6f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">((</span><span class="n">end_time</span> <span class="o">-</span> <span class="n">start_time</span><span class="p">)</span><span class="o">.</span><span class="n">total_seconds</span><span class="p">())</span>
+</span><span id="__span-0-418"><a id="__codelineno-0-418" name="__codelineno-0-418"></a>    <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Parsing complete in </span><span class="si">{</span><span class="n">elapsed</span><span class="si">}</span><span class="s2"> seconds!&quot;</span><span class="p">)</span>
+</span><span id="__span-0-419"><a id="__codelineno-0-419" name="__codelineno-0-419"></a>    <span class="k">return</span> <span class="n">elapsed</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -6590,18 +6701,7 @@ <h3 id="logos.logos.LOGos.include_in_template" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-410">410</a></span>
-<span class="normal"><a href="#__codelineno-0-411">411</a></span>
-<span class="normal"><a href="#__codelineno-0-412">412</a></span>
-<span class="normal"><a href="#__codelineno-0-413">413</a></span>
-<span class="normal"><a href="#__codelineno-0-414">414</a></span>
-<span class="normal"><a href="#__codelineno-0-415">415</a></span>
-<span class="normal"><a href="#__codelineno-0-416">416</a></span>
-<span class="normal"><a href="#__codelineno-0-417">417</a></span>
-<span class="normal"><a href="#__codelineno-0-418">418</a></span>
-<span class="normal"><a href="#__codelineno-0-419">419</a></span>
-<span class="normal"><a href="#__codelineno-0-420">420</a></span>
-<span class="normal"><a href="#__codelineno-0-421">421</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-421">421</a></span>
 <span class="normal"><a href="#__codelineno-0-422">422</a></span>
 <span class="normal"><a href="#__codelineno-0-423">423</a></span>
 <span class="normal"><a href="#__codelineno-0-424">424</a></span>
@@ -6735,152 +6835,161 @@ <h3 id="logos.logos.LOGos.include_in_template" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-552">552</a></span>
 <span class="normal"><a href="#__codelineno-0-553">553</a></span>
 <span class="normal"><a href="#__codelineno-0-554">554</a></span>
-<span class="normal"><a href="#__codelineno-0-555">555</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-410"><a id="__codelineno-0-410" name="__codelineno-0-410"></a><span class="k">def</span> <span class="nf">include_in_template</span><span class="p">(</span>
-</span><span id="__span-0-411"><a id="__codelineno-0-411" name="__codelineno-0-411"></a>    <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-412"><a id="__codelineno-0-412" name="__codelineno-0-412"></a>    <span class="n">var</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="__span-0-413"><a id="__codelineno-0-413" name="__codelineno-0-413"></a>    <span class="n">enable_gpt_tagging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="__span-0-414"><a id="__codelineno-0-414" name="__codelineno-0-414"></a>    <span class="n">skip_writeout</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">bool</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-415"><a id="__codelineno-0-415" name="__codelineno-0-415"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-416"><a id="__codelineno-0-416" name="__codelineno-0-416"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-417"><a id="__codelineno-0-417" name="__codelineno-0-417"></a><span class="sd">    Treat a certain parsed variable as part of its template and regenerate parsed dataframes.</span>
-</span><span id="__span-0-418"><a id="__codelineno-0-418" name="__codelineno-0-418"></a>
-</span><span id="__span-0-419"><a id="__codelineno-0-419" name="__codelineno-0-419"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-420"><a id="__codelineno-0-420" name="__codelineno-0-420"></a><span class="sd">        var: The name or tag of the variable to be included in its template.</span>
-</span><span id="__span-0-421"><a id="__codelineno-0-421" name="__codelineno-0-421"></a><span class="sd">        enable_gpt_tagging: A boolean indicating whether GPT-3.5 tagging should be enabled.</span>
-</span><span id="__span-0-422"><a id="__codelineno-0-422" name="__codelineno-0-422"></a><span class="sd">        skip_writeout: Whether to skip writing out the regenerated parsed dataframes. Defaults</span>
-</span><span id="__span-0-423"><a id="__codelineno-0-423" name="__codelineno-0-423"></a><span class="sd">            to the value of self._skip_writeout.</span>
-</span><span id="__span-0-424"><a id="__codelineno-0-424" name="__codelineno-0-424"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-425"><a id="__codelineno-0-425" name="__codelineno-0-425"></a>    <span class="n">name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="n">var</span><span class="p">,</span> <span class="s2">&quot;parsed&quot;</span><span class="p">)</span>
-</span><span id="__span-0-426"><a id="__codelineno-0-426" name="__codelineno-0-426"></a>
-</span><span id="__span-0-427"><a id="__codelineno-0-427" name="__codelineno-0-427"></a>    <span class="n">old_template_id</span> <span class="o">=</span> <span class="n">ParsedVariableName</span><span class="p">(</span><span class="n">name</span><span class="p">)</span><span class="o">.</span><span class="n">template_id</span><span class="p">()</span>
-</span><span id="__span-0-428"><a id="__codelineno-0-428" name="__codelineno-0-428"></a>    <span class="n">idx</span> <span class="o">=</span> <span class="n">ParsedVariableName</span><span class="p">(</span><span class="n">name</span><span class="p">)</span><span class="o">.</span><span class="n">index</span><span class="p">()</span>
-</span><span id="__span-0-429"><a id="__codelineno-0-429" name="__codelineno-0-429"></a>    <span class="n">value_counts</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">name</span><span class="p">]</span><span class="o">.</span><span class="n">value_counts</span><span class="p">()</span><span class="o">.</span><span class="n">to_dict</span><span class="p">()</span>
-</span><span id="__span-0-430"><a id="__codelineno-0-430" name="__codelineno-0-430"></a>
-</span><span id="__span-0-431"><a id="__codelineno-0-431" name="__codelineno-0-431"></a>    <span class="c1">### Modify _parsed_templates</span>
-</span><span id="__span-0-432"><a id="__codelineno-0-432" name="__codelineno-0-432"></a>    <span class="n">old_template_row</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-433"><a id="__codelineno-0-433" name="__codelineno-0-433"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-434"><a id="__codelineno-0-434" name="__codelineno-0-434"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">old_template_id</span>
-</span><span id="__span-0-435"><a id="__codelineno-0-435" name="__codelineno-0-435"></a>        <span class="p">]</span>
-</span><span id="__span-0-436"><a id="__codelineno-0-436" name="__codelineno-0-436"></a>        <span class="o">.</span><span class="n">iloc</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-437"><a id="__codelineno-0-437" name="__codelineno-0-437"></a>        <span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-</span><span id="__span-0-438"><a id="__codelineno-0-438" name="__codelineno-0-438"></a>    <span class="p">)</span>
-</span><span id="__span-0-439"><a id="__codelineno-0-439" name="__codelineno-0-439"></a>    <span class="n">toks</span> <span class="o">=</span> <span class="n">old_template_row</span><span class="p">[</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot; &quot;</span><span class="p">)</span>
-</span><span id="__span-0-440"><a id="__codelineno-0-440" name="__codelineno-0-440"></a>    <span class="n">new_template_ids</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-441"><a id="__codelineno-0-441" name="__codelineno-0-441"></a>    <span class="n">new_variable_indices</span> <span class="o">=</span> <span class="n">old_template_row</span><span class="p">[</span><span class="s2">&quot;VariableIndices&quot;</span><span class="p">]</span>
-</span><span id="__span-0-442"><a id="__codelineno-0-442" name="__codelineno-0-442"></a>    <span class="n">new_variable_indices</span><span class="o">.</span><span class="n">remove</span><span class="p">(</span><span class="n">idx</span><span class="p">)</span>
-</span><span id="__span-0-443"><a id="__codelineno-0-443" name="__codelineno-0-443"></a>
-</span><span id="__span-0-444"><a id="__codelineno-0-444" name="__codelineno-0-444"></a>    <span class="k">for</span> <span class="n">value</span><span class="p">,</span> <span class="n">occurences</span> <span class="ow">in</span> <span class="n">value_counts</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="__span-0-445"><a id="__codelineno-0-445" name="__codelineno-0-445"></a>        <span class="n">new_template_row</span> <span class="o">=</span> <span class="n">old_template_row</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-</span><span id="__span-0-446"><a id="__codelineno-0-446" name="__codelineno-0-446"></a>        <span class="n">toks</span><span class="p">[</span><span class="n">idx</span><span class="p">]</span> <span class="o">=</span> <span class="n">value</span>
-</span><span id="__span-0-447"><a id="__codelineno-0-447" name="__codelineno-0-447"></a>
-</span><span id="__span-0-448"><a id="__codelineno-0-448" name="__codelineno-0-448"></a>        <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot; &quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">toks</span><span class="p">)</span>
-</span><span id="__span-0-449"><a id="__codelineno-0-449" name="__codelineno-0-449"></a>        <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">hashlib</span><span class="o">.</span><span class="n">md5</span><span class="p">(</span>
-</span><span id="__span-0-450"><a id="__codelineno-0-450" name="__codelineno-0-450"></a>            <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">encode</span><span class="p">(</span><span class="s2">&quot;utf-8&quot;</span><span class="p">)</span>
-</span><span id="__span-0-451"><a id="__codelineno-0-451" name="__codelineno-0-451"></a>        <span class="p">)</span><span class="o">.</span><span class="n">hexdigest</span><span class="p">()[</span><span class="mi">0</span><span class="p">:</span><span class="mi">8</span><span class="p">]</span>
-</span><span id="__span-0-452"><a id="__codelineno-0-452" name="__codelineno-0-452"></a>        <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;Occurrences&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">occurences</span>
-</span><span id="__span-0-453"><a id="__codelineno-0-453" name="__codelineno-0-453"></a>        <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;VariableIndices&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_variable_indices</span>
-</span><span id="__span-0-454"><a id="__codelineno-0-454" name="__codelineno-0-454"></a>        <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;RegexIndices&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">old_template_row</span><span class="p">[</span><span class="s2">&quot;RegexIndices&quot;</span><span class="p">]</span>
-</span><span id="__span-0-455"><a id="__codelineno-0-455" name="__codelineno-0-455"></a>
-</span><span id="__span-0-456"><a id="__codelineno-0-456" name="__codelineno-0-456"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">)]</span> <span class="o">=</span> <span class="n">new_template_row</span>
-</span><span id="__span-0-457"><a id="__codelineno-0-457" name="__codelineno-0-457"></a>        <span class="n">new_template_ids</span><span class="p">[</span><span class="n">value</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span>
+<span class="normal"><a href="#__codelineno-0-555">555</a></span>
+<span class="normal"><a href="#__codelineno-0-556">556</a></span>
+<span class="normal"><a href="#__codelineno-0-557">557</a></span>
+<span class="normal"><a href="#__codelineno-0-558">558</a></span>
+<span class="normal"><a href="#__codelineno-0-559">559</a></span>
+<span class="normal"><a href="#__codelineno-0-560">560</a></span>
+<span class="normal"><a href="#__codelineno-0-561">561</a></span>
+<span class="normal"><a href="#__codelineno-0-562">562</a></span>
+<span class="normal"><a href="#__codelineno-0-563">563</a></span>
+<span class="normal"><a href="#__codelineno-0-564">564</a></span>
+<span class="normal"><a href="#__codelineno-0-565">565</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-421"><a id="__codelineno-0-421" name="__codelineno-0-421"></a><span class="k">def</span> <span class="nf">include_in_template</span><span class="p">(</span>
+</span><span id="__span-0-422"><a id="__codelineno-0-422" name="__codelineno-0-422"></a>    <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-423"><a id="__codelineno-0-423" name="__codelineno-0-423"></a>    <span class="n">var</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-424"><a id="__codelineno-0-424" name="__codelineno-0-424"></a>    <span class="n">enable_gpt_tagging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-425"><a id="__codelineno-0-425" name="__codelineno-0-425"></a>    <span class="n">skip_writeout</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">bool</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-426"><a id="__codelineno-0-426" name="__codelineno-0-426"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-427"><a id="__codelineno-0-427" name="__codelineno-0-427"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-428"><a id="__codelineno-0-428" name="__codelineno-0-428"></a><span class="sd">    Treat a certain parsed variable as part of its template and regenerate parsed dataframes.</span>
+</span><span id="__span-0-429"><a id="__codelineno-0-429" name="__codelineno-0-429"></a>
+</span><span id="__span-0-430"><a id="__codelineno-0-430" name="__codelineno-0-430"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-431"><a id="__codelineno-0-431" name="__codelineno-0-431"></a><span class="sd">        var: The name or tag of the variable to be included in its template.</span>
+</span><span id="__span-0-432"><a id="__codelineno-0-432" name="__codelineno-0-432"></a><span class="sd">        enable_gpt_tagging: A boolean indicating whether GPT-3.5 tagging should be enabled.</span>
+</span><span id="__span-0-433"><a id="__codelineno-0-433" name="__codelineno-0-433"></a><span class="sd">        skip_writeout: Whether to skip writing out the regenerated parsed dataframes. Defaults</span>
+</span><span id="__span-0-434"><a id="__codelineno-0-434" name="__codelineno-0-434"></a><span class="sd">            to the value of self._skip_writeout.</span>
+</span><span id="__span-0-435"><a id="__codelineno-0-435" name="__codelineno-0-435"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-436"><a id="__codelineno-0-436" name="__codelineno-0-436"></a>    <span class="n">name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="n">var</span><span class="p">,</span> <span class="s2">&quot;parsed&quot;</span><span class="p">)</span>
+</span><span id="__span-0-437"><a id="__codelineno-0-437" name="__codelineno-0-437"></a>
+</span><span id="__span-0-438"><a id="__codelineno-0-438" name="__codelineno-0-438"></a>    <span class="n">old_template_id</span> <span class="o">=</span> <span class="n">ParsedVariableName</span><span class="p">(</span><span class="n">name</span><span class="p">)</span><span class="o">.</span><span class="n">template_id</span><span class="p">()</span>
+</span><span id="__span-0-439"><a id="__codelineno-0-439" name="__codelineno-0-439"></a>    <span class="n">idx</span> <span class="o">=</span> <span class="n">ParsedVariableName</span><span class="p">(</span><span class="n">name</span><span class="p">)</span><span class="o">.</span><span class="n">index</span><span class="p">()</span>
+</span><span id="__span-0-440"><a id="__codelineno-0-440" name="__codelineno-0-440"></a>    <span class="n">value_counts</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">name</span><span class="p">]</span><span class="o">.</span><span class="n">value_counts</span><span class="p">()</span><span class="o">.</span><span class="n">to_dict</span><span class="p">()</span>
+</span><span id="__span-0-441"><a id="__codelineno-0-441" name="__codelineno-0-441"></a>
+</span><span id="__span-0-442"><a id="__codelineno-0-442" name="__codelineno-0-442"></a>    <span class="c1">### Modify _parsed_templates</span>
+</span><span id="__span-0-443"><a id="__codelineno-0-443" name="__codelineno-0-443"></a>    <span class="n">old_template_row</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-444"><a id="__codelineno-0-444" name="__codelineno-0-444"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-445"><a id="__codelineno-0-445" name="__codelineno-0-445"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">old_template_id</span>
+</span><span id="__span-0-446"><a id="__codelineno-0-446" name="__codelineno-0-446"></a>        <span class="p">]</span>
+</span><span id="__span-0-447"><a id="__codelineno-0-447" name="__codelineno-0-447"></a>        <span class="o">.</span><span class="n">iloc</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-448"><a id="__codelineno-0-448" name="__codelineno-0-448"></a>        <span class="o">.</span><span class="n">copy</span><span class="p">()</span>
+</span><span id="__span-0-449"><a id="__codelineno-0-449" name="__codelineno-0-449"></a>    <span class="p">)</span>
+</span><span id="__span-0-450"><a id="__codelineno-0-450" name="__codelineno-0-450"></a>    <span class="n">toks</span> <span class="o">=</span> <span class="n">old_template_row</span><span class="p">[</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot; &quot;</span><span class="p">)</span>
+</span><span id="__span-0-451"><a id="__codelineno-0-451" name="__codelineno-0-451"></a>    <span class="n">new_template_ids</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-452"><a id="__codelineno-0-452" name="__codelineno-0-452"></a>    <span class="n">new_variable_indices</span> <span class="o">=</span> <span class="n">old_template_row</span><span class="p">[</span><span class="s2">&quot;VariableIndices&quot;</span><span class="p">]</span>
+</span><span id="__span-0-453"><a id="__codelineno-0-453" name="__codelineno-0-453"></a>    <span class="n">new_variable_indices</span><span class="o">.</span><span class="n">remove</span><span class="p">(</span><span class="n">idx</span><span class="p">)</span>
+</span><span id="__span-0-454"><a id="__codelineno-0-454" name="__codelineno-0-454"></a>
+</span><span id="__span-0-455"><a id="__codelineno-0-455" name="__codelineno-0-455"></a>    <span class="k">for</span> <span class="n">value</span><span class="p">,</span> <span class="n">occurences</span> <span class="ow">in</span> <span class="n">value_counts</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="__span-0-456"><a id="__codelineno-0-456" name="__codelineno-0-456"></a>        <span class="n">new_template_row</span> <span class="o">=</span> <span class="n">old_template_row</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
+</span><span id="__span-0-457"><a id="__codelineno-0-457" name="__codelineno-0-457"></a>        <span class="n">toks</span><span class="p">[</span><span class="n">idx</span><span class="p">]</span> <span class="o">=</span> <span class="n">value</span>
 </span><span id="__span-0-458"><a id="__codelineno-0-458" name="__codelineno-0-458"></a>
-</span><span id="__span-0-459"><a id="__codelineno-0-459" name="__codelineno-0-459"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span>
-</span><span id="__span-0-460"><a id="__codelineno-0-460" name="__codelineno-0-460"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">!=</span> <span class="n">old_template_id</span>
-</span><span id="__span-0-461"><a id="__codelineno-0-461" name="__codelineno-0-461"></a>    <span class="p">]</span><span class="o">.</span><span class="n">reset_index</span><span class="p">(</span><span class="n">drop</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-462"><a id="__codelineno-0-462" name="__codelineno-0-462"></a>
-</span><span id="__span-0-463"><a id="__codelineno-0-463" name="__codelineno-0-463"></a>    <span class="c1">### Modify _parsed_log</span>
-</span><span id="__span-0-464"><a id="__codelineno-0-464" name="__codelineno-0-464"></a>
-</span><span id="__span-0-465"><a id="__codelineno-0-465" name="__codelineno-0-465"></a>    <span class="c1"># Update the template ids of all rows that belonged to the old template</span>
-</span><span id="__span-0-466"><a id="__codelineno-0-466" name="__codelineno-0-466"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
-</span><span id="__span-0-467"><a id="__codelineno-0-467" name="__codelineno-0-467"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="__span-0-468"><a id="__codelineno-0-468" name="__codelineno-0-468"></a>            <span class="n">new_template_ids</span><span class="p">[</span><span class="n">x</span><span class="p">[</span><span class="n">name</span><span class="p">]]</span>
-</span><span id="__span-0-469"><a id="__codelineno-0-469" name="__codelineno-0-469"></a>            <span class="k">if</span> <span class="p">(</span><span class="n">x</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">old_template_id</span><span class="p">)</span>
-</span><span id="__span-0-470"><a id="__codelineno-0-470" name="__codelineno-0-470"></a>            <span class="k">else</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span>
-</span><span id="__span-0-471"><a id="__codelineno-0-471" name="__codelineno-0-471"></a>        <span class="p">),</span>
-</span><span id="__span-0-472"><a id="__codelineno-0-472" name="__codelineno-0-472"></a>        <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-</span><span id="__span-0-473"><a id="__codelineno-0-473" name="__codelineno-0-473"></a>    <span class="p">)</span>
-</span><span id="__span-0-474"><a id="__codelineno-0-474" name="__codelineno-0-474"></a>
-</span><span id="__span-0-475"><a id="__codelineno-0-475" name="__codelineno-0-475"></a>    <span class="c1"># Create new variables for each new template id and assign the value of the old variables to them</span>
-</span><span id="__span-0-476"><a id="__codelineno-0-476" name="__codelineno-0-476"></a>    <span class="n">new_variables</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-477"><a id="__codelineno-0-477" name="__codelineno-0-477"></a>    <span class="k">for</span> <span class="n">new_template_id</span> <span class="ow">in</span> <span class="n">new_template_ids</span><span class="o">.</span><span class="n">values</span><span class="p">():</span>
-</span><span id="__span-0-478"><a id="__codelineno-0-478" name="__codelineno-0-478"></a>        <span class="k">for</span> <span class="n">other_idx</span> <span class="ow">in</span> <span class="n">new_variable_indices</span><span class="p">:</span>
-</span><span id="__span-0-479"><a id="__codelineno-0-479" name="__codelineno-0-479"></a>            <span class="n">new_var_name</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">new_template_id</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="nb">str</span><span class="p">(</span><span class="n">other_idx</span><span class="p">)</span><span class="si">}</span><span class="s2">&quot;</span>
-</span><span id="__span-0-480"><a id="__codelineno-0-480" name="__codelineno-0-480"></a>            <span class="n">new_variables</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">new_var_name</span><span class="p">)</span>
-</span><span id="__span-0-481"><a id="__codelineno-0-481" name="__codelineno-0-481"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">new_var_name</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
-</span><span id="__span-0-482"><a id="__codelineno-0-482" name="__codelineno-0-482"></a>                <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="__span-0-483"><a id="__codelineno-0-483" name="__codelineno-0-483"></a>                    <span class="n">x</span><span class="p">[</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">old_template_id</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="n">other_idx</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">]</span>
-</span><span id="__span-0-484"><a id="__codelineno-0-484" name="__codelineno-0-484"></a>                    <span class="k">if</span> <span class="p">(</span><span class="n">x</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">new_template_id</span><span class="p">)</span>
-</span><span id="__span-0-485"><a id="__codelineno-0-485" name="__codelineno-0-485"></a>                    <span class="k">else</span> <span class="kc">None</span>
-</span><span id="__span-0-486"><a id="__codelineno-0-486" name="__codelineno-0-486"></a>                <span class="p">),</span>
-</span><span id="__span-0-487"><a id="__codelineno-0-487" name="__codelineno-0-487"></a>                <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-</span><span id="__span-0-488"><a id="__codelineno-0-488" name="__codelineno-0-488"></a>            <span class="p">)</span>
-</span><span id="__span-0-489"><a id="__codelineno-0-489" name="__codelineno-0-489"></a>
-</span><span id="__span-0-490"><a id="__codelineno-0-490" name="__codelineno-0-490"></a>    <span class="c1"># Drop variable columns associated with old template id</span>
-</span><span id="__span-0-491"><a id="__codelineno-0-491" name="__codelineno-0-491"></a>    <span class="n">variables_to_drop</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="__span-0-492"><a id="__codelineno-0-492" name="__codelineno-0-492"></a>        <span class="n">v</span> <span class="k">for</span> <span class="n">v</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="o">.</span><span class="n">columns</span> <span class="k">if</span> <span class="n">v</span><span class="o">.</span><span class="n">startswith</span><span class="p">(</span><span class="n">old_template_id</span><span class="p">)</span>
-</span><span id="__span-0-493"><a id="__codelineno-0-493" name="__codelineno-0-493"></a>    <span class="p">]</span>
-</span><span id="__span-0-494"><a id="__codelineno-0-494" name="__codelineno-0-494"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">columns</span><span class="o">=</span><span class="n">variables_to_drop</span><span class="p">,</span> <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-495"><a id="__codelineno-0-495" name="__codelineno-0-495"></a>
-</span><span id="__span-0-496"><a id="__codelineno-0-496" name="__codelineno-0-496"></a>    <span class="c1">### Modify _parsed_variables</span>
-</span><span id="__span-0-497"><a id="__codelineno-0-497" name="__codelineno-0-497"></a>
-</span><span id="__span-0-498"><a id="__codelineno-0-498" name="__codelineno-0-498"></a>    <span class="c1"># Add variable rows for each new variable</span>
-</span><span id="__span-0-499"><a id="__codelineno-0-499" name="__codelineno-0-499"></a>    <span class="k">for</span> <span class="n">value</span><span class="p">,</span> <span class="n">occurrences</span> <span class="ow">in</span> <span class="n">value_counts</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="__span-0-500"><a id="__codelineno-0-500" name="__codelineno-0-500"></a>        <span class="k">for</span> <span class="n">other_idx</span> <span class="ow">in</span> <span class="n">new_variable_indices</span><span class="p">:</span>
-</span><span id="__span-0-501"><a id="__codelineno-0-501" name="__codelineno-0-501"></a>            <span class="n">new_template_id</span> <span class="o">=</span> <span class="n">new_template_ids</span><span class="p">[</span><span class="n">value</span><span class="p">]</span>
-</span><span id="__span-0-502"><a id="__codelineno-0-502" name="__codelineno-0-502"></a>            <span class="n">new_var_name</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">new_template_id</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="nb">str</span><span class="p">(</span><span class="n">other_idx</span><span class="p">)</span><span class="si">}</span><span class="s2">&quot;</span>
-</span><span id="__span-0-503"><a id="__codelineno-0-503" name="__codelineno-0-503"></a>
-</span><span id="__span-0-504"><a id="__codelineno-0-504" name="__codelineno-0-504"></a>            <span class="n">x</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-505"><a id="__codelineno-0-505" name="__codelineno-0-505"></a>            <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_var_name</span>
-</span><span id="__span-0-506"><a id="__codelineno-0-506" name="__codelineno-0-506"></a>            <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Occurrences&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">occurrences</span>
-</span><span id="__span-0-507"><a id="__codelineno-0-507" name="__codelineno-0-507"></a>            <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Preceding 3 tokens&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-508"><a id="__codelineno-0-508" name="__codelineno-0-508"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span>
-</span><span id="__span-0-509"><a id="__codelineno-0-509" name="__codelineno-0-509"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">new_template_id</span>
-</span><span id="__span-0-510"><a id="__codelineno-0-510" name="__codelineno-0-510"></a>                <span class="p">][</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span>
-</span><span id="__span-0-511"><a id="__codelineno-0-511" name="__codelineno-0-511"></a>                <span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-512"><a id="__codelineno-0-512" name="__codelineno-0-512"></a>                <span class="o">.</span><span class="n">split</span><span class="p">()[</span><span class="nb">max</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">other_idx</span> <span class="o">-</span> <span class="mi">3</span><span class="p">)</span> <span class="p">:</span> <span class="n">other_idx</span><span class="p">]</span>
-</span><span id="__span-0-513"><a id="__codelineno-0-513" name="__codelineno-0-513"></a>            <span class="p">)</span>
-</span><span id="__span-0-514"><a id="__codelineno-0-514" name="__codelineno-0-514"></a>            <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Examples&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-515"><a id="__codelineno-0-515" name="__codelineno-0-515"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">new_var_name</span><span class="p">]</span>
-</span><span id="__span-0-516"><a id="__codelineno-0-516" name="__codelineno-0-516"></a>                <span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">new_var_name</span><span class="p">]</span><span class="o">.</span><span class="n">notna</span><span class="p">()]</span>
-</span><span id="__span-0-517"><a id="__codelineno-0-517" name="__codelineno-0-517"></a>                <span class="o">.</span><span class="n">unique</span><span class="p">()[:</span><span class="mi">5</span><span class="p">]</span>
-</span><span id="__span-0-518"><a id="__codelineno-0-518" name="__codelineno-0-518"></a>                <span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
-</span><span id="__span-0-519"><a id="__codelineno-0-519" name="__codelineno-0-519"></a>            <span class="p">)</span>
-</span><span id="__span-0-520"><a id="__codelineno-0-520" name="__codelineno-0-520"></a>            <span class="n">x</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="kc">False</span>
-</span><span id="__span-0-521"><a id="__codelineno-0-521" name="__codelineno-0-521"></a>            <span class="k">if</span> <span class="n">enable_gpt_tagging</span><span class="p">:</span>
-</span><span id="__span-0-522"><a id="__codelineno-0-522" name="__codelineno-0-522"></a>                <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">],</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;TagOrigin&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">waterfall_tag</span><span class="p">(</span>
-</span><span id="__span-0-523"><a id="__codelineno-0-523" name="__codelineno-0-523"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="p">,</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
-</span><span id="__span-0-524"><a id="__codelineno-0-524" name="__codelineno-0-524"></a>                <span class="p">)</span>
-</span><span id="__span-0-525"><a id="__codelineno-0-525" name="__codelineno-0-525"></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-526"><a id="__codelineno-0-526" name="__codelineno-0-526"></a>                <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">],</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;TagOrigin&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">preceding_tokens_tag</span><span class="p">(</span>
-</span><span id="__span-0-527"><a id="__codelineno-0-527" name="__codelineno-0-527"></a>                    <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
-</span><span id="__span-0-528"><a id="__codelineno-0-528" name="__codelineno-0-528"></a>                <span class="p">)</span>
-</span><span id="__span-0-529"><a id="__codelineno-0-529" name="__codelineno-0-529"></a>            <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_find_type</span><span class="p">(</span><span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">(</span><span class="n">x</span><span class="p">))</span>
-</span><span id="__span-0-530"><a id="__codelineno-0-530" name="__codelineno-0-530"></a>            <span class="n">x</span><span class="p">[</span><span class="s2">&quot;IsUninteresting&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_find_uninteresting</span><span class="p">(</span><span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">(</span><span class="n">x</span><span class="p">))</span>
-</span><span id="__span-0-531"><a id="__codelineno-0-531" name="__codelineno-0-531"></a>
-</span><span id="__span-0-532"><a id="__codelineno-0-532" name="__codelineno-0-532"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">)]</span> <span class="o">=</span> <span class="n">x</span>
-</span><span id="__span-0-533"><a id="__codelineno-0-533" name="__codelineno-0-533"></a>
-</span><span id="__span-0-534"><a id="__codelineno-0-534" name="__codelineno-0-534"></a>    <span class="c1"># Drop variable rows associated with old template id</span>
-</span><span id="__span-0-535"><a id="__codelineno-0-535" name="__codelineno-0-535"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span>
-</span><span id="__span-0-536"><a id="__codelineno-0-536" name="__codelineno-0-536"></a>        <span class="o">~</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="n">variables_to_drop</span><span class="p">)</span>
-</span><span id="__span-0-537"><a id="__codelineno-0-537" name="__codelineno-0-537"></a>    <span class="p">]</span><span class="o">.</span><span class="n">reset_index</span><span class="p">(</span><span class="n">drop</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-538"><a id="__codelineno-0-538" name="__codelineno-0-538"></a>
-</span><span id="__span-0-539"><a id="__codelineno-0-539" name="__codelineno-0-539"></a>    <span class="c1"># Deduplicate tags again</span>
-</span><span id="__span-0-540"><a id="__codelineno-0-540" name="__codelineno-0-540"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">deduplicate_tags</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">)</span>
-</span><span id="__span-0-541"><a id="__codelineno-0-541" name="__codelineno-0-541"></a>
-</span><span id="__span-0-542"><a id="__codelineno-0-542" name="__codelineno-0-542"></a>    <span class="c1"># Write out files if appropriate.</span>
-</span><span id="__span-0-543"><a id="__codelineno-0-543" name="__codelineno-0-543"></a>    <span class="k">if</span> <span class="n">skip_writeout</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-544"><a id="__codelineno-0-544" name="__codelineno-0-544"></a>        <span class="n">skip_writeout</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_skip_writeout</span>
-</span><span id="__span-0-545"><a id="__codelineno-0-545" name="__codelineno-0-545"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">skip_writeout</span><span class="p">:</span>
-</span><span id="__span-0-546"><a id="__codelineno-0-546" name="__codelineno-0-546"></a>        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;about to write stuff out&quot;</span><span class="p">)</span>
-</span><span id="__span-0-547"><a id="__codelineno-0-547" name="__codelineno-0-547"></a>        <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">)))</span>
-</span><span id="__span-0-548"><a id="__codelineno-0-548" name="__codelineno-0-548"></a>        <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span>
-</span><span id="__span-0-549"><a id="__codelineno-0-549" name="__codelineno-0-549"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">,</span>
-</span><span id="__span-0-550"><a id="__codelineno-0-550" name="__codelineno-0-550"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">)),</span>
-</span><span id="__span-0-551"><a id="__codelineno-0-551" name="__codelineno-0-551"></a>        <span class="p">)</span>
-</span><span id="__span-0-552"><a id="__codelineno-0-552" name="__codelineno-0-552"></a>        <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span>
-</span><span id="__span-0-553"><a id="__codelineno-0-553" name="__codelineno-0-553"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span>
-</span><span id="__span-0-554"><a id="__codelineno-0-554" name="__codelineno-0-554"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">)),</span>
-</span><span id="__span-0-555"><a id="__codelineno-0-555" name="__codelineno-0-555"></a>        <span class="p">)</span>
+</span><span id="__span-0-459"><a id="__codelineno-0-459" name="__codelineno-0-459"></a>        <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot; &quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">toks</span><span class="p">)</span>
+</span><span id="__span-0-460"><a id="__codelineno-0-460" name="__codelineno-0-460"></a>        <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">hashlib</span><span class="o">.</span><span class="n">md5</span><span class="p">(</span>
+</span><span id="__span-0-461"><a id="__codelineno-0-461" name="__codelineno-0-461"></a>            <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">encode</span><span class="p">(</span><span class="s2">&quot;utf-8&quot;</span><span class="p">)</span>
+</span><span id="__span-0-462"><a id="__codelineno-0-462" name="__codelineno-0-462"></a>        <span class="p">)</span><span class="o">.</span><span class="n">hexdigest</span><span class="p">()[</span><span class="mi">0</span><span class="p">:</span><span class="mi">8</span><span class="p">]</span>
+</span><span id="__span-0-463"><a id="__codelineno-0-463" name="__codelineno-0-463"></a>        <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;Occurrences&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">occurences</span>
+</span><span id="__span-0-464"><a id="__codelineno-0-464" name="__codelineno-0-464"></a>        <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;VariableIndices&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_variable_indices</span>
+</span><span id="__span-0-465"><a id="__codelineno-0-465" name="__codelineno-0-465"></a>        <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;RegexIndices&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">old_template_row</span><span class="p">[</span><span class="s2">&quot;RegexIndices&quot;</span><span class="p">]</span>
+</span><span id="__span-0-466"><a id="__codelineno-0-466" name="__codelineno-0-466"></a>
+</span><span id="__span-0-467"><a id="__codelineno-0-467" name="__codelineno-0-467"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">)]</span> <span class="o">=</span> <span class="n">new_template_row</span>
+</span><span id="__span-0-468"><a id="__codelineno-0-468" name="__codelineno-0-468"></a>        <span class="n">new_template_ids</span><span class="p">[</span><span class="n">value</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_template_row</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span>
+</span><span id="__span-0-469"><a id="__codelineno-0-469" name="__codelineno-0-469"></a>
+</span><span id="__span-0-470"><a id="__codelineno-0-470" name="__codelineno-0-470"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span>
+</span><span id="__span-0-471"><a id="__codelineno-0-471" name="__codelineno-0-471"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">!=</span> <span class="n">old_template_id</span>
+</span><span id="__span-0-472"><a id="__codelineno-0-472" name="__codelineno-0-472"></a>    <span class="p">]</span><span class="o">.</span><span class="n">reset_index</span><span class="p">(</span><span class="n">drop</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-473"><a id="__codelineno-0-473" name="__codelineno-0-473"></a>
+</span><span id="__span-0-474"><a id="__codelineno-0-474" name="__codelineno-0-474"></a>    <span class="c1">### Modify _parsed_log</span>
+</span><span id="__span-0-475"><a id="__codelineno-0-475" name="__codelineno-0-475"></a>
+</span><span id="__span-0-476"><a id="__codelineno-0-476" name="__codelineno-0-476"></a>    <span class="c1"># Update the template ids of all rows that belonged to the old template</span>
+</span><span id="__span-0-477"><a id="__codelineno-0-477" name="__codelineno-0-477"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
+</span><span id="__span-0-478"><a id="__codelineno-0-478" name="__codelineno-0-478"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="__span-0-479"><a id="__codelineno-0-479" name="__codelineno-0-479"></a>            <span class="n">new_template_ids</span><span class="p">[</span><span class="n">x</span><span class="p">[</span><span class="n">name</span><span class="p">]]</span>
+</span><span id="__span-0-480"><a id="__codelineno-0-480" name="__codelineno-0-480"></a>            <span class="k">if</span> <span class="p">(</span><span class="n">x</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">old_template_id</span><span class="p">)</span>
+</span><span id="__span-0-481"><a id="__codelineno-0-481" name="__codelineno-0-481"></a>            <span class="k">else</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span>
+</span><span id="__span-0-482"><a id="__codelineno-0-482" name="__codelineno-0-482"></a>        <span class="p">),</span>
+</span><span id="__span-0-483"><a id="__codelineno-0-483" name="__codelineno-0-483"></a>        <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+</span><span id="__span-0-484"><a id="__codelineno-0-484" name="__codelineno-0-484"></a>    <span class="p">)</span>
+</span><span id="__span-0-485"><a id="__codelineno-0-485" name="__codelineno-0-485"></a>
+</span><span id="__span-0-486"><a id="__codelineno-0-486" name="__codelineno-0-486"></a>    <span class="c1"># Create new variables for each new template id and assign the value of the old variables to them</span>
+</span><span id="__span-0-487"><a id="__codelineno-0-487" name="__codelineno-0-487"></a>    <span class="n">new_variables</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-488"><a id="__codelineno-0-488" name="__codelineno-0-488"></a>    <span class="k">for</span> <span class="n">new_template_id</span> <span class="ow">in</span> <span class="n">new_template_ids</span><span class="o">.</span><span class="n">values</span><span class="p">():</span>
+</span><span id="__span-0-489"><a id="__codelineno-0-489" name="__codelineno-0-489"></a>        <span class="k">for</span> <span class="n">other_idx</span> <span class="ow">in</span> <span class="n">new_variable_indices</span><span class="p">:</span>
+</span><span id="__span-0-490"><a id="__codelineno-0-490" name="__codelineno-0-490"></a>            <span class="n">new_var_name</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">new_template_id</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="nb">str</span><span class="p">(</span><span class="n">other_idx</span><span class="p">)</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="__span-0-491"><a id="__codelineno-0-491" name="__codelineno-0-491"></a>            <span class="n">new_variables</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">new_var_name</span><span class="p">)</span>
+</span><span id="__span-0-492"><a id="__codelineno-0-492" name="__codelineno-0-492"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">new_var_name</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
+</span><span id="__span-0-493"><a id="__codelineno-0-493" name="__codelineno-0-493"></a>                <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="__span-0-494"><a id="__codelineno-0-494" name="__codelineno-0-494"></a>                    <span class="n">x</span><span class="p">[</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">old_template_id</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="n">other_idx</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">]</span>
+</span><span id="__span-0-495"><a id="__codelineno-0-495" name="__codelineno-0-495"></a>                    <span class="k">if</span> <span class="p">(</span><span class="n">x</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">new_template_id</span><span class="p">)</span>
+</span><span id="__span-0-496"><a id="__codelineno-0-496" name="__codelineno-0-496"></a>                    <span class="k">else</span> <span class="kc">None</span>
+</span><span id="__span-0-497"><a id="__codelineno-0-497" name="__codelineno-0-497"></a>                <span class="p">),</span>
+</span><span id="__span-0-498"><a id="__codelineno-0-498" name="__codelineno-0-498"></a>                <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+</span><span id="__span-0-499"><a id="__codelineno-0-499" name="__codelineno-0-499"></a>            <span class="p">)</span>
+</span><span id="__span-0-500"><a id="__codelineno-0-500" name="__codelineno-0-500"></a>
+</span><span id="__span-0-501"><a id="__codelineno-0-501" name="__codelineno-0-501"></a>    <span class="c1"># Drop variable columns associated with old template id</span>
+</span><span id="__span-0-502"><a id="__codelineno-0-502" name="__codelineno-0-502"></a>    <span class="n">variables_to_drop</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="__span-0-503"><a id="__codelineno-0-503" name="__codelineno-0-503"></a>        <span class="n">v</span> <span class="k">for</span> <span class="n">v</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="o">.</span><span class="n">columns</span> <span class="k">if</span> <span class="n">v</span><span class="o">.</span><span class="n">startswith</span><span class="p">(</span><span class="n">old_template_id</span><span class="p">)</span>
+</span><span id="__span-0-504"><a id="__codelineno-0-504" name="__codelineno-0-504"></a>    <span class="p">]</span>
+</span><span id="__span-0-505"><a id="__codelineno-0-505" name="__codelineno-0-505"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">columns</span><span class="o">=</span><span class="n">variables_to_drop</span><span class="p">,</span> <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-506"><a id="__codelineno-0-506" name="__codelineno-0-506"></a>
+</span><span id="__span-0-507"><a id="__codelineno-0-507" name="__codelineno-0-507"></a>    <span class="c1">### Modify _parsed_variables</span>
+</span><span id="__span-0-508"><a id="__codelineno-0-508" name="__codelineno-0-508"></a>
+</span><span id="__span-0-509"><a id="__codelineno-0-509" name="__codelineno-0-509"></a>    <span class="c1"># Add variable rows for each new variable</span>
+</span><span id="__span-0-510"><a id="__codelineno-0-510" name="__codelineno-0-510"></a>    <span class="k">for</span> <span class="n">value</span><span class="p">,</span> <span class="n">occurrences</span> <span class="ow">in</span> <span class="n">value_counts</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="__span-0-511"><a id="__codelineno-0-511" name="__codelineno-0-511"></a>        <span class="k">for</span> <span class="n">other_idx</span> <span class="ow">in</span> <span class="n">new_variable_indices</span><span class="p">:</span>
+</span><span id="__span-0-512"><a id="__codelineno-0-512" name="__codelineno-0-512"></a>            <span class="n">new_template_id</span> <span class="o">=</span> <span class="n">new_template_ids</span><span class="p">[</span><span class="n">value</span><span class="p">]</span>
+</span><span id="__span-0-513"><a id="__codelineno-0-513" name="__codelineno-0-513"></a>            <span class="n">new_var_name</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">new_template_id</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="nb">str</span><span class="p">(</span><span class="n">other_idx</span><span class="p">)</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="__span-0-514"><a id="__codelineno-0-514" name="__codelineno-0-514"></a>
+</span><span id="__span-0-515"><a id="__codelineno-0-515" name="__codelineno-0-515"></a>            <span class="n">x</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-516"><a id="__codelineno-0-516" name="__codelineno-0-516"></a>            <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_var_name</span>
+</span><span id="__span-0-517"><a id="__codelineno-0-517" name="__codelineno-0-517"></a>            <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Occurrences&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">occurrences</span>
+</span><span id="__span-0-518"><a id="__codelineno-0-518" name="__codelineno-0-518"></a>            <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Preceding 3 tokens&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-519"><a id="__codelineno-0-519" name="__codelineno-0-519"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span>
+</span><span id="__span-0-520"><a id="__codelineno-0-520" name="__codelineno-0-520"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">new_template_id</span>
+</span><span id="__span-0-521"><a id="__codelineno-0-521" name="__codelineno-0-521"></a>                <span class="p">][</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span>
+</span><span id="__span-0-522"><a id="__codelineno-0-522" name="__codelineno-0-522"></a>                <span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-523"><a id="__codelineno-0-523" name="__codelineno-0-523"></a>                <span class="o">.</span><span class="n">split</span><span class="p">()[</span><span class="nb">max</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">other_idx</span> <span class="o">-</span> <span class="mi">3</span><span class="p">)</span> <span class="p">:</span> <span class="n">other_idx</span><span class="p">]</span>
+</span><span id="__span-0-524"><a id="__codelineno-0-524" name="__codelineno-0-524"></a>            <span class="p">)</span>
+</span><span id="__span-0-525"><a id="__codelineno-0-525" name="__codelineno-0-525"></a>            <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Examples&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-526"><a id="__codelineno-0-526" name="__codelineno-0-526"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">new_var_name</span><span class="p">]</span>
+</span><span id="__span-0-527"><a id="__codelineno-0-527" name="__codelineno-0-527"></a>                <span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="n">new_var_name</span><span class="p">]</span><span class="o">.</span><span class="n">notna</span><span class="p">()]</span>
+</span><span id="__span-0-528"><a id="__codelineno-0-528" name="__codelineno-0-528"></a>                <span class="o">.</span><span class="n">unique</span><span class="p">()[:</span><span class="mi">5</span><span class="p">]</span>
+</span><span id="__span-0-529"><a id="__codelineno-0-529" name="__codelineno-0-529"></a>                <span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
+</span><span id="__span-0-530"><a id="__codelineno-0-530" name="__codelineno-0-530"></a>            <span class="p">)</span>
+</span><span id="__span-0-531"><a id="__codelineno-0-531" name="__codelineno-0-531"></a>            <span class="n">x</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="kc">False</span>
+</span><span id="__span-0-532"><a id="__codelineno-0-532" name="__codelineno-0-532"></a>            <span class="k">if</span> <span class="n">enable_gpt_tagging</span><span class="p">:</span>
+</span><span id="__span-0-533"><a id="__codelineno-0-533" name="__codelineno-0-533"></a>                <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">],</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;TagOrigin&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">waterfall_tag</span><span class="p">(</span>
+</span><span id="__span-0-534"><a id="__codelineno-0-534" name="__codelineno-0-534"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">parsed_templates</span><span class="p">,</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+</span><span id="__span-0-535"><a id="__codelineno-0-535" name="__codelineno-0-535"></a>                <span class="p">)</span>
+</span><span id="__span-0-536"><a id="__codelineno-0-536" name="__codelineno-0-536"></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-537"><a id="__codelineno-0-537" name="__codelineno-0-537"></a>                <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">],</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;TagOrigin&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">preceding_tokens_tag</span><span class="p">(</span>
+</span><span id="__span-0-538"><a id="__codelineno-0-538" name="__codelineno-0-538"></a>                    <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+</span><span id="__span-0-539"><a id="__codelineno-0-539" name="__codelineno-0-539"></a>                <span class="p">)</span>
+</span><span id="__span-0-540"><a id="__codelineno-0-540" name="__codelineno-0-540"></a>            <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_find_type</span><span class="p">(</span><span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">(</span><span class="n">x</span><span class="p">))</span>
+</span><span id="__span-0-541"><a id="__codelineno-0-541" name="__codelineno-0-541"></a>            <span class="n">x</span><span class="p">[</span><span class="s2">&quot;IsUninteresting&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_find_uninteresting</span><span class="p">(</span><span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">(</span><span class="n">x</span><span class="p">))</span>
+</span><span id="__span-0-542"><a id="__codelineno-0-542" name="__codelineno-0-542"></a>
+</span><span id="__span-0-543"><a id="__codelineno-0-543" name="__codelineno-0-543"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">)]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="__span-0-544"><a id="__codelineno-0-544" name="__codelineno-0-544"></a>
+</span><span id="__span-0-545"><a id="__codelineno-0-545" name="__codelineno-0-545"></a>    <span class="c1"># Drop variable rows associated with old template id</span>
+</span><span id="__span-0-546"><a id="__codelineno-0-546" name="__codelineno-0-546"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span>
+</span><span id="__span-0-547"><a id="__codelineno-0-547" name="__codelineno-0-547"></a>        <span class="o">~</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="n">variables_to_drop</span><span class="p">)</span>
+</span><span id="__span-0-548"><a id="__codelineno-0-548" name="__codelineno-0-548"></a>    <span class="p">]</span><span class="o">.</span><span class="n">reset_index</span><span class="p">(</span><span class="n">drop</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-549"><a id="__codelineno-0-549" name="__codelineno-0-549"></a>
+</span><span id="__span-0-550"><a id="__codelineno-0-550" name="__codelineno-0-550"></a>    <span class="c1"># Deduplicate tags again</span>
+</span><span id="__span-0-551"><a id="__codelineno-0-551" name="__codelineno-0-551"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">deduplicate_tags</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">)</span>
+</span><span id="__span-0-552"><a id="__codelineno-0-552" name="__codelineno-0-552"></a>
+</span><span id="__span-0-553"><a id="__codelineno-0-553" name="__codelineno-0-553"></a>    <span class="c1"># Write out files if appropriate.</span>
+</span><span id="__span-0-554"><a id="__codelineno-0-554" name="__codelineno-0-554"></a>    <span class="k">if</span> <span class="n">skip_writeout</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-555"><a id="__codelineno-0-555" name="__codelineno-0-555"></a>        <span class="n">skip_writeout</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_skip_writeout</span>
+</span><span id="__span-0-556"><a id="__codelineno-0-556" name="__codelineno-0-556"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">skip_writeout</span><span class="p">:</span>
+</span><span id="__span-0-557"><a id="__codelineno-0-557" name="__codelineno-0-557"></a>        <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">)))</span>
+</span><span id="__span-0-558"><a id="__codelineno-0-558" name="__codelineno-0-558"></a>        <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span>
+</span><span id="__span-0-559"><a id="__codelineno-0-559" name="__codelineno-0-559"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">,</span>
+</span><span id="__span-0-560"><a id="__codelineno-0-560" name="__codelineno-0-560"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">)),</span>
+</span><span id="__span-0-561"><a id="__codelineno-0-561" name="__codelineno-0-561"></a>        <span class="p">)</span>
+</span><span id="__span-0-562"><a id="__codelineno-0-562" name="__codelineno-0-562"></a>        <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span>
+</span><span id="__span-0-563"><a id="__codelineno-0-563" name="__codelineno-0-563"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span>
+</span><span id="__span-0-564"><a id="__codelineno-0-564" name="__codelineno-0-564"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">)),</span>
+</span><span id="__span-0-565"><a id="__codelineno-0-565" name="__codelineno-0-565"></a>        <span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -6945,25 +7054,25 @@ <h3 id="logos.logos.LOGos.tag_parsed_variable" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-557">557</a></span>
-<span class="normal"><a href="#__codelineno-0-558">558</a></span>
-<span class="normal"><a href="#__codelineno-0-559">559</a></span>
-<span class="normal"><a href="#__codelineno-0-560">560</a></span>
-<span class="normal"><a href="#__codelineno-0-561">561</a></span>
-<span class="normal"><a href="#__codelineno-0-562">562</a></span>
-<span class="normal"><a href="#__codelineno-0-563">563</a></span>
-<span class="normal"><a href="#__codelineno-0-564">564</a></span>
-<span class="normal"><a href="#__codelineno-0-565">565</a></span>
-<span class="normal"><a href="#__codelineno-0-566">566</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-557"><a id="__codelineno-0-557" name="__codelineno-0-557"></a><span class="k">def</span> <span class="nf">tag_parsed_variable</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">tag</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-558"><a id="__codelineno-0-558" name="__codelineno-0-558"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-559"><a id="__codelineno-0-559" name="__codelineno-0-559"></a><span class="sd">    Tag a parsed variable.</span>
-</span><span id="__span-0-560"><a id="__codelineno-0-560" name="__codelineno-0-560"></a>
-</span><span id="__span-0-561"><a id="__codelineno-0-561" name="__codelineno-0-561"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-562"><a id="__codelineno-0-562" name="__codelineno-0-562"></a><span class="sd">        name: The name of the variable to be tagged.</span>
-</span><span id="__span-0-563"><a id="__codelineno-0-563" name="__codelineno-0-563"></a><span class="sd">        tag: The tag to be assigned to the variable.</span>
-</span><span id="__span-0-564"><a id="__codelineno-0-564" name="__codelineno-0-564"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-565"><a id="__codelineno-0-565" name="__codelineno-0-565"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">set_tag</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="n">name</span><span class="p">,</span> <span class="n">tag</span><span class="p">,</span> <span class="s2">&quot;parsed&quot;</span><span class="p">)</span>
-</span><span id="__span-0-566"><a id="__codelineno-0-566" name="__codelineno-0-566"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">deduplicate_tags</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">)</span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-567">567</a></span>
+<span class="normal"><a href="#__codelineno-0-568">568</a></span>
+<span class="normal"><a href="#__codelineno-0-569">569</a></span>
+<span class="normal"><a href="#__codelineno-0-570">570</a></span>
+<span class="normal"><a href="#__codelineno-0-571">571</a></span>
+<span class="normal"><a href="#__codelineno-0-572">572</a></span>
+<span class="normal"><a href="#__codelineno-0-573">573</a></span>
+<span class="normal"><a href="#__codelineno-0-574">574</a></span>
+<span class="normal"><a href="#__codelineno-0-575">575</a></span>
+<span class="normal"><a href="#__codelineno-0-576">576</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-567"><a id="__codelineno-0-567" name="__codelineno-0-567"></a><span class="k">def</span> <span class="nf">tag_parsed_variable</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">tag</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-568"><a id="__codelineno-0-568" name="__codelineno-0-568"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-569"><a id="__codelineno-0-569" name="__codelineno-0-569"></a><span class="sd">    Tag a parsed variable.</span>
+</span><span id="__span-0-570"><a id="__codelineno-0-570" name="__codelineno-0-570"></a>
+</span><span id="__span-0-571"><a id="__codelineno-0-571" name="__codelineno-0-571"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-572"><a id="__codelineno-0-572" name="__codelineno-0-572"></a><span class="sd">        name: The name of the variable to be tagged.</span>
+</span><span id="__span-0-573"><a id="__codelineno-0-573" name="__codelineno-0-573"></a><span class="sd">        tag: The tag to be assigned to the variable.</span>
+</span><span id="__span-0-574"><a id="__codelineno-0-574" name="__codelineno-0-574"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-575"><a id="__codelineno-0-575" name="__codelineno-0-575"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">set_tag</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="n">name</span><span class="p">,</span> <span class="n">tag</span><span class="p">,</span> <span class="s2">&quot;parsed&quot;</span><span class="p">)</span>
+</span><span id="__span-0-576"><a id="__codelineno-0-576" name="__codelineno-0-576"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">deduplicate_tags</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -7037,27 +7146,27 @@ <h3 id="logos.logos.LOGos.get_tag_of_parsed" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-568">568</a></span>
-<span class="normal"><a href="#__codelineno-0-569">569</a></span>
-<span class="normal"><a href="#__codelineno-0-570">570</a></span>
-<span class="normal"><a href="#__codelineno-0-571">571</a></span>
-<span class="normal"><a href="#__codelineno-0-572">572</a></span>
-<span class="normal"><a href="#__codelineno-0-573">573</a></span>
-<span class="normal"><a href="#__codelineno-0-574">574</a></span>
-<span class="normal"><a href="#__codelineno-0-575">575</a></span>
-<span class="normal"><a href="#__codelineno-0-576">576</a></span>
-<span class="normal"><a href="#__codelineno-0-577">577</a></span>
-<span class="normal"><a href="#__codelineno-0-578">578</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-568"><a id="__codelineno-0-568" name="__codelineno-0-568"></a><span class="k">def</span> <span class="nf">get_tag_of_parsed</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-</span><span id="__span-0-569"><a id="__codelineno-0-569" name="__codelineno-0-569"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-570"><a id="__codelineno-0-570" name="__codelineno-0-570"></a><span class="sd">    Get the tag of a parsed variable.</span>
-</span><span id="__span-0-571"><a id="__codelineno-0-571" name="__codelineno-0-571"></a>
-</span><span id="__span-0-572"><a id="__codelineno-0-572" name="__codelineno-0-572"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-573"><a id="__codelineno-0-573" name="__codelineno-0-573"></a><span class="sd">        name: The name of the variable.</span>
-</span><span id="__span-0-574"><a id="__codelineno-0-574" name="__codelineno-0-574"></a>
-</span><span id="__span-0-575"><a id="__codelineno-0-575" name="__codelineno-0-575"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-576"><a id="__codelineno-0-576" name="__codelineno-0-576"></a><span class="sd">        The tag of the variable.</span>
-</span><span id="__span-0-577"><a id="__codelineno-0-577" name="__codelineno-0-577"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-578"><a id="__codelineno-0-578" name="__codelineno-0-578"></a>    <span class="k">return</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">get_tag</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="n">name</span><span class="p">,</span> <span class="s2">&quot;parsed&quot;</span><span class="p">)</span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-578">578</a></span>
+<span class="normal"><a href="#__codelineno-0-579">579</a></span>
+<span class="normal"><a href="#__codelineno-0-580">580</a></span>
+<span class="normal"><a href="#__codelineno-0-581">581</a></span>
+<span class="normal"><a href="#__codelineno-0-582">582</a></span>
+<span class="normal"><a href="#__codelineno-0-583">583</a></span>
+<span class="normal"><a href="#__codelineno-0-584">584</a></span>
+<span class="normal"><a href="#__codelineno-0-585">585</a></span>
+<span class="normal"><a href="#__codelineno-0-586">586</a></span>
+<span class="normal"><a href="#__codelineno-0-587">587</a></span>
+<span class="normal"><a href="#__codelineno-0-588">588</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-578"><a id="__codelineno-0-578" name="__codelineno-0-578"></a><span class="k">def</span> <span class="nf">get_tag_of_parsed</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-579"><a id="__codelineno-0-579" name="__codelineno-0-579"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-580"><a id="__codelineno-0-580" name="__codelineno-0-580"></a><span class="sd">    Get the tag of a parsed variable.</span>
+</span><span id="__span-0-581"><a id="__codelineno-0-581" name="__codelineno-0-581"></a>
+</span><span id="__span-0-582"><a id="__codelineno-0-582" name="__codelineno-0-582"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-583"><a id="__codelineno-0-583" name="__codelineno-0-583"></a><span class="sd">        name: The name of the variable.</span>
+</span><span id="__span-0-584"><a id="__codelineno-0-584" name="__codelineno-0-584"></a>
+</span><span id="__span-0-585"><a id="__codelineno-0-585" name="__codelineno-0-585"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-586"><a id="__codelineno-0-586" name="__codelineno-0-586"></a><span class="sd">        The tag of the variable.</span>
+</span><span id="__span-0-587"><a id="__codelineno-0-587" name="__codelineno-0-587"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-588"><a id="__codelineno-0-588" name="__codelineno-0-588"></a>    <span class="k">return</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">get_tag</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="n">name</span><span class="p">,</span> <span class="s2">&quot;parsed&quot;</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -7122,25 +7231,25 @@ <h3 id="logos.logos.LOGos.tag_prepared_variable" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-580">580</a></span>
-<span class="normal"><a href="#__codelineno-0-581">581</a></span>
-<span class="normal"><a href="#__codelineno-0-582">582</a></span>
-<span class="normal"><a href="#__codelineno-0-583">583</a></span>
-<span class="normal"><a href="#__codelineno-0-584">584</a></span>
-<span class="normal"><a href="#__codelineno-0-585">585</a></span>
-<span class="normal"><a href="#__codelineno-0-586">586</a></span>
-<span class="normal"><a href="#__codelineno-0-587">587</a></span>
-<span class="normal"><a href="#__codelineno-0-588">588</a></span>
-<span class="normal"><a href="#__codelineno-0-589">589</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-580"><a id="__codelineno-0-580" name="__codelineno-0-580"></a><span class="k">def</span> <span class="nf">tag_prepared_variable</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">tag</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-581"><a id="__codelineno-0-581" name="__codelineno-0-581"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-582"><a id="__codelineno-0-582" name="__codelineno-0-582"></a><span class="sd">    Tag a prepared variable.</span>
-</span><span id="__span-0-583"><a id="__codelineno-0-583" name="__codelineno-0-583"></a>
-</span><span id="__span-0-584"><a id="__codelineno-0-584" name="__codelineno-0-584"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-585"><a id="__codelineno-0-585" name="__codelineno-0-585"></a><span class="sd">        name: The name of the variable to be tagged.</span>
-</span><span id="__span-0-586"><a id="__codelineno-0-586" name="__codelineno-0-586"></a><span class="sd">        tag: The tag to be assigned to the variable.</span>
-</span><span id="__span-0-587"><a id="__codelineno-0-587" name="__codelineno-0-587"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-588"><a id="__codelineno-0-588" name="__codelineno-0-588"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">set_tag</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">name</span><span class="p">,</span> <span class="n">tag</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
-</span><span id="__span-0-589"><a id="__codelineno-0-589" name="__codelineno-0-589"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">deduplicate_tags</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-590">590</a></span>
+<span class="normal"><a href="#__codelineno-0-591">591</a></span>
+<span class="normal"><a href="#__codelineno-0-592">592</a></span>
+<span class="normal"><a href="#__codelineno-0-593">593</a></span>
+<span class="normal"><a href="#__codelineno-0-594">594</a></span>
+<span class="normal"><a href="#__codelineno-0-595">595</a></span>
+<span class="normal"><a href="#__codelineno-0-596">596</a></span>
+<span class="normal"><a href="#__codelineno-0-597">597</a></span>
+<span class="normal"><a href="#__codelineno-0-598">598</a></span>
+<span class="normal"><a href="#__codelineno-0-599">599</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-590"><a id="__codelineno-0-590" name="__codelineno-0-590"></a><span class="k">def</span> <span class="nf">tag_prepared_variable</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">tag</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-591"><a id="__codelineno-0-591" name="__codelineno-0-591"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-592"><a id="__codelineno-0-592" name="__codelineno-0-592"></a><span class="sd">    Tag a prepared variable.</span>
+</span><span id="__span-0-593"><a id="__codelineno-0-593" name="__codelineno-0-593"></a>
+</span><span id="__span-0-594"><a id="__codelineno-0-594" name="__codelineno-0-594"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-595"><a id="__codelineno-0-595" name="__codelineno-0-595"></a><span class="sd">        name: The name of the variable to be tagged.</span>
+</span><span id="__span-0-596"><a id="__codelineno-0-596" name="__codelineno-0-596"></a><span class="sd">        tag: The tag to be assigned to the variable.</span>
+</span><span id="__span-0-597"><a id="__codelineno-0-597" name="__codelineno-0-597"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-598"><a id="__codelineno-0-598" name="__codelineno-0-598"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">set_tag</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">name</span><span class="p">,</span> <span class="n">tag</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
+</span><span id="__span-0-599"><a id="__codelineno-0-599" name="__codelineno-0-599"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">deduplicate_tags</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -7214,27 +7323,27 @@ <h3 id="logos.logos.LOGos.get_tag_of_prepared" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-591">591</a></span>
-<span class="normal"><a href="#__codelineno-0-592">592</a></span>
-<span class="normal"><a href="#__codelineno-0-593">593</a></span>
-<span class="normal"><a href="#__codelineno-0-594">594</a></span>
-<span class="normal"><a href="#__codelineno-0-595">595</a></span>
-<span class="normal"><a href="#__codelineno-0-596">596</a></span>
-<span class="normal"><a href="#__codelineno-0-597">597</a></span>
-<span class="normal"><a href="#__codelineno-0-598">598</a></span>
-<span class="normal"><a href="#__codelineno-0-599">599</a></span>
-<span class="normal"><a href="#__codelineno-0-600">600</a></span>
-<span class="normal"><a href="#__codelineno-0-601">601</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-591"><a id="__codelineno-0-591" name="__codelineno-0-591"></a><span class="k">def</span> <span class="nf">get_tag_of_prepared</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-</span><span id="__span-0-592"><a id="__codelineno-0-592" name="__codelineno-0-592"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-593"><a id="__codelineno-0-593" name="__codelineno-0-593"></a><span class="sd">    Get the tag of a prepared variable.</span>
-</span><span id="__span-0-594"><a id="__codelineno-0-594" name="__codelineno-0-594"></a>
-</span><span id="__span-0-595"><a id="__codelineno-0-595" name="__codelineno-0-595"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-596"><a id="__codelineno-0-596" name="__codelineno-0-596"></a><span class="sd">        name: The name of the variable.</span>
-</span><span id="__span-0-597"><a id="__codelineno-0-597" name="__codelineno-0-597"></a>
-</span><span id="__span-0-598"><a id="__codelineno-0-598" name="__codelineno-0-598"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-599"><a id="__codelineno-0-599" name="__codelineno-0-599"></a><span class="sd">        The tag of the variable.</span>
-</span><span id="__span-0-600"><a id="__codelineno-0-600" name="__codelineno-0-600"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-601"><a id="__codelineno-0-601" name="__codelineno-0-601"></a>    <span class="k">return</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">get_tag</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">name</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-601">601</a></span>
+<span class="normal"><a href="#__codelineno-0-602">602</a></span>
+<span class="normal"><a href="#__codelineno-0-603">603</a></span>
+<span class="normal"><a href="#__codelineno-0-604">604</a></span>
+<span class="normal"><a href="#__codelineno-0-605">605</a></span>
+<span class="normal"><a href="#__codelineno-0-606">606</a></span>
+<span class="normal"><a href="#__codelineno-0-607">607</a></span>
+<span class="normal"><a href="#__codelineno-0-608">608</a></span>
+<span class="normal"><a href="#__codelineno-0-609">609</a></span>
+<span class="normal"><a href="#__codelineno-0-610">610</a></span>
+<span class="normal"><a href="#__codelineno-0-611">611</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-601"><a id="__codelineno-0-601" name="__codelineno-0-601"></a><span class="k">def</span> <span class="nf">get_tag_of_prepared</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-602"><a id="__codelineno-0-602" name="__codelineno-0-602"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-603"><a id="__codelineno-0-603" name="__codelineno-0-603"></a><span class="sd">    Get the tag of a prepared variable.</span>
+</span><span id="__span-0-604"><a id="__codelineno-0-604" name="__codelineno-0-604"></a>
+</span><span id="__span-0-605"><a id="__codelineno-0-605" name="__codelineno-0-605"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-606"><a id="__codelineno-0-606" name="__codelineno-0-606"></a><span class="sd">        name: The name of the variable.</span>
+</span><span id="__span-0-607"><a id="__codelineno-0-607" name="__codelineno-0-607"></a>
+</span><span id="__span-0-608"><a id="__codelineno-0-608" name="__codelineno-0-608"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-609"><a id="__codelineno-0-609" name="__codelineno-0-609"></a><span class="sd">        The tag of the variable.</span>
+</span><span id="__span-0-610"><a id="__codelineno-0-610" name="__codelineno-0-610"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-611"><a id="__codelineno-0-611" name="__codelineno-0-611"></a>    <span class="k">return</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">get_tag</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">name</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -7290,25 +7399,25 @@ <h3 id="logos.logos.LOGos.get_causal_unit_info" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-603">603</a></span>
-<span class="normal"><a href="#__codelineno-0-604">604</a></span>
-<span class="normal"><a href="#__codelineno-0-605">605</a></span>
-<span class="normal"><a href="#__codelineno-0-606">606</a></span>
-<span class="normal"><a href="#__codelineno-0-607">607</a></span>
-<span class="normal"><a href="#__codelineno-0-608">608</a></span>
-<span class="normal"><a href="#__codelineno-0-609">609</a></span>
-<span class="normal"><a href="#__codelineno-0-610">610</a></span>
-<span class="normal"><a href="#__codelineno-0-611">611</a></span>
-<span class="normal"><a href="#__codelineno-0-612">612</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-603"><a id="__codelineno-0-603" name="__codelineno-0-603"></a><span class="k">def</span> <span class="nf">get_causal_unit_info</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">int</span><span class="p">]:</span>
-</span><span id="__span-0-604"><a id="__codelineno-0-604" name="__codelineno-0-604"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-605"><a id="__codelineno-0-605" name="__codelineno-0-605"></a><span class="sd">    Get the variable used to define causal units and the number of</span>
-</span><span id="__span-0-606"><a id="__codelineno-0-606" name="__codelineno-0-606"></a><span class="sd">    causal units.</span>
-</span><span id="__span-0-607"><a id="__codelineno-0-607" name="__codelineno-0-607"></a>
-</span><span id="__span-0-608"><a id="__codelineno-0-608" name="__codelineno-0-608"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-609"><a id="__codelineno-0-609" name="__codelineno-0-609"></a><span class="sd">        The name of the variable used to define causal units</span>
-</span><span id="__span-0-610"><a id="__codelineno-0-610" name="__codelineno-0-610"></a><span class="sd">        and the number of causal units.</span>
-</span><span id="__span-0-611"><a id="__codelineno-0-611" name="__codelineno-0-611"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-612"><a id="__codelineno-0-612" name="__codelineno-0-612"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-613">613</a></span>
+<span class="normal"><a href="#__codelineno-0-614">614</a></span>
+<span class="normal"><a href="#__codelineno-0-615">615</a></span>
+<span class="normal"><a href="#__codelineno-0-616">616</a></span>
+<span class="normal"><a href="#__codelineno-0-617">617</a></span>
+<span class="normal"><a href="#__codelineno-0-618">618</a></span>
+<span class="normal"><a href="#__codelineno-0-619">619</a></span>
+<span class="normal"><a href="#__codelineno-0-620">620</a></span>
+<span class="normal"><a href="#__codelineno-0-621">621</a></span>
+<span class="normal"><a href="#__codelineno-0-622">622</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-613"><a id="__codelineno-0-613" name="__codelineno-0-613"></a><span class="k">def</span> <span class="nf">get_causal_unit_info</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">int</span><span class="p">]:</span>
+</span><span id="__span-0-614"><a id="__codelineno-0-614" name="__codelineno-0-614"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-615"><a id="__codelineno-0-615" name="__codelineno-0-615"></a><span class="sd">    Get the variable used to define causal units and the number of</span>
+</span><span id="__span-0-616"><a id="__codelineno-0-616" name="__codelineno-0-616"></a><span class="sd">    causal units.</span>
+</span><span id="__span-0-617"><a id="__codelineno-0-617" name="__codelineno-0-617"></a>
+</span><span id="__span-0-618"><a id="__codelineno-0-618" name="__codelineno-0-618"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-619"><a id="__codelineno-0-619" name="__codelineno-0-619"></a><span class="sd">        The name of the variable used to define causal units</span>
+</span><span id="__span-0-620"><a id="__codelineno-0-620" name="__codelineno-0-620"></a><span class="sd">        and the number of causal units.</span>
+</span><span id="__span-0-621"><a id="__codelineno-0-621" name="__codelineno-0-621"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-622"><a id="__codelineno-0-622" name="__codelineno-0-622"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -7399,17 +7508,7 @@ <h3 id="logos.logos.LOGos.suggest_causal_unit_defs" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-614">614</a></span>
-<span class="normal"><a href="#__codelineno-0-615">615</a></span>
-<span class="normal"><a href="#__codelineno-0-616">616</a></span>
-<span class="normal"><a href="#__codelineno-0-617">617</a></span>
-<span class="normal"><a href="#__codelineno-0-618">618</a></span>
-<span class="normal"><a href="#__codelineno-0-619">619</a></span>
-<span class="normal"><a href="#__codelineno-0-620">620</a></span>
-<span class="normal"><a href="#__codelineno-0-621">621</a></span>
-<span class="normal"><a href="#__codelineno-0-622">622</a></span>
-<span class="normal"><a href="#__codelineno-0-623">623</a></span>
-<span class="normal"><a href="#__codelineno-0-624">624</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-624">624</a></span>
 <span class="normal"><a href="#__codelineno-0-625">625</a></span>
 <span class="normal"><a href="#__codelineno-0-626">626</a></span>
 <span class="normal"><a href="#__codelineno-0-627">627</a></span>
@@ -7423,31 +7522,41 @@ <h3 id="logos.logos.LOGos.suggest_causal_unit_defs" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-635">635</a></span>
 <span class="normal"><a href="#__codelineno-0-636">636</a></span>
 <span class="normal"><a href="#__codelineno-0-637">637</a></span>
-<span class="normal"><a href="#__codelineno-0-638">638</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-614"><a id="__codelineno-0-614" name="__codelineno-0-614"></a><span class="k">def</span> <span class="nf">suggest_causal_unit_defs</span><span class="p">(</span>
-</span><span id="__span-0-615"><a id="__codelineno-0-615" name="__codelineno-0-615"></a>    <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-616"><a id="__codelineno-0-616" name="__codelineno-0-616"></a>    <span class="n">min_causal_units</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">4</span><span class="p">,</span>
-</span><span id="__span-0-617"><a id="__codelineno-0-617" name="__codelineno-0-617"></a>    <span class="n">num_suggestions</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">10</span><span class="p">,</span>
-</span><span id="__span-0-618"><a id="__codelineno-0-618" name="__codelineno-0-618"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">]:</span>
-</span><span id="__span-0-619"><a id="__codelineno-0-619" name="__codelineno-0-619"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-620"><a id="__codelineno-0-620" name="__codelineno-0-620"></a><span class="sd">    Suggest at most `num_suggestions` causal unit definitions based on IUS maximization,</span>
-</span><span id="__span-0-621"><a id="__codelineno-0-621" name="__codelineno-0-621"></a><span class="sd">    while returning at least `min_causal_units` causal units.</span>
-</span><span id="__span-0-622"><a id="__codelineno-0-622" name="__codelineno-0-622"></a>
-</span><span id="__span-0-623"><a id="__codelineno-0-623" name="__codelineno-0-623"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-624"><a id="__codelineno-0-624" name="__codelineno-0-624"></a><span class="sd">        min_causal_units: The minimum number of causal units that a suggested</span>
-</span><span id="__span-0-625"><a id="__codelineno-0-625" name="__codelineno-0-625"></a><span class="sd">            definition should create.</span>
-</span><span id="__span-0-626"><a id="__codelineno-0-626" name="__codelineno-0-626"></a><span class="sd">        num_suggestions: The maximum number of causal unit definitions to suggest.</span>
-</span><span id="__span-0-627"><a id="__codelineno-0-627" name="__codelineno-0-627"></a>
-</span><span id="__span-0-628"><a id="__codelineno-0-628" name="__codelineno-0-628"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-629"><a id="__codelineno-0-629" name="__codelineno-0-629"></a><span class="sd">        A DataFrame with one row for each suggested causal unit definition, or `None`</span>
-</span><span id="__span-0-630"><a id="__codelineno-0-630" name="__codelineno-0-630"></a><span class="sd">            if no suggestions were made.</span>
-</span><span id="__span-0-631"><a id="__codelineno-0-631" name="__codelineno-0-631"></a><span class="sd">    &quot;&quot;&quot;</span>
+<span class="normal"><a href="#__codelineno-0-638">638</a></span>
+<span class="normal"><a href="#__codelineno-0-639">639</a></span>
+<span class="normal"><a href="#__codelineno-0-640">640</a></span>
+<span class="normal"><a href="#__codelineno-0-641">641</a></span>
+<span class="normal"><a href="#__codelineno-0-642">642</a></span>
+<span class="normal"><a href="#__codelineno-0-643">643</a></span>
+<span class="normal"><a href="#__codelineno-0-644">644</a></span>
+<span class="normal"><a href="#__codelineno-0-645">645</a></span>
+<span class="normal"><a href="#__codelineno-0-646">646</a></span>
+<span class="normal"><a href="#__codelineno-0-647">647</a></span>
+<span class="normal"><a href="#__codelineno-0-648">648</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-624"><a id="__codelineno-0-624" name="__codelineno-0-624"></a><span class="k">def</span> <span class="nf">suggest_causal_unit_defs</span><span class="p">(</span>
+</span><span id="__span-0-625"><a id="__codelineno-0-625" name="__codelineno-0-625"></a>    <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-626"><a id="__codelineno-0-626" name="__codelineno-0-626"></a>    <span class="n">min_causal_units</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">4</span><span class="p">,</span>
+</span><span id="__span-0-627"><a id="__codelineno-0-627" name="__codelineno-0-627"></a>    <span class="n">num_suggestions</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">10</span><span class="p">,</span>
+</span><span id="__span-0-628"><a id="__codelineno-0-628" name="__codelineno-0-628"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">]:</span>
+</span><span id="__span-0-629"><a id="__codelineno-0-629" name="__codelineno-0-629"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-630"><a id="__codelineno-0-630" name="__codelineno-0-630"></a><span class="sd">    Suggest at most `num_suggestions` causal unit definitions based on IUS maximization,</span>
+</span><span id="__span-0-631"><a id="__codelineno-0-631" name="__codelineno-0-631"></a><span class="sd">    while returning at least `min_causal_units` causal units.</span>
 </span><span id="__span-0-632"><a id="__codelineno-0-632" name="__codelineno-0-632"></a>
-</span><span id="__span-0-633"><a id="__codelineno-0-633" name="__codelineno-0-633"></a>    <span class="k">return</span> <span class="n">CausalUnitSuggester</span><span class="o">.</span><span class="n">suggest_causal_unit_defs</span><span class="p">(</span>
-</span><span id="__span-0-634"><a id="__codelineno-0-634" name="__codelineno-0-634"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">],</span>
-</span><span id="__span-0-635"><a id="__codelineno-0-635" name="__codelineno-0-635"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span>
-</span><span id="__span-0-636"><a id="__codelineno-0-636" name="__codelineno-0-636"></a>        <span class="n">min_causal_units</span><span class="o">=</span><span class="n">min_causal_units</span><span class="p">,</span>
-</span><span id="__span-0-637"><a id="__codelineno-0-637" name="__codelineno-0-637"></a>        <span class="n">num_suggestions</span><span class="o">=</span><span class="n">num_suggestions</span><span class="p">,</span>
-</span><span id="__span-0-638"><a id="__codelineno-0-638" name="__codelineno-0-638"></a>    <span class="p">)</span>
+</span><span id="__span-0-633"><a id="__codelineno-0-633" name="__codelineno-0-633"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-634"><a id="__codelineno-0-634" name="__codelineno-0-634"></a><span class="sd">        min_causal_units: The minimum number of causal units that a suggested</span>
+</span><span id="__span-0-635"><a id="__codelineno-0-635" name="__codelineno-0-635"></a><span class="sd">            definition should create.</span>
+</span><span id="__span-0-636"><a id="__codelineno-0-636" name="__codelineno-0-636"></a><span class="sd">        num_suggestions: The maximum number of causal unit definitions to suggest.</span>
+</span><span id="__span-0-637"><a id="__codelineno-0-637" name="__codelineno-0-637"></a>
+</span><span id="__span-0-638"><a id="__codelineno-0-638" name="__codelineno-0-638"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-639"><a id="__codelineno-0-639" name="__codelineno-0-639"></a><span class="sd">        A DataFrame with one row for each suggested causal unit definition, or `None`</span>
+</span><span id="__span-0-640"><a id="__codelineno-0-640" name="__codelineno-0-640"></a><span class="sd">            if no suggestions were made.</span>
+</span><span id="__span-0-641"><a id="__codelineno-0-641" name="__codelineno-0-641"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-642"><a id="__codelineno-0-642" name="__codelineno-0-642"></a>
+</span><span id="__span-0-643"><a id="__codelineno-0-643" name="__codelineno-0-643"></a>    <span class="k">return</span> <span class="n">CausalUnitSuggester</span><span class="o">.</span><span class="n">suggest_causal_unit_defs</span><span class="p">(</span>
+</span><span id="__span-0-644"><a id="__codelineno-0-644" name="__codelineno-0-644"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">],</span>
+</span><span id="__span-0-645"><a id="__codelineno-0-645" name="__codelineno-0-645"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span>
+</span><span id="__span-0-646"><a id="__codelineno-0-646" name="__codelineno-0-646"></a>        <span class="n">min_causal_units</span><span class="o">=</span><span class="n">min_causal_units</span><span class="p">,</span>
+</span><span id="__span-0-647"><a id="__codelineno-0-647" name="__codelineno-0-647"></a>        <span class="n">num_suggestions</span><span class="o">=</span><span class="n">num_suggestions</span><span class="p">,</span>
+</span><span id="__span-0-648"><a id="__codelineno-0-648" name="__codelineno-0-648"></a>    <span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -7537,17 +7646,7 @@ <h3 id="logos.logos.LOGos.set_causal_unit" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-640">640</a></span>
-<span class="normal"><a href="#__codelineno-0-641">641</a></span>
-<span class="normal"><a href="#__codelineno-0-642">642</a></span>
-<span class="normal"><a href="#__codelineno-0-643">643</a></span>
-<span class="normal"><a href="#__codelineno-0-644">644</a></span>
-<span class="normal"><a href="#__codelineno-0-645">645</a></span>
-<span class="normal"><a href="#__codelineno-0-646">646</a></span>
-<span class="normal"><a href="#__codelineno-0-647">647</a></span>
-<span class="normal"><a href="#__codelineno-0-648">648</a></span>
-<span class="normal"><a href="#__codelineno-0-649">649</a></span>
-<span class="normal"><a href="#__codelineno-0-650">650</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-650">650</a></span>
 <span class="normal"><a href="#__codelineno-0-651">651</a></span>
 <span class="normal"><a href="#__codelineno-0-652">652</a></span>
 <span class="normal"><a href="#__codelineno-0-653">653</a></span>
@@ -7574,44 +7673,54 @@ <h3 id="logos.logos.LOGos.set_causal_unit" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-674">674</a></span>
 <span class="normal"><a href="#__codelineno-0-675">675</a></span>
 <span class="normal"><a href="#__codelineno-0-676">676</a></span>
-<span class="normal"><a href="#__codelineno-0-677">677</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-640"><a id="__codelineno-0-640" name="__codelineno-0-640"></a><span class="k">def</span> <span class="nf">set_causal_unit</span><span class="p">(</span>
-</span><span id="__span-0-641"><a id="__codelineno-0-641" name="__codelineno-0-641"></a>    <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-642"><a id="__codelineno-0-642" name="__codelineno-0-642"></a>    <span class="n">var</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="__span-0-643"><a id="__codelineno-0-643" name="__codelineno-0-643"></a>    <span class="n">num_units</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-644"><a id="__codelineno-0-644" name="__codelineno-0-644"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-645"><a id="__codelineno-0-645" name="__codelineno-0-645"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-646"><a id="__codelineno-0-646" name="__codelineno-0-646"></a><span class="sd">    Set the variable used to define causal units and optionally the number of</span>
-</span><span id="__span-0-647"><a id="__codelineno-0-647" name="__codelineno-0-647"></a><span class="sd">    causal units. The latter will be ignored if the variable is categorical, but it</span>
-</span><span id="__span-0-648"><a id="__codelineno-0-648" name="__codelineno-0-648"></a><span class="sd">    must be specified if the variable is numerical.</span>
-</span><span id="__span-0-649"><a id="__codelineno-0-649" name="__codelineno-0-649"></a>
-</span><span id="__span-0-650"><a id="__codelineno-0-650" name="__codelineno-0-650"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-651"><a id="__codelineno-0-651" name="__codelineno-0-651"></a><span class="sd">        var: The name or tag of the variable to be used as the causal unit.</span>
-</span><span id="__span-0-652"><a id="__codelineno-0-652" name="__codelineno-0-652"></a><span class="sd">        num_units: The number of causal units to be created.</span>
-</span><span id="__span-0-653"><a id="__codelineno-0-653" name="__codelineno-0-653"></a>
-</span><span id="__span-0-654"><a id="__codelineno-0-654" name="__codelineno-0-654"></a><span class="sd">    Raises:</span>
-</span><span id="__span-0-655"><a id="__codelineno-0-655" name="__codelineno-0-655"></a><span class="sd">        ValueError: If the variable is numerical and `num_units` is not specified.</span>
-</span><span id="__span-0-656"><a id="__codelineno-0-656" name="__codelineno-0-656"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-657"><a id="__codelineno-0-657" name="__codelineno-0-657"></a>    <span class="n">var_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="n">var</span><span class="p">,</span> <span class="s2">&quot;parsed&quot;</span><span class="p">)</span>
-</span><span id="__span-0-658"><a id="__codelineno-0-658" name="__codelineno-0-658"></a>    <span class="n">var_type</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-659"><a id="__codelineno-0-659" name="__codelineno-0-659"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">var_name</span><span class="p">,</span> <span class="s2">&quot;Type&quot;</span>
-</span><span id="__span-0-660"><a id="__codelineno-0-660" name="__codelineno-0-660"></a>    <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-661"><a id="__codelineno-0-661" name="__codelineno-0-661"></a>
-</span><span id="__span-0-662"><a id="__codelineno-0-662" name="__codelineno-0-662"></a>    <span class="k">if</span> <span class="n">var_type</span> <span class="o">==</span> <span class="s2">&quot;num&quot;</span> <span class="ow">and</span> <span class="n">num_units</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-663"><a id="__codelineno-0-663" name="__codelineno-0-663"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
-</span><span id="__span-0-664"><a id="__codelineno-0-664" name="__codelineno-0-664"></a>            <span class="s2">&quot;The number of causal units must be specified if the causal unit is numerical.&quot;</span>
-</span><span id="__span-0-665"><a id="__codelineno-0-665" name="__codelineno-0-665"></a>        <span class="p">)</span>
-</span><span id="__span-0-666"><a id="__codelineno-0-666" name="__codelineno-0-666"></a>
-</span><span id="__span-0-667"><a id="__codelineno-0-667" name="__codelineno-0-667"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span> <span class="o">=</span> <span class="n">var_name</span>
-</span><span id="__span-0-668"><a id="__codelineno-0-668" name="__codelineno-0-668"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span> <span class="o">=</span> <span class="n">num_units</span>
-</span><span id="__span-0-669"><a id="__codelineno-0-669" name="__codelineno-0-669"></a>
-</span><span id="__span-0-670"><a id="__codelineno-0-670" name="__codelineno-0-670"></a>    <span class="nb">print</span><span class="p">(</span>
-</span><span id="__span-0-671"><a id="__codelineno-0-671" name="__codelineno-0-671"></a>        <span class="sa">f</span><span class="s2">&quot;Causal unit set to </span><span class="si">{</span><span class="n">var_name</span><span class="si">}</span><span class="s2"> (tag: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">get_tag_of_parsed</span><span class="p">(</span><span class="n">var_name</span><span class="p">)</span><span class="si">}</span><span class="s2">) &quot;</span>
-</span><span id="__span-0-672"><a id="__codelineno-0-672" name="__codelineno-0-672"></a>        <span class="o">+</span> <span class="p">(</span>
-</span><span id="__span-0-673"><a id="__codelineno-0-673" name="__codelineno-0-673"></a>            <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-674"><a id="__codelineno-0-674" name="__codelineno-0-674"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span>
-</span><span id="__span-0-675"><a id="__codelineno-0-675" name="__codelineno-0-675"></a>            <span class="k">else</span> <span class="sa">f</span><span class="s2">&quot; with </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span><span class="si">}</span><span class="s2"> causal units.&quot;</span>
-</span><span id="__span-0-676"><a id="__codelineno-0-676" name="__codelineno-0-676"></a>        <span class="p">)</span>
-</span><span id="__span-0-677"><a id="__codelineno-0-677" name="__codelineno-0-677"></a>    <span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-677">677</a></span>
+<span class="normal"><a href="#__codelineno-0-678">678</a></span>
+<span class="normal"><a href="#__codelineno-0-679">679</a></span>
+<span class="normal"><a href="#__codelineno-0-680">680</a></span>
+<span class="normal"><a href="#__codelineno-0-681">681</a></span>
+<span class="normal"><a href="#__codelineno-0-682">682</a></span>
+<span class="normal"><a href="#__codelineno-0-683">683</a></span>
+<span class="normal"><a href="#__codelineno-0-684">684</a></span>
+<span class="normal"><a href="#__codelineno-0-685">685</a></span>
+<span class="normal"><a href="#__codelineno-0-686">686</a></span>
+<span class="normal"><a href="#__codelineno-0-687">687</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-650"><a id="__codelineno-0-650" name="__codelineno-0-650"></a><span class="k">def</span> <span class="nf">set_causal_unit</span><span class="p">(</span>
+</span><span id="__span-0-651"><a id="__codelineno-0-651" name="__codelineno-0-651"></a>    <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-652"><a id="__codelineno-0-652" name="__codelineno-0-652"></a>    <span class="n">var</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-653"><a id="__codelineno-0-653" name="__codelineno-0-653"></a>    <span class="n">num_units</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-654"><a id="__codelineno-0-654" name="__codelineno-0-654"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-655"><a id="__codelineno-0-655" name="__codelineno-0-655"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-656"><a id="__codelineno-0-656" name="__codelineno-0-656"></a><span class="sd">    Set the variable used to define causal units and optionally the number of</span>
+</span><span id="__span-0-657"><a id="__codelineno-0-657" name="__codelineno-0-657"></a><span class="sd">    causal units. The latter will be ignored if the variable is categorical, but it</span>
+</span><span id="__span-0-658"><a id="__codelineno-0-658" name="__codelineno-0-658"></a><span class="sd">    must be specified if the variable is numerical.</span>
+</span><span id="__span-0-659"><a id="__codelineno-0-659" name="__codelineno-0-659"></a>
+</span><span id="__span-0-660"><a id="__codelineno-0-660" name="__codelineno-0-660"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-661"><a id="__codelineno-0-661" name="__codelineno-0-661"></a><span class="sd">        var: The name or tag of the variable to be used as the causal unit.</span>
+</span><span id="__span-0-662"><a id="__codelineno-0-662" name="__codelineno-0-662"></a><span class="sd">        num_units: The number of causal units to be created.</span>
+</span><span id="__span-0-663"><a id="__codelineno-0-663" name="__codelineno-0-663"></a>
+</span><span id="__span-0-664"><a id="__codelineno-0-664" name="__codelineno-0-664"></a><span class="sd">    Raises:</span>
+</span><span id="__span-0-665"><a id="__codelineno-0-665" name="__codelineno-0-665"></a><span class="sd">        ValueError: If the variable is numerical and `num_units` is not specified.</span>
+</span><span id="__span-0-666"><a id="__codelineno-0-666" name="__codelineno-0-666"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-667"><a id="__codelineno-0-667" name="__codelineno-0-667"></a>    <span class="n">var_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="n">var</span><span class="p">,</span> <span class="s2">&quot;parsed&quot;</span><span class="p">)</span>
+</span><span id="__span-0-668"><a id="__codelineno-0-668" name="__codelineno-0-668"></a>    <span class="n">var_type</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-669"><a id="__codelineno-0-669" name="__codelineno-0-669"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">var_name</span><span class="p">,</span> <span class="s2">&quot;Type&quot;</span>
+</span><span id="__span-0-670"><a id="__codelineno-0-670" name="__codelineno-0-670"></a>    <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-671"><a id="__codelineno-0-671" name="__codelineno-0-671"></a>
+</span><span id="__span-0-672"><a id="__codelineno-0-672" name="__codelineno-0-672"></a>    <span class="k">if</span> <span class="n">var_type</span> <span class="o">==</span> <span class="s2">&quot;num&quot;</span> <span class="ow">and</span> <span class="n">num_units</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-673"><a id="__codelineno-0-673" name="__codelineno-0-673"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+</span><span id="__span-0-674"><a id="__codelineno-0-674" name="__codelineno-0-674"></a>            <span class="s2">&quot;The number of causal units must be specified if the causal unit is numerical.&quot;</span>
+</span><span id="__span-0-675"><a id="__codelineno-0-675" name="__codelineno-0-675"></a>        <span class="p">)</span>
+</span><span id="__span-0-676"><a id="__codelineno-0-676" name="__codelineno-0-676"></a>
+</span><span id="__span-0-677"><a id="__codelineno-0-677" name="__codelineno-0-677"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span> <span class="o">=</span> <span class="n">var_name</span>
+</span><span id="__span-0-678"><a id="__codelineno-0-678" name="__codelineno-0-678"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span> <span class="o">=</span> <span class="n">num_units</span>
+</span><span id="__span-0-679"><a id="__codelineno-0-679" name="__codelineno-0-679"></a>
+</span><span id="__span-0-680"><a id="__codelineno-0-680" name="__codelineno-0-680"></a>    <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span>
+</span><span id="__span-0-681"><a id="__codelineno-0-681" name="__codelineno-0-681"></a>        <span class="sa">f</span><span class="s2">&quot;Causal unit set to </span><span class="si">{</span><span class="n">var_name</span><span class="si">}</span><span class="s2"> (tag: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">get_tag_of_parsed</span><span class="p">(</span><span class="n">var_name</span><span class="p">)</span><span class="si">}</span><span class="s2">) &quot;</span>
+</span><span id="__span-0-682"><a id="__codelineno-0-682" name="__codelineno-0-682"></a>        <span class="o">+</span> <span class="p">(</span>
+</span><span id="__span-0-683"><a id="__codelineno-0-683" name="__codelineno-0-683"></a>            <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-684"><a id="__codelineno-0-684" name="__codelineno-0-684"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span>
+</span><span id="__span-0-685"><a id="__codelineno-0-685" name="__codelineno-0-685"></a>            <span class="k">else</span> <span class="sa">f</span><span class="s2">&quot; with </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span><span class="si">}</span><span class="s2"> causal units.&quot;</span>
+</span><span id="__span-0-686"><a id="__codelineno-0-686" name="__codelineno-0-686"></a>        <span class="p">)</span>
+</span><span id="__span-0-687"><a id="__codelineno-0-687" name="__codelineno-0-687"></a>    <span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -7798,17 +7907,7 @@ <h3 id="logos.logos.LOGos.prepare" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-679">679</a></span>
-<span class="normal"><a href="#__codelineno-0-680">680</a></span>
-<span class="normal"><a href="#__codelineno-0-681">681</a></span>
-<span class="normal"><a href="#__codelineno-0-682">682</a></span>
-<span class="normal"><a href="#__codelineno-0-683">683</a></span>
-<span class="normal"><a href="#__codelineno-0-684">684</a></span>
-<span class="normal"><a href="#__codelineno-0-685">685</a></span>
-<span class="normal"><a href="#__codelineno-0-686">686</a></span>
-<span class="normal"><a href="#__codelineno-0-687">687</a></span>
-<span class="normal"><a href="#__codelineno-0-688">688</a></span>
-<span class="normal"><a href="#__codelineno-0-689">689</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-689">689</a></span>
 <span class="normal"><a href="#__codelineno-0-690">690</a></span>
 <span class="normal"><a href="#__codelineno-0-691">691</a></span>
 <span class="normal"><a href="#__codelineno-0-692">692</a></span>
@@ -7876,85 +7975,97 @@ <h3 id="logos.logos.LOGos.prepare" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-754">754</a></span>
 <span class="normal"><a href="#__codelineno-0-755">755</a></span>
 <span class="normal"><a href="#__codelineno-0-756">756</a></span>
-<span class="normal"><a href="#__codelineno-0-757">757</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-679"><a id="__codelineno-0-679" name="__codelineno-0-679"></a><span class="k">def</span> <span class="nf">prepare</span><span class="p">(</span>
-</span><span id="__span-0-680"><a id="__codelineno-0-680" name="__codelineno-0-680"></a>    <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-681"><a id="__codelineno-0-681" name="__codelineno-0-681"></a>    <span class="n">custom_agg</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="p">{},</span>
-</span><span id="__span-0-682"><a id="__codelineno-0-682" name="__codelineno-0-682"></a>    <span class="n">custom_imp</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="p">{},</span>
-</span><span id="__span-0-683"><a id="__codelineno-0-683" name="__codelineno-0-683"></a>    <span class="n">count_occurences</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="__span-0-684"><a id="__codelineno-0-684" name="__codelineno-0-684"></a>    <span class="n">ignore_uninteresting</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="__span-0-685"><a id="__codelineno-0-685" name="__codelineno-0-685"></a>    <span class="n">force</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="__span-0-686"><a id="__codelineno-0-686" name="__codelineno-0-686"></a>    <span class="n">lasso_alpha</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="n">Pruner</span><span class="o">.</span><span class="n">LASSO_DEFAULT_ALPHA</span><span class="p">,</span>
-</span><span id="__span-0-687"><a id="__codelineno-0-687" name="__codelineno-0-687"></a>    <span class="n">lasso_max_iter</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="n">Pruner</span><span class="o">.</span><span class="n">LASSO_DEFAULT_MAX_ITER</span><span class="p">,</span>
-</span><span id="__span-0-688"><a id="__codelineno-0-688" name="__codelineno-0-688"></a>    <span class="n">drop_bad_aggs</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="__span-0-689"><a id="__codelineno-0-689" name="__codelineno-0-689"></a>    <span class="n">reject_prunable_edges</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="__span-0-690"><a id="__codelineno-0-690" name="__codelineno-0-690"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-</span><span id="__span-0-691"><a id="__codelineno-0-691" name="__codelineno-0-691"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-692"><a id="__codelineno-0-692" name="__codelineno-0-692"></a><span class="sd">    Prepare the log parsed from the table for causal analysis, using aggregation and imputation as needed.</span>
-</span><span id="__span-0-693"><a id="__codelineno-0-693" name="__codelineno-0-693"></a>
-</span><span id="__span-0-694"><a id="__codelineno-0-694" name="__codelineno-0-694"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-695"><a id="__codelineno-0-695" name="__codelineno-0-695"></a><span class="sd">        custom_agg: A dictionary of custom aggregation functions to be used for specific variables.</span>
-</span><span id="__span-0-696"><a id="__codelineno-0-696" name="__codelineno-0-696"></a><span class="sd">        custom_imp: A dictionary of custom imputation functions to be used for specific variables.</span>
-</span><span id="__span-0-697"><a id="__codelineno-0-697" name="__codelineno-0-697"></a><span class="sd">        count_occurences: Whether to include extra variables counting the occurence of each template.</span>
-</span><span id="__span-0-698"><a id="__codelineno-0-698" name="__codelineno-0-698"></a><span class="sd">        ignore_uninteresting: Whether to ignore uninteresting variables.</span>
-</span><span id="__span-0-699"><a id="__codelineno-0-699" name="__codelineno-0-699"></a><span class="sd">        force: Whether to force re-preparation of the log.</span>
-</span><span id="__span-0-700"><a id="__codelineno-0-700" name="__codelineno-0-700"></a><span class="sd">        lasso_alpha: The alpha parameter to be used for LASSO regression.</span>
-</span><span id="__span-0-701"><a id="__codelineno-0-701" name="__codelineno-0-701"></a><span class="sd">        lasso_max_iter: The maximum number of iterations to be used for LASSO regression.</span>
-</span><span id="__span-0-702"><a id="__codelineno-0-702" name="__codelineno-0-702"></a><span class="sd">        drop_bad_aggs: Whether to drop prepared variables that do not add information compared to other</span>
-</span><span id="__span-0-703"><a id="__codelineno-0-703" name="__codelineno-0-703"></a><span class="sd">            variables based on the same base variable but using a different aggregation function.</span>
-</span><span id="__span-0-704"><a id="__codelineno-0-704" name="__codelineno-0-704"></a><span class="sd">        reject_prunable_edges: Whether to reject edges that are prunable based on LASSO applciation.</span>
-</span><span id="__span-0-705"><a id="__codelineno-0-705" name="__codelineno-0-705"></a>
-</span><span id="__span-0-706"><a id="__codelineno-0-706" name="__codelineno-0-706"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-707"><a id="__codelineno-0-707" name="__codelineno-0-707"></a><span class="sd">        The time elapsed for preparation, as a string.</span>
-</span><span id="__span-0-708"><a id="__codelineno-0-708" name="__codelineno-0-708"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-709"><a id="__codelineno-0-709" name="__codelineno-0-709"></a>
-</span><span id="__span-0-710"><a id="__codelineno-0-710" name="__codelineno-0-710"></a>    <span class="n">start_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
-</span><span id="__span-0-711"><a id="__codelineno-0-711" name="__codelineno-0-711"></a>    <span class="c1"># Ensure causal unit is set. TODO: make IUS maximizer the default</span>
-</span><span id="__span-0-712"><a id="__codelineno-0-712" name="__codelineno-0-712"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-713"><a id="__codelineno-0-713" name="__codelineno-0-713"></a>        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Causal unit not defined. Aborting.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-714"><a id="__codelineno-0-714" name="__codelineno-0-714"></a>        <span class="k">return</span> <span class="kc">None</span>
+<span class="normal"><a href="#__codelineno-0-757">757</a></span>
+<span class="normal"><a href="#__codelineno-0-758">758</a></span>
+<span class="normal"><a href="#__codelineno-0-759">759</a></span>
+<span class="normal"><a href="#__codelineno-0-760">760</a></span>
+<span class="normal"><a href="#__codelineno-0-761">761</a></span>
+<span class="normal"><a href="#__codelineno-0-762">762</a></span>
+<span class="normal"><a href="#__codelineno-0-763">763</a></span>
+<span class="normal"><a href="#__codelineno-0-764">764</a></span>
+<span class="normal"><a href="#__codelineno-0-765">765</a></span>
+<span class="normal"><a href="#__codelineno-0-766">766</a></span>
+<span class="normal"><a href="#__codelineno-0-767">767</a></span>
+<span class="normal"><a href="#__codelineno-0-768">768</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-689"><a id="__codelineno-0-689" name="__codelineno-0-689"></a><span class="k">def</span> <span class="nf">prepare</span><span class="p">(</span>
+</span><span id="__span-0-690"><a id="__codelineno-0-690" name="__codelineno-0-690"></a>    <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-691"><a id="__codelineno-0-691" name="__codelineno-0-691"></a>    <span class="n">custom_agg</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="p">{},</span>
+</span><span id="__span-0-692"><a id="__codelineno-0-692" name="__codelineno-0-692"></a>    <span class="n">custom_imp</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="p">{},</span>
+</span><span id="__span-0-693"><a id="__codelineno-0-693" name="__codelineno-0-693"></a>    <span class="n">count_occurences</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-694"><a id="__codelineno-0-694" name="__codelineno-0-694"></a>    <span class="n">ignore_uninteresting</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="__span-0-695"><a id="__codelineno-0-695" name="__codelineno-0-695"></a>    <span class="n">force</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-696"><a id="__codelineno-0-696" name="__codelineno-0-696"></a>    <span class="n">lasso_alpha</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="n">Pruner</span><span class="o">.</span><span class="n">LASSO_DEFAULT_ALPHA</span><span class="p">,</span>
+</span><span id="__span-0-697"><a id="__codelineno-0-697" name="__codelineno-0-697"></a>    <span class="n">lasso_max_iter</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="n">Pruner</span><span class="o">.</span><span class="n">LASSO_DEFAULT_MAX_ITER</span><span class="p">,</span>
+</span><span id="__span-0-698"><a id="__codelineno-0-698" name="__codelineno-0-698"></a>    <span class="n">drop_bad_aggs</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="__span-0-699"><a id="__codelineno-0-699" name="__codelineno-0-699"></a>    <span class="n">reject_prunable_edges</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-700"><a id="__codelineno-0-700" name="__codelineno-0-700"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-701"><a id="__codelineno-0-701" name="__codelineno-0-701"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-702"><a id="__codelineno-0-702" name="__codelineno-0-702"></a><span class="sd">    Prepare the log parsed from the table for causal analysis, using aggregation and imputation as needed.</span>
+</span><span id="__span-0-703"><a id="__codelineno-0-703" name="__codelineno-0-703"></a>
+</span><span id="__span-0-704"><a id="__codelineno-0-704" name="__codelineno-0-704"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-705"><a id="__codelineno-0-705" name="__codelineno-0-705"></a><span class="sd">        custom_agg: A dictionary of custom aggregation functions to be used for specific variables.</span>
+</span><span id="__span-0-706"><a id="__codelineno-0-706" name="__codelineno-0-706"></a><span class="sd">        custom_imp: A dictionary of custom imputation functions to be used for specific variables.</span>
+</span><span id="__span-0-707"><a id="__codelineno-0-707" name="__codelineno-0-707"></a><span class="sd">        count_occurences: Whether to include extra variables counting the occurence of each template.</span>
+</span><span id="__span-0-708"><a id="__codelineno-0-708" name="__codelineno-0-708"></a><span class="sd">        ignore_uninteresting: Whether to ignore uninteresting variables.</span>
+</span><span id="__span-0-709"><a id="__codelineno-0-709" name="__codelineno-0-709"></a><span class="sd">        force: Whether to force re-preparation of the log.</span>
+</span><span id="__span-0-710"><a id="__codelineno-0-710" name="__codelineno-0-710"></a><span class="sd">        lasso_alpha: The alpha parameter to be used for LASSO regression.</span>
+</span><span id="__span-0-711"><a id="__codelineno-0-711" name="__codelineno-0-711"></a><span class="sd">        lasso_max_iter: The maximum number of iterations to be used for LASSO regression.</span>
+</span><span id="__span-0-712"><a id="__codelineno-0-712" name="__codelineno-0-712"></a><span class="sd">        drop_bad_aggs: Whether to drop prepared variables that do not add information compared to other</span>
+</span><span id="__span-0-713"><a id="__codelineno-0-713" name="__codelineno-0-713"></a><span class="sd">            variables based on the same base variable but using a different aggregation function.</span>
+</span><span id="__span-0-714"><a id="__codelineno-0-714" name="__codelineno-0-714"></a><span class="sd">        reject_prunable_edges: Whether to reject edges that are prunable based on LASSO applciation.</span>
 </span><span id="__span-0-715"><a id="__codelineno-0-715" name="__codelineno-0-715"></a>
-</span><span id="__span-0-716"><a id="__codelineno-0-716" name="__codelineno-0-716"></a>    <span class="c1"># Check if the prepared files already exist.</span>
-</span><span id="__span-0-717"><a id="__codelineno-0-717" name="__codelineno-0-717"></a>    <span class="n">files_exist</span> <span class="o">=</span> <span class="ow">not</span> <span class="n">force</span>
-</span><span id="__span-0-718"><a id="__codelineno-0-718" name="__codelineno-0-718"></a>    <span class="n">prepared_df_names</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="__span-0-719"><a id="__codelineno-0-719" name="__codelineno-0-719"></a>        <span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">),</span>
-</span><span id="__span-0-720"><a id="__codelineno-0-720" name="__codelineno-0-720"></a>        <span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">),</span>
-</span><span id="__span-0-721"><a id="__codelineno-0-721" name="__codelineno-0-721"></a>    <span class="p">]</span>
-</span><span id="__span-0-722"><a id="__codelineno-0-722" name="__codelineno-0-722"></a>    <span class="k">for</span> <span class="n">var_name</span> <span class="ow">in</span> <span class="n">prepared_df_names</span><span class="p">:</span>
-</span><span id="__span-0-723"><a id="__codelineno-0-723" name="__codelineno-0-723"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">isfile</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">var_name</span><span class="p">)):</span>
-</span><span id="__span-0-724"><a id="__codelineno-0-724" name="__codelineno-0-724"></a>            <span class="n">files_exist</span> <span class="o">=</span> <span class="kc">False</span>
-</span><span id="__span-0-725"><a id="__codelineno-0-725" name="__codelineno-0-725"></a>            <span class="k">break</span>
-</span><span id="__span-0-726"><a id="__codelineno-0-726" name="__codelineno-0-726"></a>
-</span><span id="__span-0-727"><a id="__codelineno-0-727" name="__codelineno-0-727"></a>    <span class="k">if</span> <span class="n">files_exist</span><span class="p">:</span>
-</span><span id="__span-0-728"><a id="__codelineno-0-728" name="__codelineno-0-728"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span> <span class="o">=</span> <span class="n">Pickler</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">prepared_df_names</span><span class="p">[</span><span class="mi">0</span><span class="p">]))</span>
-</span><span id="__span-0-729"><a id="__codelineno-0-729" name="__codelineno-0-729"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span> <span class="o">=</span> <span class="n">Pickler</span><span class="o">.</span><span class="n">load</span><span class="p">(</span>
-</span><span id="__span-0-730"><a id="__codelineno-0-730" name="__codelineno-0-730"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">prepared_df_names</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
-</span><span id="__span-0-731"><a id="__codelineno-0-731" name="__codelineno-0-731"></a>        <span class="p">)</span>
-</span><span id="__span-0-732"><a id="__codelineno-0-732" name="__codelineno-0-732"></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-733"><a id="__codelineno-0-733" name="__codelineno-0-733"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepare_anew</span><span class="p">(</span>
-</span><span id="__span-0-734"><a id="__codelineno-0-734" name="__codelineno-0-734"></a>            <span class="n">custom_agg</span><span class="p">,</span>
-</span><span id="__span-0-735"><a id="__codelineno-0-735" name="__codelineno-0-735"></a>            <span class="n">custom_imp</span><span class="p">,</span>
-</span><span id="__span-0-736"><a id="__codelineno-0-736" name="__codelineno-0-736"></a>            <span class="n">count_occurences</span><span class="o">=</span><span class="n">count_occurences</span><span class="p">,</span>
-</span><span id="__span-0-737"><a id="__codelineno-0-737" name="__codelineno-0-737"></a>            <span class="n">ignore_uninteresting</span><span class="o">=</span><span class="n">ignore_uninteresting</span><span class="p">,</span>
-</span><span id="__span-0-738"><a id="__codelineno-0-738" name="__codelineno-0-738"></a>            <span class="n">drop_bad_aggs</span><span class="o">=</span><span class="n">drop_bad_aggs</span><span class="p">,</span>
-</span><span id="__span-0-739"><a id="__codelineno-0-739" name="__codelineno-0-739"></a>        <span class="p">)</span>
-</span><span id="__span-0-740"><a id="__codelineno-0-740" name="__codelineno-0-740"></a>
-</span><span id="__span-0-741"><a id="__codelineno-0-741" name="__codelineno-0-741"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span> <span class="o">=</span> <span class="n">EdgeStateMatrix</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">prepared_variable_names</span><span class="p">)</span>
-</span><span id="__span-0-742"><a id="__codelineno-0-742" name="__codelineno-0-742"></a>    <span class="k">if</span> <span class="n">reject_prunable_edges</span><span class="p">:</span>
-</span><span id="__span-0-743"><a id="__codelineno-0-743" name="__codelineno-0-743"></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Pruning edges...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-744"><a id="__codelineno-0-744" name="__codelineno-0-744"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">reject_all_prunable_edges</span><span class="p">(</span>
-</span><span id="__span-0-745"><a id="__codelineno-0-745" name="__codelineno-0-745"></a>            <span class="n">lasso_alpha</span><span class="o">=</span><span class="n">lasso_alpha</span><span class="p">,</span> <span class="n">lasso_max_iter</span><span class="o">=</span><span class="n">lasso_max_iter</span>
-</span><span id="__span-0-746"><a id="__codelineno-0-746" name="__codelineno-0-746"></a>        <span class="p">)</span>
-</span><span id="__span-0-747"><a id="__codelineno-0-747" name="__codelineno-0-747"></a>
-</span><span id="__span-0-748"><a id="__codelineno-0-748" name="__codelineno-0-748"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span> <span class="o">=</span> <span class="n">ECCS</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span> <span class="n">nx</span><span class="o">.</span><span class="n">DiGraph</span><span class="p">())</span>
-</span><span id="__span-0-749"><a id="__codelineno-0-749" name="__codelineno-0-749"></a>
-</span><span id="__span-0-750"><a id="__codelineno-0-750" name="__codelineno-0-750"></a>    <span class="n">end_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
-</span><span id="__span-0-751"><a id="__codelineno-0-751" name="__codelineno-0-751"></a>    <span class="n">elapsed</span> <span class="o">=</span> <span class="s2">&quot;</span><span class="si">{:.6f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">((</span><span class="n">end_time</span> <span class="o">-</span> <span class="n">start_time</span><span class="p">)</span><span class="o">.</span><span class="n">total_seconds</span><span class="p">())</span>
-</span><span id="__span-0-752"><a id="__codelineno-0-752" name="__codelineno-0-752"></a>    <span class="nb">print</span><span class="p">(</span>
-</span><span id="__span-0-753"><a id="__codelineno-0-753" name="__codelineno-0-753"></a>        <span class="sa">f</span><span class="s2">&quot;&quot;&quot;Preparation complete in </span><span class="si">{</span><span class="n">elapsed</span><span class="si">}</span><span class="s2"> seconds! &quot;&quot;&quot;</span>
-</span><span id="__span-0-754"><a id="__codelineno-0-754" name="__codelineno-0-754"></a>        <span class="sa">f</span><span class="s2">&quot;&quot;&quot;</span><span class="si">{</span><span class="n">np</span><span class="o">.</span><span class="n">count_nonzero</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">m</span><span class="w"> </span><span class="o">==</span><span class="w"> </span><span class="o">-</span><span class="mi">1</span><span class="p">)</span><span class="si">}</span><span class="s2"> of the </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">num_prepared_variables</span><span class="w"> </span><span class="o">**</span><span class="w"> </span><span class="mi">2</span><span class="si">}</span><span class="s2"> possible edges were auto-rejected.&quot;&quot;&quot;</span>
-</span><span id="__span-0-755"><a id="__codelineno-0-755" name="__codelineno-0-755"></a>    <span class="p">)</span>
-</span><span id="__span-0-756"><a id="__codelineno-0-756" name="__codelineno-0-756"></a>
-</span><span id="__span-0-757"><a id="__codelineno-0-757" name="__codelineno-0-757"></a>    <span class="k">return</span> <span class="n">elapsed</span>
+</span><span id="__span-0-716"><a id="__codelineno-0-716" name="__codelineno-0-716"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-717"><a id="__codelineno-0-717" name="__codelineno-0-717"></a><span class="sd">        The time elapsed for preparation, as a string.</span>
+</span><span id="__span-0-718"><a id="__codelineno-0-718" name="__codelineno-0-718"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-719"><a id="__codelineno-0-719" name="__codelineno-0-719"></a>
+</span><span id="__span-0-720"><a id="__codelineno-0-720" name="__codelineno-0-720"></a>    <span class="n">start_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
+</span><span id="__span-0-721"><a id="__codelineno-0-721" name="__codelineno-0-721"></a>    <span class="c1"># Ensure causal unit is set. TODO: make IUS maximizer the default</span>
+</span><span id="__span-0-722"><a id="__codelineno-0-722" name="__codelineno-0-722"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-723"><a id="__codelineno-0-723" name="__codelineno-0-723"></a>        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Causal unit not defined. Aborting.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-724"><a id="__codelineno-0-724" name="__codelineno-0-724"></a>        <span class="k">return</span> <span class="kc">None</span>
+</span><span id="__span-0-725"><a id="__codelineno-0-725" name="__codelineno-0-725"></a>
+</span><span id="__span-0-726"><a id="__codelineno-0-726" name="__codelineno-0-726"></a>    <span class="c1"># Check if the prepared files already exist.</span>
+</span><span id="__span-0-727"><a id="__codelineno-0-727" name="__codelineno-0-727"></a>    <span class="n">files_exist</span> <span class="o">=</span> <span class="ow">not</span> <span class="n">force</span>
+</span><span id="__span-0-728"><a id="__codelineno-0-728" name="__codelineno-0-728"></a>    <span class="n">prepared_df_names</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="__span-0-729"><a id="__codelineno-0-729" name="__codelineno-0-729"></a>        <span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">),</span>
+</span><span id="__span-0-730"><a id="__codelineno-0-730" name="__codelineno-0-730"></a>        <span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">),</span>
+</span><span id="__span-0-731"><a id="__codelineno-0-731" name="__codelineno-0-731"></a>    <span class="p">]</span>
+</span><span id="__span-0-732"><a id="__codelineno-0-732" name="__codelineno-0-732"></a>    <span class="k">for</span> <span class="n">var_name</span> <span class="ow">in</span> <span class="n">prepared_df_names</span><span class="p">:</span>
+</span><span id="__span-0-733"><a id="__codelineno-0-733" name="__codelineno-0-733"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">isfile</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">var_name</span><span class="p">)):</span>
+</span><span id="__span-0-734"><a id="__codelineno-0-734" name="__codelineno-0-734"></a>            <span class="n">files_exist</span> <span class="o">=</span> <span class="kc">False</span>
+</span><span id="__span-0-735"><a id="__codelineno-0-735" name="__codelineno-0-735"></a>            <span class="k">break</span>
+</span><span id="__span-0-736"><a id="__codelineno-0-736" name="__codelineno-0-736"></a>
+</span><span id="__span-0-737"><a id="__codelineno-0-737" name="__codelineno-0-737"></a>    <span class="k">if</span> <span class="n">files_exist</span><span class="p">:</span>
+</span><span id="__span-0-738"><a id="__codelineno-0-738" name="__codelineno-0-738"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span> <span class="o">=</span> <span class="n">Pickler</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">prepared_df_names</span><span class="p">[</span><span class="mi">0</span><span class="p">]))</span>
+</span><span id="__span-0-739"><a id="__codelineno-0-739" name="__codelineno-0-739"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span> <span class="o">=</span> <span class="n">Pickler</span><span class="o">.</span><span class="n">load</span><span class="p">(</span>
+</span><span id="__span-0-740"><a id="__codelineno-0-740" name="__codelineno-0-740"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">prepared_df_names</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+</span><span id="__span-0-741"><a id="__codelineno-0-741" name="__codelineno-0-741"></a>        <span class="p">)</span>
+</span><span id="__span-0-742"><a id="__codelineno-0-742" name="__codelineno-0-742"></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-743"><a id="__codelineno-0-743" name="__codelineno-0-743"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepare_anew</span><span class="p">(</span>
+</span><span id="__span-0-744"><a id="__codelineno-0-744" name="__codelineno-0-744"></a>            <span class="n">custom_agg</span><span class="p">,</span>
+</span><span id="__span-0-745"><a id="__codelineno-0-745" name="__codelineno-0-745"></a>            <span class="n">custom_imp</span><span class="p">,</span>
+</span><span id="__span-0-746"><a id="__codelineno-0-746" name="__codelineno-0-746"></a>            <span class="n">count_occurences</span><span class="o">=</span><span class="n">count_occurences</span><span class="p">,</span>
+</span><span id="__span-0-747"><a id="__codelineno-0-747" name="__codelineno-0-747"></a>            <span class="n">ignore_uninteresting</span><span class="o">=</span><span class="n">ignore_uninteresting</span><span class="p">,</span>
+</span><span id="__span-0-748"><a id="__codelineno-0-748" name="__codelineno-0-748"></a>            <span class="n">drop_bad_aggs</span><span class="o">=</span><span class="n">drop_bad_aggs</span><span class="p">,</span>
+</span><span id="__span-0-749"><a id="__codelineno-0-749" name="__codelineno-0-749"></a>        <span class="p">)</span>
+</span><span id="__span-0-750"><a id="__codelineno-0-750" name="__codelineno-0-750"></a>
+</span><span id="__span-0-751"><a id="__codelineno-0-751" name="__codelineno-0-751"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span> <span class="o">=</span> <span class="n">EdgeStateMatrix</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">prepared_variable_names</span><span class="p">)</span>
+</span><span id="__span-0-752"><a id="__codelineno-0-752" name="__codelineno-0-752"></a>    <span class="k">if</span> <span class="n">reject_prunable_edges</span><span class="p">:</span>
+</span><span id="__span-0-753"><a id="__codelineno-0-753" name="__codelineno-0-753"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Pruning edges...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-754"><a id="__codelineno-0-754" name="__codelineno-0-754"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">reject_all_prunable_edges</span><span class="p">(</span>
+</span><span id="__span-0-755"><a id="__codelineno-0-755" name="__codelineno-0-755"></a>            <span class="n">lasso_alpha</span><span class="o">=</span><span class="n">lasso_alpha</span><span class="p">,</span> <span class="n">lasso_max_iter</span><span class="o">=</span><span class="n">lasso_max_iter</span>
+</span><span id="__span-0-756"><a id="__codelineno-0-756" name="__codelineno-0-756"></a>        <span class="p">)</span>
+</span><span id="__span-0-757"><a id="__codelineno-0-757" name="__codelineno-0-757"></a>
+</span><span id="__span-0-758"><a id="__codelineno-0-758" name="__codelineno-0-758"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span> <span class="o">=</span> <span class="n">ECCS</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span> <span class="n">nx</span><span class="o">.</span><span class="n">DiGraph</span><span class="p">())</span>
+</span><span id="__span-0-759"><a id="__codelineno-0-759" name="__codelineno-0-759"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">set_verbose_to</span><span class="p">(</span><span class="n">Printer</span><span class="o">.</span><span class="n">LOGOS_VERBOSE</span><span class="p">)</span>
+</span><span id="__span-0-760"><a id="__codelineno-0-760" name="__codelineno-0-760"></a>
+</span><span id="__span-0-761"><a id="__codelineno-0-761" name="__codelineno-0-761"></a>    <span class="n">end_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
+</span><span id="__span-0-762"><a id="__codelineno-0-762" name="__codelineno-0-762"></a>    <span class="n">elapsed</span> <span class="o">=</span> <span class="s2">&quot;</span><span class="si">{:.6f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">((</span><span class="n">end_time</span> <span class="o">-</span> <span class="n">start_time</span><span class="p">)</span><span class="o">.</span><span class="n">total_seconds</span><span class="p">())</span>
+</span><span id="__span-0-763"><a id="__codelineno-0-763" name="__codelineno-0-763"></a>    <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span>
+</span><span id="__span-0-764"><a id="__codelineno-0-764" name="__codelineno-0-764"></a>        <span class="sa">f</span><span class="s2">&quot;&quot;&quot;Preparation complete in </span><span class="si">{</span><span class="n">elapsed</span><span class="si">}</span><span class="s2"> seconds! &quot;&quot;&quot;</span>
+</span><span id="__span-0-765"><a id="__codelineno-0-765" name="__codelineno-0-765"></a>        <span class="sa">f</span><span class="s2">&quot;&quot;&quot;</span><span class="si">{</span><span class="n">np</span><span class="o">.</span><span class="n">count_nonzero</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">m</span><span class="w"> </span><span class="o">==</span><span class="w"> </span><span class="o">-</span><span class="mi">1</span><span class="p">)</span><span class="si">}</span><span class="s2"> of the </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">num_prepared_variables</span><span class="w"> </span><span class="o">**</span><span class="w"> </span><span class="mi">2</span><span class="si">}</span><span class="s2"> possible edges were auto-rejected.&quot;&quot;&quot;</span>
+</span><span id="__span-0-766"><a id="__codelineno-0-766" name="__codelineno-0-766"></a>    <span class="p">)</span>
+</span><span id="__span-0-767"><a id="__codelineno-0-767" name="__codelineno-0-767"></a>
+</span><span id="__span-0-768"><a id="__codelineno-0-768" name="__codelineno-0-768"></a>    <span class="k">return</span> <span class="n">elapsed</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -8062,18 +8173,7 @@ <h3 id="logos.logos.LOGos._prepare_anew" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-759">759</a></span>
-<span class="normal"><a href="#__codelineno-0-760">760</a></span>
-<span class="normal"><a href="#__codelineno-0-761">761</a></span>
-<span class="normal"><a href="#__codelineno-0-762">762</a></span>
-<span class="normal"><a href="#__codelineno-0-763">763</a></span>
-<span class="normal"><a href="#__codelineno-0-764">764</a></span>
-<span class="normal"><a href="#__codelineno-0-765">765</a></span>
-<span class="normal"><a href="#__codelineno-0-766">766</a></span>
-<span class="normal"><a href="#__codelineno-0-767">767</a></span>
-<span class="normal"><a href="#__codelineno-0-768">768</a></span>
-<span class="normal"><a href="#__codelineno-0-769">769</a></span>
-<span class="normal"><a href="#__codelineno-0-770">770</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-770">770</a></span>
 <span class="normal"><a href="#__codelineno-0-771">771</a></span>
 <span class="normal"><a href="#__codelineno-0-772">772</a></span>
 <span class="normal"><a href="#__codelineno-0-773">773</a></span>
@@ -8259,204 +8359,217 @@ <h3 id="logos.logos.LOGos._prepare_anew" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-953">953</a></span>
 <span class="normal"><a href="#__codelineno-0-954">954</a></span>
 <span class="normal"><a href="#__codelineno-0-955">955</a></span>
-<span class="normal"><a href="#__codelineno-0-956">956</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-759"><a id="__codelineno-0-759" name="__codelineno-0-759"></a><span class="k">def</span> <span class="nf">_prepare_anew</span><span class="p">(</span>
-</span><span id="__span-0-760"><a id="__codelineno-0-760" name="__codelineno-0-760"></a>    <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-761"><a id="__codelineno-0-761" name="__codelineno-0-761"></a>    <span class="n">custom_agg</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="p">{},</span>
-</span><span id="__span-0-762"><a id="__codelineno-0-762" name="__codelineno-0-762"></a>    <span class="n">custom_imp</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="p">{},</span>
-</span><span id="__span-0-763"><a id="__codelineno-0-763" name="__codelineno-0-763"></a>    <span class="n">count_occurences</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="__span-0-764"><a id="__codelineno-0-764" name="__codelineno-0-764"></a>    <span class="n">ignore_uninteresting</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="__span-0-765"><a id="__codelineno-0-765" name="__codelineno-0-765"></a>    <span class="n">drop_bad_aggs</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="__span-0-766"><a id="__codelineno-0-766" name="__codelineno-0-766"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-767"><a id="__codelineno-0-767" name="__codelineno-0-767"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-768"><a id="__codelineno-0-768" name="__codelineno-0-768"></a><span class="sd">    Prepare the log anew.</span>
-</span><span id="__span-0-769"><a id="__codelineno-0-769" name="__codelineno-0-769"></a>
-</span><span id="__span-0-770"><a id="__codelineno-0-770" name="__codelineno-0-770"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-771"><a id="__codelineno-0-771" name="__codelineno-0-771"></a><span class="sd">        custom_agg: A dictionary of custom aggregation functions to be used for specific variables.</span>
-</span><span id="__span-0-772"><a id="__codelineno-0-772" name="__codelineno-0-772"></a><span class="sd">        custom_imp: A dictionary of custom imputation functions to be used for specific variables.</span>
-</span><span id="__span-0-773"><a id="__codelineno-0-773" name="__codelineno-0-773"></a><span class="sd">        count_occurences: Whether to include extra variables counting the occurence of each template.</span>
-</span><span id="__span-0-774"><a id="__codelineno-0-774" name="__codelineno-0-774"></a><span class="sd">        ignore_uninteresting: Whether to ignore uninteresting variables.</span>
-</span><span id="__span-0-775"><a id="__codelineno-0-775" name="__codelineno-0-775"></a><span class="sd">        drop_bad_aggs: Whether to drop prepared variables that do not add information compared to other</span>
-</span><span id="__span-0-776"><a id="__codelineno-0-776" name="__codelineno-0-776"></a><span class="sd">            variables based on the same base variable but using a different aggregation function.</span>
-</span><span id="__span-0-777"><a id="__codelineno-0-777" name="__codelineno-0-777"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-778"><a id="__codelineno-0-778" name="__codelineno-0-778"></a>
-</span><span id="__span-0-779"><a id="__codelineno-0-779" name="__codelineno-0-779"></a>    <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Determining the causal unit assignment...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-780"><a id="__codelineno-0-780" name="__codelineno-0-780"></a>    <span class="n">causal_unit_assignment</span> <span class="o">=</span> <span class="n">CausalUnitSuggester</span><span class="o">.</span><span class="n">_discretize</span><span class="p">(</span>
-</span><span id="__span-0-781"><a id="__codelineno-0-781" name="__codelineno-0-781"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">],</span>
-</span><span id="__span-0-782"><a id="__codelineno-0-782" name="__codelineno-0-782"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span>
-</span><span id="__span-0-783"><a id="__codelineno-0-783" name="__codelineno-0-783"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span>
-</span><span id="__span-0-784"><a id="__codelineno-0-784" name="__codelineno-0-784"></a>        <span class="p">][</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span>
-</span><span id="__span-0-785"><a id="__codelineno-0-785" name="__codelineno-0-785"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span><span class="p">,</span>
-</span><span id="__span-0-786"><a id="__codelineno-0-786" name="__codelineno-0-786"></a>    <span class="p">)</span>
-</span><span id="__span-0-787"><a id="__codelineno-0-787" name="__codelineno-0-787"></a>
-</span><span id="__span-0-788"><a id="__codelineno-0-788" name="__codelineno-0-788"></a>    <span class="c1"># Convert keys in custom_agg and custom_imp to the names of the variables, if they are tags.</span>
-</span><span id="__span-0-789"><a id="__codelineno-0-789" name="__codelineno-0-789"></a>    <span class="n">custom_agg</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="__span-0-790"><a id="__codelineno-0-790" name="__codelineno-0-790"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="n">k</span><span class="p">,</span> <span class="s2">&quot;parsed&quot;</span><span class="p">):</span> <span class="n">v</span>
-</span><span id="__span-0-791"><a id="__codelineno-0-791" name="__codelineno-0-791"></a>        <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">custom_agg</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
-</span><span id="__span-0-792"><a id="__codelineno-0-792" name="__codelineno-0-792"></a>    <span class="p">}</span>
-</span><span id="__span-0-793"><a id="__codelineno-0-793" name="__codelineno-0-793"></a>    <span class="n">custom_imp</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="__span-0-794"><a id="__codelineno-0-794" name="__codelineno-0-794"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="n">k</span><span class="p">,</span> <span class="s2">&quot;parsed&quot;</span><span class="p">):</span> <span class="n">v</span>
-</span><span id="__span-0-795"><a id="__codelineno-0-795" name="__codelineno-0-795"></a>        <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">custom_imp</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
-</span><span id="__span-0-796"><a id="__codelineno-0-796" name="__codelineno-0-796"></a>    <span class="p">}</span>
-</span><span id="__span-0-797"><a id="__codelineno-0-797" name="__codelineno-0-797"></a>
-</span><span id="__span-0-798"><a id="__codelineno-0-798" name="__codelineno-0-798"></a>    <span class="c1"># Start with the parsed log, optionally with extra variables counting the occurence of each template.</span>
-</span><span id="__span-0-799"><a id="__codelineno-0-799" name="__codelineno-0-799"></a>    <span class="k">if</span> <span class="n">count_occurences</span><span class="p">:</span>
-</span><span id="__span-0-800"><a id="__codelineno-0-800" name="__codelineno-0-800"></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Adding template occurrence count variables...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-801"><a id="__codelineno-0-801" name="__codelineno-0-801"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">concat</span><span class="p">(</span>
-</span><span id="__span-0-802"><a id="__codelineno-0-802" name="__codelineno-0-802"></a>            <span class="p">[</span>
-</span><span id="__span-0-803"><a id="__codelineno-0-803" name="__codelineno-0-803"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">,</span>
-</span><span id="__span-0-804"><a id="__codelineno-0-804" name="__codelineno-0-804"></a>                <span class="n">pd</span><span class="o">.</span><span class="n">get_dummies</span><span class="p">(</span>
-</span><span id="__span-0-805"><a id="__codelineno-0-805" name="__codelineno-0-805"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">],</span>
-</span><span id="__span-0-806"><a id="__codelineno-0-806" name="__codelineno-0-806"></a>                    <span class="n">prefix</span><span class="o">=</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">,</span>
-</span><span id="__span-0-807"><a id="__codelineno-0-807" name="__codelineno-0-807"></a>                    <span class="n">prefix_sep</span><span class="o">=</span><span class="s2">&quot;=&quot;</span><span class="p">,</span>
-</span><span id="__span-0-808"><a id="__codelineno-0-808" name="__codelineno-0-808"></a>                <span class="p">),</span>
-</span><span id="__span-0-809"><a id="__codelineno-0-809" name="__codelineno-0-809"></a>            <span class="p">],</span>
-</span><span id="__span-0-810"><a id="__codelineno-0-810" name="__codelineno-0-810"></a>            <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-</span><span id="__span-0-811"><a id="__codelineno-0-811" name="__codelineno-0-811"></a>        <span class="p">)</span>
-</span><span id="__span-0-812"><a id="__codelineno-0-812" name="__codelineno-0-812"></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-813"><a id="__codelineno-0-813" name="__codelineno-0-813"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span><span class="n">deep</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-814"><a id="__codelineno-0-814" name="__codelineno-0-814"></a>
-</span><span id="__span-0-815"><a id="__codelineno-0-815" name="__codelineno-0-815"></a>    <span class="c1"># No longer need the column storing the actual template IDs</span>
-</span><span id="__span-0-816"><a id="__codelineno-0-816" name="__codelineno-0-816"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">columns</span><span class="o">=</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">,</span> <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-817"><a id="__codelineno-0-817" name="__codelineno-0-817"></a>
-</span><span id="__span-0-818"><a id="__codelineno-0-818" name="__codelineno-0-818"></a>    <span class="c1"># Build dictionary of aggregation functions</span>
-</span><span id="__span-0-819"><a id="__codelineno-0-819" name="__codelineno-0-819"></a>    <span class="n">agg_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="__span-0-820"><a id="__codelineno-0-820" name="__codelineno-0-820"></a>        <span class="n">variable</span><span class="o">.</span><span class="n">Name</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="__span-0-821"><a id="__codelineno-0-821" name="__codelineno-0-821"></a>            <span class="n">custom_agg</span><span class="p">[</span><span class="n">variable</span><span class="o">.</span><span class="n">Name</span><span class="p">]</span>
-</span><span id="__span-0-822"><a id="__codelineno-0-822" name="__codelineno-0-822"></a>            <span class="k">if</span> <span class="n">variable</span><span class="o">.</span><span class="n">Name</span> <span class="ow">in</span> <span class="n">custom_agg</span>
-</span><span id="__span-0-823"><a id="__codelineno-0-823" name="__codelineno-0-823"></a>            <span class="k">else</span> <span class="n">AggregateSelector</span><span class="o">.</span><span class="n">DEFAULT_AGGREGATES</span><span class="p">[</span><span class="n">variable</span><span class="o">.</span><span class="n">Type</span><span class="p">]</span>
-</span><span id="__span-0-824"><a id="__codelineno-0-824" name="__codelineno-0-824"></a>        <span class="p">)</span>
-</span><span id="__span-0-825"><a id="__codelineno-0-825" name="__codelineno-0-825"></a>        <span class="k">for</span> <span class="n">variable</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">itertuples</span><span class="p">()</span>
-</span><span id="__span-0-826"><a id="__codelineno-0-826" name="__codelineno-0-826"></a>    <span class="p">}</span>
-</span><span id="__span-0-827"><a id="__codelineno-0-827" name="__codelineno-0-827"></a>
-</span><span id="__span-0-828"><a id="__codelineno-0-828" name="__codelineno-0-828"></a>    <span class="c1"># Add aggregations for template counts</span>
-</span><span id="__span-0-829"><a id="__codelineno-0-829" name="__codelineno-0-829"></a>    <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span><span class="p">:</span>
-</span><span id="__span-0-830"><a id="__codelineno-0-830" name="__codelineno-0-830"></a>        <span class="k">if</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">col</span><span class="p">)</span><span class="o">.</span><span class="n">base_var</span><span class="p">()</span> <span class="o">==</span> <span class="s2">&quot;TemplateId&quot;</span><span class="p">:</span>
-</span><span id="__span-0-831"><a id="__codelineno-0-831" name="__codelineno-0-831"></a>            <span class="n">agg_dict</span><span class="p">[</span><span class="n">col</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span><span class="s2">&quot;sum&quot;</span><span class="p">]</span>
-</span><span id="__span-0-832"><a id="__codelineno-0-832" name="__codelineno-0-832"></a>
-</span><span id="__span-0-833"><a id="__codelineno-0-833" name="__codelineno-0-833"></a>    <span class="c1"># Drop uninteresting columns if requested, except if they are the causal unit.</span>
-</span><span id="__span-0-834"><a id="__codelineno-0-834" name="__codelineno-0-834"></a>    <span class="n">ui_cols</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-835"><a id="__codelineno-0-835" name="__codelineno-0-835"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;IsUninteresting&quot;</span><span class="p">],</span> <span class="s2">&quot;Name&quot;</span>
-</span><span id="__span-0-836"><a id="__codelineno-0-836" name="__codelineno-0-836"></a>    <span class="p">]</span><span class="o">.</span><span class="n">values</span>
-</span><span id="__span-0-837"><a id="__codelineno-0-837" name="__codelineno-0-837"></a>    <span class="n">ui_cols</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">ui_cols</span> <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">]</span>
-</span><span id="__span-0-838"><a id="__codelineno-0-838" name="__codelineno-0-838"></a>    <span class="k">if</span> <span class="n">ignore_uninteresting</span><span class="p">:</span>
-</span><span id="__span-0-839"><a id="__codelineno-0-839" name="__codelineno-0-839"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span>
-</span><span id="__span-0-840"><a id="__codelineno-0-840" name="__codelineno-0-840"></a>            <span class="n">columns</span><span class="o">=</span><span class="n">ui_cols</span><span class="p">,</span>
-</span><span id="__span-0-841"><a id="__codelineno-0-841" name="__codelineno-0-841"></a>            <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
-</span><span id="__span-0-842"><a id="__codelineno-0-842" name="__codelineno-0-842"></a>        <span class="p">)</span>
-</span><span id="__span-0-843"><a id="__codelineno-0-843" name="__codelineno-0-843"></a>        <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="n">ui_cols</span><span class="p">:</span>
-</span><span id="__span-0-844"><a id="__codelineno-0-844" name="__codelineno-0-844"></a>            <span class="n">agg_dict</span><span class="o">.</span><span class="n">pop</span><span class="p">(</span><span class="n">col</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
-</span><span id="__span-0-845"><a id="__codelineno-0-845" name="__codelineno-0-845"></a>        <span class="nb">print</span><span class="p">(</span>
-</span><span id="__span-0-846"><a id="__codelineno-0-846" name="__codelineno-0-846"></a>            <span class="sa">f</span><span class="s2">&quot;Dropped </span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">ui_cols</span><span class="p">)</span><span class="si">}</span><span class="s2"> uninteresting columns, out of an original total of </span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">parsed_variables</span><span class="p">)</span><span class="si">}</span><span class="s2">.&quot;</span>
-</span><span id="__span-0-847"><a id="__codelineno-0-847" name="__codelineno-0-847"></a>        <span class="p">)</span>
-</span><span id="__span-0-848"><a id="__codelineno-0-848" name="__codelineno-0-848"></a>
-</span><span id="__span-0-849"><a id="__codelineno-0-849" name="__codelineno-0-849"></a>    <span class="c1"># Ensure the causal unit variable only has one aggregation function</span>
-</span><span id="__span-0-850"><a id="__codelineno-0-850" name="__codelineno-0-850"></a>    <span class="n">agg_dict</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">]</span> <span class="o">=</span> <span class="n">agg_dict</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">][:</span><span class="mi">1</span><span class="p">]</span>
-</span><span id="__span-0-851"><a id="__codelineno-0-851" name="__codelineno-0-851"></a>
-</span><span id="__span-0-852"><a id="__codelineno-0-852" name="__codelineno-0-852"></a>    <span class="c1"># Perform the aggregation</span>
-</span><span id="__span-0-853"><a id="__codelineno-0-853" name="__codelineno-0-853"></a>    <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Calculating aggregates for each causal unit...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-854"><a id="__codelineno-0-854" name="__codelineno-0-854"></a>    <span class="n">agg_func_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="n">Callable</span><span class="p">]]</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="__span-0-855"><a id="__codelineno-0-855" name="__codelineno-0-855"></a>        <span class="n">name</span><span class="p">:</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_agg_funcs</span><span class="p">[</span><span class="n">f</span><span class="p">]</span> <span class="k">for</span> <span class="n">f</span> <span class="ow">in</span> <span class="n">funcs</span><span class="p">]</span>
-</span><span id="__span-0-856"><a id="__codelineno-0-856" name="__codelineno-0-856"></a>        <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">funcs</span> <span class="ow">in</span> <span class="n">agg_dict</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
-</span><span id="__span-0-857"><a id="__codelineno-0-857" name="__codelineno-0-857"></a>    <span class="p">}</span>
-</span><span id="__span-0-858"><a id="__codelineno-0-858" name="__codelineno-0-858"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">groupby</span><span class="p">(</span>
-</span><span id="__span-0-859"><a id="__codelineno-0-859" name="__codelineno-0-859"></a>        <span class="n">causal_unit_assignment</span>
-</span><span id="__span-0-860"><a id="__codelineno-0-860" name="__codelineno-0-860"></a>    <span class="p">)</span><span class="o">.</span><span class="n">aggregate</span><span class="p">(</span><span class="n">agg_func_dict</span><span class="p">)</span>
-</span><span id="__span-0-861"><a id="__codelineno-0-861" name="__codelineno-0-861"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="__span-0-862"><a id="__codelineno-0-862" name="__codelineno-0-862"></a>        <span class="s2">&quot;+&quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">col</span><span class="p">)</span> <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span><span class="o">.</span><span class="n">values</span>
-</span><span id="__span-0-863"><a id="__codelineno-0-863" name="__codelineno-0-863"></a>    <span class="p">]</span>
-</span><span id="__span-0-864"><a id="__codelineno-0-864" name="__codelineno-0-864"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Aggregates&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
-</span><span id="__span-0-865"><a id="__codelineno-0-865" name="__codelineno-0-865"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">agg_dict</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="p">[])</span>
-</span><span id="__span-0-866"><a id="__codelineno-0-866" name="__codelineno-0-866"></a>    <span class="p">)</span>
-</span><span id="__span-0-867"><a id="__codelineno-0-867" name="__codelineno-0-867"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">set_index</span><span class="p">(</span>
-</span><span id="__span-0-868"><a id="__codelineno-0-868" name="__codelineno-0-868"></a>        <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="si">}</span><span class="s2">+</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s1">&#39;Name&#39;</span><span class="p">]</span><span class="w"> </span><span class="o">==</span><span class="w"> </span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">][</span><span class="s1">&#39;Aggregates&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="__span-0-869"><a id="__codelineno-0-869" name="__codelineno-0-869"></a>        <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
-</span><span id="__span-0-870"><a id="__codelineno-0-870" name="__codelineno-0-870"></a>    <span class="p">)</span>
-</span><span id="__span-0-871"><a id="__codelineno-0-871" name="__codelineno-0-871"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">sort_index</span><span class="p">(</span><span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-872"><a id="__codelineno-0-872" name="__codelineno-0-872"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">index</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">index</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">str</span><span class="p">)</span>
-</span><span id="__span-0-873"><a id="__codelineno-0-873" name="__codelineno-0-873"></a>
-</span><span id="__span-0-874"><a id="__codelineno-0-874" name="__codelineno-0-874"></a>    <span class="c1"># Perform the imputation</span>
-</span><span id="__span-0-875"><a id="__codelineno-0-875" name="__codelineno-0-875"></a>    <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="n">tqdm</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span><span class="p">,</span> <span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Imputing missing values...&quot;</span><span class="p">):</span>
-</span><span id="__span-0-876"><a id="__codelineno-0-876" name="__codelineno-0-876"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">col</span><span class="p">]</span><span class="o">.</span><span class="n">isnull</span><span class="p">()</span><span class="o">.</span><span class="n">values</span><span class="o">.</span><span class="n">any</span><span class="p">():</span>
-</span><span id="__span-0-877"><a id="__codelineno-0-877" name="__codelineno-0-877"></a>            <span class="n">base_var</span> <span class="o">=</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">col</span><span class="p">)</span><span class="o">.</span><span class="n">base_var</span><span class="p">()</span>
-</span><span id="__span-0-878"><a id="__codelineno-0-878" name="__codelineno-0-878"></a>            <span class="n">func_name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-879"><a id="__codelineno-0-879" name="__codelineno-0-879"></a>                <span class="n">custom_imp</span><span class="p">[</span><span class="n">base_var</span><span class="p">]</span> <span class="k">if</span> <span class="n">base_var</span> <span class="ow">in</span> <span class="n">custom_imp</span> <span class="k">else</span> <span class="s2">&quot;no_imp&quot;</span>
-</span><span id="__span-0-880"><a id="__codelineno-0-880" name="__codelineno-0-880"></a>            <span class="p">)</span>
-</span><span id="__span-0-881"><a id="__codelineno-0-881" name="__codelineno-0-881"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">col</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_imp_funcs</span><span class="p">[</span><span class="n">func_name</span><span class="p">])(</span>
-</span><span id="__span-0-882"><a id="__codelineno-0-882" name="__codelineno-0-882"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">col</span><span class="p">]</span>
-</span><span id="__span-0-883"><a id="__codelineno-0-883" name="__codelineno-0-883"></a>            <span class="p">)</span>
-</span><span id="__span-0-884"><a id="__codelineno-0-884" name="__codelineno-0-884"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">dropna</span><span class="p">(</span><span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-956">956</a></span>
+<span class="normal"><a href="#__codelineno-0-957">957</a></span>
+<span class="normal"><a href="#__codelineno-0-958">958</a></span>
+<span class="normal"><a href="#__codelineno-0-959">959</a></span>
+<span class="normal"><a href="#__codelineno-0-960">960</a></span>
+<span class="normal"><a href="#__codelineno-0-961">961</a></span>
+<span class="normal"><a href="#__codelineno-0-962">962</a></span>
+<span class="normal"><a href="#__codelineno-0-963">963</a></span>
+<span class="normal"><a href="#__codelineno-0-964">964</a></span>
+<span class="normal"><a href="#__codelineno-0-965">965</a></span>
+<span class="normal"><a href="#__codelineno-0-966">966</a></span>
+<span class="normal"><a href="#__codelineno-0-967">967</a></span>
+<span class="normal"><a href="#__codelineno-0-968">968</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-770"><a id="__codelineno-0-770" name="__codelineno-0-770"></a><span class="k">def</span> <span class="nf">_prepare_anew</span><span class="p">(</span>
+</span><span id="__span-0-771"><a id="__codelineno-0-771" name="__codelineno-0-771"></a>    <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-772"><a id="__codelineno-0-772" name="__codelineno-0-772"></a>    <span class="n">custom_agg</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="p">{},</span>
+</span><span id="__span-0-773"><a id="__codelineno-0-773" name="__codelineno-0-773"></a>    <span class="n">custom_imp</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="p">{},</span>
+</span><span id="__span-0-774"><a id="__codelineno-0-774" name="__codelineno-0-774"></a>    <span class="n">count_occurences</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-775"><a id="__codelineno-0-775" name="__codelineno-0-775"></a>    <span class="n">ignore_uninteresting</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="__span-0-776"><a id="__codelineno-0-776" name="__codelineno-0-776"></a>    <span class="n">drop_bad_aggs</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="__span-0-777"><a id="__codelineno-0-777" name="__codelineno-0-777"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-778"><a id="__codelineno-0-778" name="__codelineno-0-778"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-779"><a id="__codelineno-0-779" name="__codelineno-0-779"></a><span class="sd">    Prepare the log anew.</span>
+</span><span id="__span-0-780"><a id="__codelineno-0-780" name="__codelineno-0-780"></a>
+</span><span id="__span-0-781"><a id="__codelineno-0-781" name="__codelineno-0-781"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-782"><a id="__codelineno-0-782" name="__codelineno-0-782"></a><span class="sd">        custom_agg: A dictionary of custom aggregation functions to be used for specific variables.</span>
+</span><span id="__span-0-783"><a id="__codelineno-0-783" name="__codelineno-0-783"></a><span class="sd">        custom_imp: A dictionary of custom imputation functions to be used for specific variables.</span>
+</span><span id="__span-0-784"><a id="__codelineno-0-784" name="__codelineno-0-784"></a><span class="sd">        count_occurences: Whether to include extra variables counting the occurence of each template.</span>
+</span><span id="__span-0-785"><a id="__codelineno-0-785" name="__codelineno-0-785"></a><span class="sd">        ignore_uninteresting: Whether to ignore uninteresting variables.</span>
+</span><span id="__span-0-786"><a id="__codelineno-0-786" name="__codelineno-0-786"></a><span class="sd">        drop_bad_aggs: Whether to drop prepared variables that do not add information compared to other</span>
+</span><span id="__span-0-787"><a id="__codelineno-0-787" name="__codelineno-0-787"></a><span class="sd">            variables based on the same base variable but using a different aggregation function.</span>
+</span><span id="__span-0-788"><a id="__codelineno-0-788" name="__codelineno-0-788"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-789"><a id="__codelineno-0-789" name="__codelineno-0-789"></a>
+</span><span id="__span-0-790"><a id="__codelineno-0-790" name="__codelineno-0-790"></a>    <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Determining the causal unit assignment...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-791"><a id="__codelineno-0-791" name="__codelineno-0-791"></a>    <span class="n">causal_unit_assignment</span> <span class="o">=</span> <span class="n">CausalUnitSuggester</span><span class="o">.</span><span class="n">_discretize</span><span class="p">(</span>
+</span><span id="__span-0-792"><a id="__codelineno-0-792" name="__codelineno-0-792"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">],</span>
+</span><span id="__span-0-793"><a id="__codelineno-0-793" name="__codelineno-0-793"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span>
+</span><span id="__span-0-794"><a id="__codelineno-0-794" name="__codelineno-0-794"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span>
+</span><span id="__span-0-795"><a id="__codelineno-0-795" name="__codelineno-0-795"></a>        <span class="p">][</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span>
+</span><span id="__span-0-796"><a id="__codelineno-0-796" name="__codelineno-0-796"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span><span class="p">,</span>
+</span><span id="__span-0-797"><a id="__codelineno-0-797" name="__codelineno-0-797"></a>    <span class="p">)</span>
+</span><span id="__span-0-798"><a id="__codelineno-0-798" name="__codelineno-0-798"></a>
+</span><span id="__span-0-799"><a id="__codelineno-0-799" name="__codelineno-0-799"></a>    <span class="c1"># Convert keys in custom_agg and custom_imp to the names of the variables, if they are tags.</span>
+</span><span id="__span-0-800"><a id="__codelineno-0-800" name="__codelineno-0-800"></a>    <span class="n">custom_agg</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="__span-0-801"><a id="__codelineno-0-801" name="__codelineno-0-801"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="n">k</span><span class="p">,</span> <span class="s2">&quot;parsed&quot;</span><span class="p">):</span> <span class="n">v</span>
+</span><span id="__span-0-802"><a id="__codelineno-0-802" name="__codelineno-0-802"></a>        <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">custom_agg</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="__span-0-803"><a id="__codelineno-0-803" name="__codelineno-0-803"></a>    <span class="p">}</span>
+</span><span id="__span-0-804"><a id="__codelineno-0-804" name="__codelineno-0-804"></a>    <span class="n">custom_imp</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="__span-0-805"><a id="__codelineno-0-805" name="__codelineno-0-805"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="n">k</span><span class="p">,</span> <span class="s2">&quot;parsed&quot;</span><span class="p">):</span> <span class="n">v</span>
+</span><span id="__span-0-806"><a id="__codelineno-0-806" name="__codelineno-0-806"></a>        <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">custom_imp</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="__span-0-807"><a id="__codelineno-0-807" name="__codelineno-0-807"></a>    <span class="p">}</span>
+</span><span id="__span-0-808"><a id="__codelineno-0-808" name="__codelineno-0-808"></a>
+</span><span id="__span-0-809"><a id="__codelineno-0-809" name="__codelineno-0-809"></a>    <span class="c1"># Start with the parsed log, optionally with extra variables counting the occurence of each template.</span>
+</span><span id="__span-0-810"><a id="__codelineno-0-810" name="__codelineno-0-810"></a>    <span class="k">if</span> <span class="n">count_occurences</span><span class="p">:</span>
+</span><span id="__span-0-811"><a id="__codelineno-0-811" name="__codelineno-0-811"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Adding template occurrence count variables...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-812"><a id="__codelineno-0-812" name="__codelineno-0-812"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">concat</span><span class="p">(</span>
+</span><span id="__span-0-813"><a id="__codelineno-0-813" name="__codelineno-0-813"></a>            <span class="p">[</span>
+</span><span id="__span-0-814"><a id="__codelineno-0-814" name="__codelineno-0-814"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">,</span>
+</span><span id="__span-0-815"><a id="__codelineno-0-815" name="__codelineno-0-815"></a>                <span class="n">pd</span><span class="o">.</span><span class="n">get_dummies</span><span class="p">(</span>
+</span><span id="__span-0-816"><a id="__codelineno-0-816" name="__codelineno-0-816"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">],</span>
+</span><span id="__span-0-817"><a id="__codelineno-0-817" name="__codelineno-0-817"></a>                    <span class="n">prefix</span><span class="o">=</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">,</span>
+</span><span id="__span-0-818"><a id="__codelineno-0-818" name="__codelineno-0-818"></a>                    <span class="n">prefix_sep</span><span class="o">=</span><span class="s2">&quot;=&quot;</span><span class="p">,</span>
+</span><span id="__span-0-819"><a id="__codelineno-0-819" name="__codelineno-0-819"></a>                    <span class="n">dtype</span><span class="o">=</span><span class="nb">float</span><span class="p">,</span>
+</span><span id="__span-0-820"><a id="__codelineno-0-820" name="__codelineno-0-820"></a>                <span class="p">),</span>
+</span><span id="__span-0-821"><a id="__codelineno-0-821" name="__codelineno-0-821"></a>            <span class="p">],</span>
+</span><span id="__span-0-822"><a id="__codelineno-0-822" name="__codelineno-0-822"></a>            <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+</span><span id="__span-0-823"><a id="__codelineno-0-823" name="__codelineno-0-823"></a>        <span class="p">)</span>
+</span><span id="__span-0-824"><a id="__codelineno-0-824" name="__codelineno-0-824"></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-825"><a id="__codelineno-0-825" name="__codelineno-0-825"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_log</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span><span class="n">deep</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-826"><a id="__codelineno-0-826" name="__codelineno-0-826"></a>
+</span><span id="__span-0-827"><a id="__codelineno-0-827" name="__codelineno-0-827"></a>    <span class="c1"># No longer need the column storing the actual template IDs</span>
+</span><span id="__span-0-828"><a id="__codelineno-0-828" name="__codelineno-0-828"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">columns</span><span class="o">=</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">,</span> <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-829"><a id="__codelineno-0-829" name="__codelineno-0-829"></a>
+</span><span id="__span-0-830"><a id="__codelineno-0-830" name="__codelineno-0-830"></a>    <span class="c1"># Build dictionary of aggregation functions</span>
+</span><span id="__span-0-831"><a id="__codelineno-0-831" name="__codelineno-0-831"></a>    <span class="n">agg_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="__span-0-832"><a id="__codelineno-0-832" name="__codelineno-0-832"></a>        <span class="n">variable</span><span class="o">.</span><span class="n">Name</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="__span-0-833"><a id="__codelineno-0-833" name="__codelineno-0-833"></a>            <span class="n">custom_agg</span><span class="p">[</span><span class="n">variable</span><span class="o">.</span><span class="n">Name</span><span class="p">]</span>
+</span><span id="__span-0-834"><a id="__codelineno-0-834" name="__codelineno-0-834"></a>            <span class="k">if</span> <span class="n">variable</span><span class="o">.</span><span class="n">Name</span> <span class="ow">in</span> <span class="n">custom_agg</span>
+</span><span id="__span-0-835"><a id="__codelineno-0-835" name="__codelineno-0-835"></a>            <span class="k">else</span> <span class="n">AggregateSelector</span><span class="o">.</span><span class="n">DEFAULT_AGGREGATES</span><span class="p">[</span><span class="n">variable</span><span class="o">.</span><span class="n">Type</span><span class="p">]</span>
+</span><span id="__span-0-836"><a id="__codelineno-0-836" name="__codelineno-0-836"></a>        <span class="p">)</span>
+</span><span id="__span-0-837"><a id="__codelineno-0-837" name="__codelineno-0-837"></a>        <span class="k">for</span> <span class="n">variable</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">itertuples</span><span class="p">()</span>
+</span><span id="__span-0-838"><a id="__codelineno-0-838" name="__codelineno-0-838"></a>    <span class="p">}</span>
+</span><span id="__span-0-839"><a id="__codelineno-0-839" name="__codelineno-0-839"></a>
+</span><span id="__span-0-840"><a id="__codelineno-0-840" name="__codelineno-0-840"></a>    <span class="c1"># Add aggregations for template counts</span>
+</span><span id="__span-0-841"><a id="__codelineno-0-841" name="__codelineno-0-841"></a>    <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span><span class="p">:</span>
+</span><span id="__span-0-842"><a id="__codelineno-0-842" name="__codelineno-0-842"></a>        <span class="k">if</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">col</span><span class="p">)</span><span class="o">.</span><span class="n">base_var</span><span class="p">()</span> <span class="o">==</span> <span class="s2">&quot;TemplateId&quot;</span><span class="p">:</span>
+</span><span id="__span-0-843"><a id="__codelineno-0-843" name="__codelineno-0-843"></a>            <span class="n">agg_dict</span><span class="p">[</span><span class="n">col</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span><span class="s2">&quot;sum&quot;</span><span class="p">]</span>
+</span><span id="__span-0-844"><a id="__codelineno-0-844" name="__codelineno-0-844"></a>
+</span><span id="__span-0-845"><a id="__codelineno-0-845" name="__codelineno-0-845"></a>    <span class="c1"># Drop uninteresting columns if requested, except if they are the causal unit.</span>
+</span><span id="__span-0-846"><a id="__codelineno-0-846" name="__codelineno-0-846"></a>    <span class="n">ui_cols</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-847"><a id="__codelineno-0-847" name="__codelineno-0-847"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;IsUninteresting&quot;</span><span class="p">],</span> <span class="s2">&quot;Name&quot;</span>
+</span><span id="__span-0-848"><a id="__codelineno-0-848" name="__codelineno-0-848"></a>    <span class="p">]</span><span class="o">.</span><span class="n">values</span>
+</span><span id="__span-0-849"><a id="__codelineno-0-849" name="__codelineno-0-849"></a>    <span class="n">ui_cols</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">ui_cols</span> <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">]</span>
+</span><span id="__span-0-850"><a id="__codelineno-0-850" name="__codelineno-0-850"></a>    <span class="k">if</span> <span class="n">ignore_uninteresting</span><span class="p">:</span>
+</span><span id="__span-0-851"><a id="__codelineno-0-851" name="__codelineno-0-851"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span>
+</span><span id="__span-0-852"><a id="__codelineno-0-852" name="__codelineno-0-852"></a>            <span class="n">columns</span><span class="o">=</span><span class="n">ui_cols</span><span class="p">,</span>
+</span><span id="__span-0-853"><a id="__codelineno-0-853" name="__codelineno-0-853"></a>            <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+</span><span id="__span-0-854"><a id="__codelineno-0-854" name="__codelineno-0-854"></a>        <span class="p">)</span>
+</span><span id="__span-0-855"><a id="__codelineno-0-855" name="__codelineno-0-855"></a>        <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="n">ui_cols</span><span class="p">:</span>
+</span><span id="__span-0-856"><a id="__codelineno-0-856" name="__codelineno-0-856"></a>            <span class="n">agg_dict</span><span class="o">.</span><span class="n">pop</span><span class="p">(</span><span class="n">col</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
+</span><span id="__span-0-857"><a id="__codelineno-0-857" name="__codelineno-0-857"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span>
+</span><span id="__span-0-858"><a id="__codelineno-0-858" name="__codelineno-0-858"></a>            <span class="sa">f</span><span class="s2">&quot;Dropped </span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">ui_cols</span><span class="p">)</span><span class="si">}</span><span class="s2"> uninteresting columns, out of an original total of </span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">parsed_variables</span><span class="p">)</span><span class="si">}</span><span class="s2">.&quot;</span>
+</span><span id="__span-0-859"><a id="__codelineno-0-859" name="__codelineno-0-859"></a>        <span class="p">)</span>
+</span><span id="__span-0-860"><a id="__codelineno-0-860" name="__codelineno-0-860"></a>
+</span><span id="__span-0-861"><a id="__codelineno-0-861" name="__codelineno-0-861"></a>    <span class="c1"># Ensure the causal unit variable only has one aggregation function</span>
+</span><span id="__span-0-862"><a id="__codelineno-0-862" name="__codelineno-0-862"></a>    <span class="n">agg_dict</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">]</span> <span class="o">=</span> <span class="n">agg_dict</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">][:</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="__span-0-863"><a id="__codelineno-0-863" name="__codelineno-0-863"></a>
+</span><span id="__span-0-864"><a id="__codelineno-0-864" name="__codelineno-0-864"></a>    <span class="c1"># Perform the aggregation</span>
+</span><span id="__span-0-865"><a id="__codelineno-0-865" name="__codelineno-0-865"></a>    <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="s2">&quot;Calculating aggregates for each causal unit...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-866"><a id="__codelineno-0-866" name="__codelineno-0-866"></a>    <span class="n">agg_func_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="n">Callable</span><span class="p">]]</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="__span-0-867"><a id="__codelineno-0-867" name="__codelineno-0-867"></a>        <span class="n">name</span><span class="p">:</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_agg_funcs</span><span class="p">[</span><span class="n">f</span><span class="p">]</span> <span class="k">for</span> <span class="n">f</span> <span class="ow">in</span> <span class="n">funcs</span><span class="p">]</span>
+</span><span id="__span-0-868"><a id="__codelineno-0-868" name="__codelineno-0-868"></a>        <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">funcs</span> <span class="ow">in</span> <span class="n">agg_dict</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="__span-0-869"><a id="__codelineno-0-869" name="__codelineno-0-869"></a>    <span class="p">}</span>
+</span><span id="__span-0-870"><a id="__codelineno-0-870" name="__codelineno-0-870"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">groupby</span><span class="p">(</span>
+</span><span id="__span-0-871"><a id="__codelineno-0-871" name="__codelineno-0-871"></a>        <span class="n">causal_unit_assignment</span>
+</span><span id="__span-0-872"><a id="__codelineno-0-872" name="__codelineno-0-872"></a>    <span class="p">)</span><span class="o">.</span><span class="n">aggregate</span><span class="p">(</span><span class="n">agg_func_dict</span><span class="p">)</span>
+</span><span id="__span-0-873"><a id="__codelineno-0-873" name="__codelineno-0-873"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="__span-0-874"><a id="__codelineno-0-874" name="__codelineno-0-874"></a>        <span class="s2">&quot;+&quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">col</span><span class="p">)</span> <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span><span class="o">.</span><span class="n">values</span>
+</span><span id="__span-0-875"><a id="__codelineno-0-875" name="__codelineno-0-875"></a>    <span class="p">]</span>
+</span><span id="__span-0-876"><a id="__codelineno-0-876" name="__codelineno-0-876"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Aggregates&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
+</span><span id="__span-0-877"><a id="__codelineno-0-877" name="__codelineno-0-877"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">agg_dict</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="p">[])</span>
+</span><span id="__span-0-878"><a id="__codelineno-0-878" name="__codelineno-0-878"></a>    <span class="p">)</span>
+</span><span id="__span-0-879"><a id="__codelineno-0-879" name="__codelineno-0-879"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">set_index</span><span class="p">(</span>
+</span><span id="__span-0-880"><a id="__codelineno-0-880" name="__codelineno-0-880"></a>        <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="si">}</span><span class="s2">+</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s1">&#39;Name&#39;</span><span class="p">]</span><span class="w"> </span><span class="o">==</span><span class="w"> </span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">][</span><span class="s1">&#39;Aggregates&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="__span-0-881"><a id="__codelineno-0-881" name="__codelineno-0-881"></a>        <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+</span><span id="__span-0-882"><a id="__codelineno-0-882" name="__codelineno-0-882"></a>    <span class="p">)</span>
+</span><span id="__span-0-883"><a id="__codelineno-0-883" name="__codelineno-0-883"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">sort_index</span><span class="p">(</span><span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-884"><a id="__codelineno-0-884" name="__codelineno-0-884"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">index</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">index</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">str</span><span class="p">)</span>
 </span><span id="__span-0-885"><a id="__codelineno-0-885" name="__codelineno-0-885"></a>
-</span><span id="__span-0-886"><a id="__codelineno-0-886" name="__codelineno-0-886"></a>    <span class="c1"># Drop variables that do not add information compared to other variables based on the same base variable</span>
-</span><span id="__span-0-887"><a id="__codelineno-0-887" name="__codelineno-0-887"></a>    <span class="c1"># but using a different aggregation function.</span>
-</span><span id="__span-0-888"><a id="__codelineno-0-888" name="__codelineno-0-888"></a>    <span class="k">if</span> <span class="n">drop_bad_aggs</span><span class="p">:</span>
-</span><span id="__span-0-889"><a id="__codelineno-0-889" name="__codelineno-0-889"></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Dropping aggregates that do not add information...&quot;</span><span class="p">)</span>
-</span><span id="__span-0-890"><a id="__codelineno-0-890" name="__codelineno-0-890"></a>        <span class="n">cols_to_drop</span> <span class="o">=</span> <span class="n">AggregateSelector</span><span class="o">.</span><span class="n">find_uninformative_aggregates</span><span class="p">(</span>
-</span><span id="__span-0-891"><a id="__codelineno-0-891" name="__codelineno-0-891"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span>
-</span><span id="__span-0-892"><a id="__codelineno-0-892" name="__codelineno-0-892"></a>        <span class="p">)</span>
-</span><span id="__span-0-893"><a id="__codelineno-0-893" name="__codelineno-0-893"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">columns</span><span class="o">=</span><span class="n">cols_to_drop</span><span class="p">,</span> <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-894"><a id="__codelineno-0-894" name="__codelineno-0-894"></a>
-</span><span id="__span-0-895"><a id="__codelineno-0-895" name="__codelineno-0-895"></a>    <span class="c1"># Identify the categorical variables and one-hot encode them</span>
-</span><span id="__span-0-896"><a id="__codelineno-0-896" name="__codelineno-0-896"></a>    <span class="n">categorical_vars</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">select_dtypes</span><span class="p">(</span>
-</span><span id="__span-0-897"><a id="__codelineno-0-897" name="__codelineno-0-897"></a>        <span class="n">include</span><span class="o">=</span><span class="s2">&quot;object&quot;</span>
-</span><span id="__span-0-898"><a id="__codelineno-0-898" name="__codelineno-0-898"></a>    <span class="p">)</span><span class="o">.</span><span class="n">columns</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
-</span><span id="__span-0-899"><a id="__codelineno-0-899" name="__codelineno-0-899"></a>    <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="n">tqdm</span><span class="p">(</span>
-</span><span id="__span-0-900"><a id="__codelineno-0-900" name="__codelineno-0-900"></a>        <span class="n">categorical_vars</span><span class="p">,</span> <span class="n">desc</span><span class="o">=</span><span class="s2">&quot;One-hot encoding categorical variables...&quot;</span>
-</span><span id="__span-0-901"><a id="__codelineno-0-901" name="__codelineno-0-901"></a>    <span class="p">):</span>
-</span><span id="__span-0-902"><a id="__codelineno-0-902" name="__codelineno-0-902"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">concat</span><span class="p">(</span>
-</span><span id="__span-0-903"><a id="__codelineno-0-903" name="__codelineno-0-903"></a>            <span class="p">[</span>
-</span><span id="__span-0-904"><a id="__codelineno-0-904" name="__codelineno-0-904"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span>
-</span><span id="__span-0-905"><a id="__codelineno-0-905" name="__codelineno-0-905"></a>                <span class="n">pd</span><span class="o">.</span><span class="n">get_dummies</span><span class="p">(</span>
-</span><span id="__span-0-906"><a id="__codelineno-0-906" name="__codelineno-0-906"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">col</span><span class="p">],</span> <span class="n">prefix</span><span class="o">=</span><span class="n">col</span><span class="p">,</span> <span class="n">prefix_sep</span><span class="o">=</span><span class="s2">&quot;=&quot;</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">int</span>
-</span><span id="__span-0-907"><a id="__codelineno-0-907" name="__codelineno-0-907"></a>                <span class="p">),</span>
-</span><span id="__span-0-908"><a id="__codelineno-0-908" name="__codelineno-0-908"></a>            <span class="p">],</span>
-</span><span id="__span-0-909"><a id="__codelineno-0-909" name="__codelineno-0-909"></a>            <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-</span><span id="__span-0-910"><a id="__codelineno-0-910" name="__codelineno-0-910"></a>        <span class="p">)</span>
-</span><span id="__span-0-911"><a id="__codelineno-0-911" name="__codelineno-0-911"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">col</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-912"><a id="__codelineno-0-912" name="__codelineno-0-912"></a>    <span class="c1"># Deal with https://github.com/pydot/pydot/issues/258</span>
-</span><span id="__span-0-913"><a id="__codelineno-0-913" name="__codelineno-0-913"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="__span-0-914"><a id="__codelineno-0-914" name="__codelineno-0-914"></a>        <span class="n">x</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s2">&quot;:&quot;</span><span class="p">,</span> <span class="s2">&quot;;&quot;</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span>
-</span><span id="__span-0-915"><a id="__codelineno-0-915" name="__codelineno-0-915"></a>    <span class="p">]</span>
-</span><span id="__span-0-916"><a id="__codelineno-0-916" name="__codelineno-0-916"></a>
-</span><span id="__span-0-917"><a id="__codelineno-0-917" name="__codelineno-0-917"></a>    <span class="c1"># Generate dataframe of prepared variables for later tagging etc.</span>
-</span><span id="__span-0-918"><a id="__codelineno-0-918" name="__codelineno-0-918"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_generate_prepared_variables_df</span><span class="p">()</span>
-</span><span id="__span-0-919"><a id="__codelineno-0-919" name="__codelineno-0-919"></a>
-</span><span id="__span-0-920"><a id="__codelineno-0-920" name="__codelineno-0-920"></a>    <span class="c1"># Convert any date columns to Unix timestamps in milliseconds</span>
-</span><span id="__span-0-921"><a id="__codelineno-0-921" name="__codelineno-0-921"></a>    <span class="n">date_cols</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-922"><a id="__codelineno-0-922" name="__codelineno-0-922"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="s2">&quot;date&quot;</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span>
-</span><span id="__span-0-923"><a id="__codelineno-0-923" name="__codelineno-0-923"></a>    <span class="p">]</span><span class="o">.</span><span class="n">values</span>
-</span><span id="__span-0-924"><a id="__codelineno-0-924" name="__codelineno-0-924"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">date_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">date_cols</span><span class="p">]</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
-</span><span id="__span-0-925"><a id="__codelineno-0-925" name="__codelineno-0-925"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">x</span><span class="o">.</span><span class="n">timestamp</span><span class="p">()</span> <span class="o">*</span> <span class="mf">1000.0</span>
-</span><span id="__span-0-926"><a id="__codelineno-0-926" name="__codelineno-0-926"></a>    <span class="p">)</span>
-</span><span id="__span-0-927"><a id="__codelineno-0-927" name="__codelineno-0-927"></a>
-</span><span id="__span-0-928"><a id="__codelineno-0-928" name="__codelineno-0-928"></a>    <span class="c1"># Convert any time columns to milliseconds</span>
-</span><span id="__span-0-929"><a id="__codelineno-0-929" name="__codelineno-0-929"></a>    <span class="n">time_cols</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-930"><a id="__codelineno-0-930" name="__codelineno-0-930"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="s2">&quot;time&quot;</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span>
-</span><span id="__span-0-931"><a id="__codelineno-0-931" name="__codelineno-0-931"></a>    <span class="p">]</span><span class="o">.</span><span class="n">values</span>
-</span><span id="__span-0-932"><a id="__codelineno-0-932" name="__codelineno-0-932"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">time_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">time_cols</span><span class="p">]</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
-</span><span id="__span-0-933"><a id="__codelineno-0-933" name="__codelineno-0-933"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">x</span><span class="o">.</span><span class="n">total_seconds</span><span class="p">()</span> <span class="o">*</span> <span class="mf">1000.0</span>
-</span><span id="__span-0-934"><a id="__codelineno-0-934" name="__codelineno-0-934"></a>    <span class="p">)</span>
-</span><span id="__span-0-935"><a id="__codelineno-0-935" name="__codelineno-0-935"></a>
-</span><span id="__span-0-936"><a id="__codelineno-0-936" name="__codelineno-0-936"></a>    <span class="c1"># Write out prepared log and variables</span>
-</span><span id="__span-0-937"><a id="__codelineno-0-937" name="__codelineno-0-937"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_skip_writeout</span><span class="p">:</span>
-</span><span id="__span-0-938"><a id="__codelineno-0-938" name="__codelineno-0-938"></a>        <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span>
-</span><span id="__span-0-939"><a id="__codelineno-0-939" name="__codelineno-0-939"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">))</span>
-</span><span id="__span-0-940"><a id="__codelineno-0-940" name="__codelineno-0-940"></a>        <span class="p">)</span>
-</span><span id="__span-0-941"><a id="__codelineno-0-941" name="__codelineno-0-941"></a>        <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span>
-</span><span id="__span-0-942"><a id="__codelineno-0-942" name="__codelineno-0-942"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span>
-</span><span id="__span-0-943"><a id="__codelineno-0-943" name="__codelineno-0-943"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)),</span>
-</span><span id="__span-0-944"><a id="__codelineno-0-944" name="__codelineno-0-944"></a>        <span class="p">)</span>
-</span><span id="__span-0-945"><a id="__codelineno-0-945" name="__codelineno-0-945"></a>
-</span><span id="__span-0-946"><a id="__codelineno-0-946" name="__codelineno-0-946"></a>    <span class="nb">print</span><span class="p">(</span>
-</span><span id="__span-0-947"><a id="__codelineno-0-947" name="__codelineno-0-947"></a>        <span class="sa">f</span><span class="s2">&quot;&quot;&quot;Successfully prepared the log with causal unit </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="si">}</span><span class="s2"> &quot;&quot;&quot;</span>
-</span><span id="__span-0-948"><a id="__codelineno-0-948" name="__codelineno-0-948"></a>        <span class="sa">f</span><span class="s2">&quot;&quot;&quot;(tag: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">get_tag_of_parsed</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">)</span><span class="si">}</span><span class="s2">)&quot;&quot;&quot;</span>
-</span><span id="__span-0-949"><a id="__codelineno-0-949" name="__codelineno-0-949"></a>        <span class="o">+</span> <span class="p">(</span>
-</span><span id="__span-0-950"><a id="__codelineno-0-950" name="__codelineno-0-950"></a>            <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-951"><a id="__codelineno-0-951" name="__codelineno-0-951"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span>
-</span><span id="__span-0-952"><a id="__codelineno-0-952" name="__codelineno-0-952"></a>            <span class="k">else</span> <span class="sa">f</span><span class="s2">&quot; with </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span><span class="si">}</span><span class="s2"> causal units.&quot;</span>
-</span><span id="__span-0-953"><a id="__codelineno-0-953" name="__codelineno-0-953"></a>        <span class="p">)</span>
-</span><span id="__span-0-954"><a id="__codelineno-0-954" name="__codelineno-0-954"></a>    <span class="p">)</span>
-</span><span id="__span-0-955"><a id="__codelineno-0-955" name="__codelineno-0-955"></a>
-</span><span id="__span-0-956"><a id="__codelineno-0-956" name="__codelineno-0-956"></a>    <span class="k">return</span>
+</span><span id="__span-0-886"><a id="__codelineno-0-886" name="__codelineno-0-886"></a>    <span class="c1"># Perform the imputation</span>
+</span><span id="__span-0-887"><a id="__codelineno-0-887" name="__codelineno-0-887"></a>    <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="n">tqdm</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span><span class="p">,</span> <span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Imputing missing values...&quot;</span><span class="p">):</span>
+</span><span id="__span-0-888"><a id="__codelineno-0-888" name="__codelineno-0-888"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">col</span><span class="p">]</span><span class="o">.</span><span class="n">isnull</span><span class="p">()</span><span class="o">.</span><span class="n">values</span><span class="o">.</span><span class="n">any</span><span class="p">():</span>
+</span><span id="__span-0-889"><a id="__codelineno-0-889" name="__codelineno-0-889"></a>            <span class="n">base_var</span> <span class="o">=</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">col</span><span class="p">)</span><span class="o">.</span><span class="n">base_var</span><span class="p">()</span>
+</span><span id="__span-0-890"><a id="__codelineno-0-890" name="__codelineno-0-890"></a>            <span class="n">func_name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-891"><a id="__codelineno-0-891" name="__codelineno-0-891"></a>                <span class="n">custom_imp</span><span class="p">[</span><span class="n">base_var</span><span class="p">]</span> <span class="k">if</span> <span class="n">base_var</span> <span class="ow">in</span> <span class="n">custom_imp</span> <span class="k">else</span> <span class="s2">&quot;no_imp&quot;</span>
+</span><span id="__span-0-892"><a id="__codelineno-0-892" name="__codelineno-0-892"></a>            <span class="p">)</span>
+</span><span id="__span-0-893"><a id="__codelineno-0-893" name="__codelineno-0-893"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">col</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_imp_funcs</span><span class="p">[</span><span class="n">func_name</span><span class="p">])(</span>
+</span><span id="__span-0-894"><a id="__codelineno-0-894" name="__codelineno-0-894"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">col</span><span class="p">]</span>
+</span><span id="__span-0-895"><a id="__codelineno-0-895" name="__codelineno-0-895"></a>            <span class="p">)</span>
+</span><span id="__span-0-896"><a id="__codelineno-0-896" name="__codelineno-0-896"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">dropna</span><span class="p">(</span><span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-897"><a id="__codelineno-0-897" name="__codelineno-0-897"></a>
+</span><span id="__span-0-898"><a id="__codelineno-0-898" name="__codelineno-0-898"></a>    <span class="c1"># Drop variables that do not add information compared to other variables based on the same base variable</span>
+</span><span id="__span-0-899"><a id="__codelineno-0-899" name="__codelineno-0-899"></a>    <span class="c1"># but using a different aggregation function.</span>
+</span><span id="__span-0-900"><a id="__codelineno-0-900" name="__codelineno-0-900"></a>    <span class="k">if</span> <span class="n">drop_bad_aggs</span><span class="p">:</span>
+</span><span id="__span-0-901"><a id="__codelineno-0-901" name="__codelineno-0-901"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Dropping aggregates that do not add information...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-902"><a id="__codelineno-0-902" name="__codelineno-0-902"></a>        <span class="n">cols_to_drop</span> <span class="o">=</span> <span class="n">AggregateSelector</span><span class="o">.</span><span class="n">find_uninformative_aggregates</span><span class="p">(</span>
+</span><span id="__span-0-903"><a id="__codelineno-0-903" name="__codelineno-0-903"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span>
+</span><span id="__span-0-904"><a id="__codelineno-0-904" name="__codelineno-0-904"></a>        <span class="p">)</span>
+</span><span id="__span-0-905"><a id="__codelineno-0-905" name="__codelineno-0-905"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">columns</span><span class="o">=</span><span class="n">cols_to_drop</span><span class="p">,</span> <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-906"><a id="__codelineno-0-906" name="__codelineno-0-906"></a>
+</span><span id="__span-0-907"><a id="__codelineno-0-907" name="__codelineno-0-907"></a>    <span class="c1"># Identify the categorical variables and one-hot encode them</span>
+</span><span id="__span-0-908"><a id="__codelineno-0-908" name="__codelineno-0-908"></a>    <span class="n">categorical_vars</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">select_dtypes</span><span class="p">(</span>
+</span><span id="__span-0-909"><a id="__codelineno-0-909" name="__codelineno-0-909"></a>        <span class="n">include</span><span class="o">=</span><span class="s2">&quot;object&quot;</span>
+</span><span id="__span-0-910"><a id="__codelineno-0-910" name="__codelineno-0-910"></a>    <span class="p">)</span><span class="o">.</span><span class="n">columns</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
+</span><span id="__span-0-911"><a id="__codelineno-0-911" name="__codelineno-0-911"></a>    <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="n">tqdm</span><span class="p">(</span>
+</span><span id="__span-0-912"><a id="__codelineno-0-912" name="__codelineno-0-912"></a>        <span class="n">categorical_vars</span><span class="p">,</span> <span class="n">desc</span><span class="o">=</span><span class="s2">&quot;One-hot encoding categorical variables...&quot;</span>
+</span><span id="__span-0-913"><a id="__codelineno-0-913" name="__codelineno-0-913"></a>    <span class="p">):</span>
+</span><span id="__span-0-914"><a id="__codelineno-0-914" name="__codelineno-0-914"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">concat</span><span class="p">(</span>
+</span><span id="__span-0-915"><a id="__codelineno-0-915" name="__codelineno-0-915"></a>            <span class="p">[</span>
+</span><span id="__span-0-916"><a id="__codelineno-0-916" name="__codelineno-0-916"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span>
+</span><span id="__span-0-917"><a id="__codelineno-0-917" name="__codelineno-0-917"></a>                <span class="n">pd</span><span class="o">.</span><span class="n">get_dummies</span><span class="p">(</span>
+</span><span id="__span-0-918"><a id="__codelineno-0-918" name="__codelineno-0-918"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">col</span><span class="p">],</span> <span class="n">prefix</span><span class="o">=</span><span class="n">col</span><span class="p">,</span> <span class="n">prefix_sep</span><span class="o">=</span><span class="s2">&quot;=&quot;</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">float</span>
+</span><span id="__span-0-919"><a id="__codelineno-0-919" name="__codelineno-0-919"></a>                <span class="p">),</span>
+</span><span id="__span-0-920"><a id="__codelineno-0-920" name="__codelineno-0-920"></a>            <span class="p">],</span>
+</span><span id="__span-0-921"><a id="__codelineno-0-921" name="__codelineno-0-921"></a>            <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+</span><span id="__span-0-922"><a id="__codelineno-0-922" name="__codelineno-0-922"></a>        <span class="p">)</span>
+</span><span id="__span-0-923"><a id="__codelineno-0-923" name="__codelineno-0-923"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">col</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-924"><a id="__codelineno-0-924" name="__codelineno-0-924"></a>    <span class="c1"># Deal with https://github.com/pydot/pydot/issues/258</span>
+</span><span id="__span-0-925"><a id="__codelineno-0-925" name="__codelineno-0-925"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="__span-0-926"><a id="__codelineno-0-926" name="__codelineno-0-926"></a>        <span class="n">x</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s2">&quot;:&quot;</span><span class="p">,</span> <span class="s2">&quot;;&quot;</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span>
+</span><span id="__span-0-927"><a id="__codelineno-0-927" name="__codelineno-0-927"></a>    <span class="p">]</span>
+</span><span id="__span-0-928"><a id="__codelineno-0-928" name="__codelineno-0-928"></a>
+</span><span id="__span-0-929"><a id="__codelineno-0-929" name="__codelineno-0-929"></a>    <span class="c1"># Generate dataframe of prepared variables for later tagging etc.</span>
+</span><span id="__span-0-930"><a id="__codelineno-0-930" name="__codelineno-0-930"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_generate_prepared_variables_df</span><span class="p">()</span>
+</span><span id="__span-0-931"><a id="__codelineno-0-931" name="__codelineno-0-931"></a>
+</span><span id="__span-0-932"><a id="__codelineno-0-932" name="__codelineno-0-932"></a>    <span class="c1"># Convert any date columns to Unix timestamps in milliseconds</span>
+</span><span id="__span-0-933"><a id="__codelineno-0-933" name="__codelineno-0-933"></a>    <span class="n">date_cols</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-934"><a id="__codelineno-0-934" name="__codelineno-0-934"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="s2">&quot;date&quot;</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span>
+</span><span id="__span-0-935"><a id="__codelineno-0-935" name="__codelineno-0-935"></a>    <span class="p">]</span><span class="o">.</span><span class="n">values</span>
+</span><span id="__span-0-936"><a id="__codelineno-0-936" name="__codelineno-0-936"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">date_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">date_cols</span><span class="p">]</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
+</span><span id="__span-0-937"><a id="__codelineno-0-937" name="__codelineno-0-937"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">x</span><span class="o">.</span><span class="n">timestamp</span><span class="p">()</span> <span class="o">*</span> <span class="mf">1000.0</span>
+</span><span id="__span-0-938"><a id="__codelineno-0-938" name="__codelineno-0-938"></a>    <span class="p">)</span>
+</span><span id="__span-0-939"><a id="__codelineno-0-939" name="__codelineno-0-939"></a>
+</span><span id="__span-0-940"><a id="__codelineno-0-940" name="__codelineno-0-940"></a>    <span class="c1"># Convert any time columns to milliseconds</span>
+</span><span id="__span-0-941"><a id="__codelineno-0-941" name="__codelineno-0-941"></a>    <span class="n">time_cols</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-942"><a id="__codelineno-0-942" name="__codelineno-0-942"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="s2">&quot;time&quot;</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span>
+</span><span id="__span-0-943"><a id="__codelineno-0-943" name="__codelineno-0-943"></a>    <span class="p">]</span><span class="o">.</span><span class="n">values</span>
+</span><span id="__span-0-944"><a id="__codelineno-0-944" name="__codelineno-0-944"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">time_cols</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">time_cols</span><span class="p">]</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
+</span><span id="__span-0-945"><a id="__codelineno-0-945" name="__codelineno-0-945"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">x</span><span class="o">.</span><span class="n">total_seconds</span><span class="p">()</span> <span class="o">*</span> <span class="mf">1000.0</span>
+</span><span id="__span-0-946"><a id="__codelineno-0-946" name="__codelineno-0-946"></a>    <span class="p">)</span>
+</span><span id="__span-0-947"><a id="__codelineno-0-947" name="__codelineno-0-947"></a>
+</span><span id="__span-0-948"><a id="__codelineno-0-948" name="__codelineno-0-948"></a>    <span class="c1"># Write out prepared log and variables</span>
+</span><span id="__span-0-949"><a id="__codelineno-0-949" name="__codelineno-0-949"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_skip_writeout</span><span class="p">:</span>
+</span><span id="__span-0-950"><a id="__codelineno-0-950" name="__codelineno-0-950"></a>        <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span>
+</span><span id="__span-0-951"><a id="__codelineno-0-951" name="__codelineno-0-951"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">))</span>
+</span><span id="__span-0-952"><a id="__codelineno-0-952" name="__codelineno-0-952"></a>        <span class="p">)</span>
+</span><span id="__span-0-953"><a id="__codelineno-0-953" name="__codelineno-0-953"></a>        <span class="n">Pickler</span><span class="o">.</span><span class="n">dump</span><span class="p">(</span>
+</span><span id="__span-0-954"><a id="__codelineno-0-954" name="__codelineno-0-954"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span>
+</span><span id="__span-0-955"><a id="__codelineno-0-955" name="__codelineno-0-955"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_get_filename</span><span class="p">(</span><span class="n">nameof</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)),</span>
+</span><span id="__span-0-956"><a id="__codelineno-0-956" name="__codelineno-0-956"></a>        <span class="p">)</span>
+</span><span id="__span-0-957"><a id="__codelineno-0-957" name="__codelineno-0-957"></a>
+</span><span id="__span-0-958"><a id="__codelineno-0-958" name="__codelineno-0-958"></a>    <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span>
+</span><span id="__span-0-959"><a id="__codelineno-0-959" name="__codelineno-0-959"></a>        <span class="sa">f</span><span class="s2">&quot;&quot;&quot;Successfully prepared the log with causal unit </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="si">}</span><span class="s2"> &quot;&quot;&quot;</span>
+</span><span id="__span-0-960"><a id="__codelineno-0-960" name="__codelineno-0-960"></a>        <span class="sa">f</span><span class="s2">&quot;&quot;&quot;(tag: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">get_tag_of_parsed</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_causal_unit_var</span><span class="p">)</span><span class="si">}</span><span class="s2">)&quot;&quot;&quot;</span>
+</span><span id="__span-0-961"><a id="__codelineno-0-961" name="__codelineno-0-961"></a>        <span class="o">+</span> <span class="p">(</span>
+</span><span id="__span-0-962"><a id="__codelineno-0-962" name="__codelineno-0-962"></a>            <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-963"><a id="__codelineno-0-963" name="__codelineno-0-963"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span>
+</span><span id="__span-0-964"><a id="__codelineno-0-964" name="__codelineno-0-964"></a>            <span class="k">else</span> <span class="sa">f</span><span class="s2">&quot; with </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_num_causal_units</span><span class="si">}</span><span class="s2"> causal units.&quot;</span>
+</span><span id="__span-0-965"><a id="__codelineno-0-965" name="__codelineno-0-965"></a>        <span class="p">)</span>
+</span><span id="__span-0-966"><a id="__codelineno-0-966" name="__codelineno-0-966"></a>    <span class="p">)</span>
+</span><span id="__span-0-967"><a id="__codelineno-0-967" name="__codelineno-0-967"></a>
+</span><span id="__span-0-968"><a id="__codelineno-0-968" name="__codelineno-0-968"></a>    <span class="k">return</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -8478,19 +8591,7 @@ <h3 id="logos.logos.LOGos._generate_prepared_variables_df" class="doc doc-headin
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-958"> 958</a></span>
-<span class="normal"><a href="#__codelineno-0-959"> 959</a></span>
-<span class="normal"><a href="#__codelineno-0-960"> 960</a></span>
-<span class="normal"><a href="#__codelineno-0-961"> 961</a></span>
-<span class="normal"><a href="#__codelineno-0-962"> 962</a></span>
-<span class="normal"><a href="#__codelineno-0-963"> 963</a></span>
-<span class="normal"><a href="#__codelineno-0-964"> 964</a></span>
-<span class="normal"><a href="#__codelineno-0-965"> 965</a></span>
-<span class="normal"><a href="#__codelineno-0-966"> 966</a></span>
-<span class="normal"><a href="#__codelineno-0-967"> 967</a></span>
-<span class="normal"><a href="#__codelineno-0-968"> 968</a></span>
-<span class="normal"><a href="#__codelineno-0-969"> 969</a></span>
-<span class="normal"><a href="#__codelineno-0-970"> 970</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-970"> 970</a></span>
 <span class="normal"><a href="#__codelineno-0-971"> 971</a></span>
 <span class="normal"><a href="#__codelineno-0-972"> 972</a></span>
 <span class="normal"><a href="#__codelineno-0-973"> 973</a></span>
@@ -8566,95 +8667,107 @@ <h3 id="logos.logos.LOGos._generate_prepared_variables_df" class="doc doc-headin
 <span class="normal"><a href="#__codelineno-0-1043">1043</a></span>
 <span class="normal"><a href="#__codelineno-0-1044">1044</a></span>
 <span class="normal"><a href="#__codelineno-0-1045">1045</a></span>
-<span class="normal"><a href="#__codelineno-0-1046">1046</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-958"><a id="__codelineno-0-958" name="__codelineno-0-958"></a><span class="k">def</span> <span class="nf">_generate_prepared_variables_df</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-959"><a id="__codelineno-0-959" name="__codelineno-0-959"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-960"><a id="__codelineno-0-960" name="__codelineno-0-960"></a><span class="sd">    Generate dataframe of prepared variables for later tagging etc.</span>
-</span><span id="__span-0-961"><a id="__codelineno-0-961" name="__codelineno-0-961"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-962"><a id="__codelineno-0-962" name="__codelineno-0-962"></a>
-</span><span id="__span-0-963"><a id="__codelineno-0-963" name="__codelineno-0-963"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">()</span>
-</span><span id="__span-0-964"><a id="__codelineno-0-964" name="__codelineno-0-964"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span>
-</span><span id="__span-0-965"><a id="__codelineno-0-965" name="__codelineno-0-965"></a>
-</span><span id="__span-0-966"><a id="__codelineno-0-966" name="__codelineno-0-966"></a>    <span class="c1"># Bring in varable name components leveraging PreparedVariableName</span>
-</span><span id="__span-0-967"><a id="__codelineno-0-967" name="__codelineno-0-967"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Base&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
-</span><span id="__span-0-968"><a id="__codelineno-0-968" name="__codelineno-0-968"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">x</span><span class="p">)</span><span class="o">.</span><span class="n">base_var</span><span class="p">()</span>
-</span><span id="__span-0-969"><a id="__codelineno-0-969" name="__codelineno-0-969"></a>    <span class="p">)</span>
-</span><span id="__span-0-970"><a id="__codelineno-0-970" name="__codelineno-0-970"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Pre-agg Value&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span>
-</span><span id="__span-0-971"><a id="__codelineno-0-971" name="__codelineno-0-971"></a>        <span class="s2">&quot;Name&quot;</span>
-</span><span id="__span-0-972"><a id="__codelineno-0-972" name="__codelineno-0-972"></a>    <span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span><span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">x</span><span class="p">)</span><span class="o">.</span><span class="n">pre_agg_value</span><span class="p">())</span>
-</span><span id="__span-0-973"><a id="__codelineno-0-973" name="__codelineno-0-973"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Agg&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
-</span><span id="__span-0-974"><a id="__codelineno-0-974" name="__codelineno-0-974"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">x</span><span class="p">)</span><span class="o">.</span><span class="n">aggregate</span><span class="p">()</span>
-</span><span id="__span-0-975"><a id="__codelineno-0-975" name="__codelineno-0-975"></a>    <span class="p">)</span>
-</span><span id="__span-0-976"><a id="__codelineno-0-976" name="__codelineno-0-976"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Post-agg Value&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span>
-</span><span id="__span-0-977"><a id="__codelineno-0-977" name="__codelineno-0-977"></a>        <span class="s2">&quot;Name&quot;</span>
-</span><span id="__span-0-978"><a id="__codelineno-0-978" name="__codelineno-0-978"></a>    <span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span><span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">x</span><span class="p">)</span><span class="o">.</span><span class="n">post_agg_value</span><span class="p">())</span>
-</span><span id="__span-0-979"><a id="__codelineno-0-979" name="__codelineno-0-979"></a>
-</span><span id="__span-0-980"><a id="__codelineno-0-980" name="__codelineno-0-980"></a>    <span class="c1"># Bring in other info from self._parsed_variables</span>
-</span><span id="__span-0-981"><a id="__codelineno-0-981" name="__codelineno-0-981"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
-</span><span id="__span-0-982"><a id="__codelineno-0-982" name="__codelineno-0-982"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="__span-0-983"><a id="__codelineno-0-983" name="__codelineno-0-983"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-984"><a id="__codelineno-0-984" name="__codelineno-0-984"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Base&quot;</span><span class="p">],</span>
-</span><span id="__span-0-985"><a id="__codelineno-0-985" name="__codelineno-0-985"></a>                <span class="s2">&quot;Tag&quot;</span><span class="p">,</span>
-</span><span id="__span-0-986"><a id="__codelineno-0-986" name="__codelineno-0-986"></a>            <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-987"><a id="__codelineno-0-987" name="__codelineno-0-987"></a>            <span class="k">if</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Base&quot;</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;TemplateId&quot;</span>
-</span><span id="__span-0-988"><a id="__codelineno-0-988" name="__codelineno-0-988"></a>            <span class="k">else</span> <span class="s2">&quot;TemplateId&quot;</span>
-</span><span id="__span-0-989"><a id="__codelineno-0-989" name="__codelineno-0-989"></a>        <span class="p">)</span>
-</span><span id="__span-0-990"><a id="__codelineno-0-990" name="__codelineno-0-990"></a>        <span class="o">+</span> <span class="p">(</span><span class="sa">f</span><span class="s2">&quot; </span><span class="si">{</span><span class="n">x</span><span class="p">[</span><span class="s1">&#39;Pre-agg Value&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span> <span class="k">if</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Pre-agg Value&quot;</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;&quot;</span> <span class="k">else</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
-</span><span id="__span-0-991"><a id="__codelineno-0-991" name="__codelineno-0-991"></a>        <span class="o">+</span> <span class="p">(</span><span class="sa">f</span><span class="s2">&quot; </span><span class="si">{</span><span class="n">x</span><span class="p">[</span><span class="s1">&#39;Agg&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span> <span class="k">if</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Agg&quot;</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;&quot;</span> <span class="k">else</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
-</span><span id="__span-0-992"><a id="__codelineno-0-992" name="__codelineno-0-992"></a>        <span class="o">+</span> <span class="p">(</span><span class="sa">f</span><span class="s2">&quot; </span><span class="si">{</span><span class="n">x</span><span class="p">[</span><span class="s1">&#39;Post-agg Value&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span> <span class="k">if</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Post-agg Value&quot;</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;&quot;</span> <span class="k">else</span> <span class="s2">&quot;&quot;</span><span class="p">),</span>
-</span><span id="__span-0-993"><a id="__codelineno-0-993" name="__codelineno-0-993"></a>        <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-</span><span id="__span-0-994"><a id="__codelineno-0-994" name="__codelineno-0-994"></a>    <span class="p">)</span>
-</span><span id="__span-0-995"><a id="__codelineno-0-995" name="__codelineno-0-995"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Base Variable Occurences&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span>
-</span><span id="__span-0-996"><a id="__codelineno-0-996" name="__codelineno-0-996"></a>        <span class="s2">&quot;Base&quot;</span>
-</span><span id="__span-0-997"><a id="__codelineno-0-997" name="__codelineno-0-997"></a>    <span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
-</span><span id="__span-0-998"><a id="__codelineno-0-998" name="__codelineno-0-998"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="__span-0-999"><a id="__codelineno-0-999" name="__codelineno-0-999"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-1000"><a id="__codelineno-0-1000" name="__codelineno-0-1000"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">x</span><span class="p">,</span> <span class="s2">&quot;Occurrences&quot;</span>
-</span><span id="__span-0-1001"><a id="__codelineno-0-1001" name="__codelineno-0-1001"></a>            <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-1002"><a id="__codelineno-0-1002" name="__codelineno-0-1002"></a>            <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="s2">&quot;TemplateId&quot;</span>
-</span><span id="__span-0-1003"><a id="__codelineno-0-1003" name="__codelineno-0-1003"></a>            <span class="k">else</span> <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-1004"><a id="__codelineno-0-1004" name="__codelineno-0-1004"></a>        <span class="p">)</span>
-</span><span id="__span-0-1005"><a id="__codelineno-0-1005" name="__codelineno-0-1005"></a>    <span class="p">)</span>
-</span><span id="__span-0-1006"><a id="__codelineno-0-1006" name="__codelineno-0-1006"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Base&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
-</span><span id="__span-0-1007"><a id="__codelineno-0-1007" name="__codelineno-0-1007"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="__span-0-1008"><a id="__codelineno-0-1008" name="__codelineno-0-1008"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-1009"><a id="__codelineno-0-1009" name="__codelineno-0-1009"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">x</span><span class="p">,</span> <span class="s2">&quot;Type&quot;</span>
-</span><span id="__span-0-1010"><a id="__codelineno-0-1010" name="__codelineno-0-1010"></a>            <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-1011"><a id="__codelineno-0-1011" name="__codelineno-0-1011"></a>            <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="s2">&quot;TemplateId&quot;</span>
-</span><span id="__span-0-1012"><a id="__codelineno-0-1012" name="__codelineno-0-1012"></a>            <span class="k">else</span> <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-1013"><a id="__codelineno-0-1013" name="__codelineno-0-1013"></a>        <span class="p">)</span>
-</span><span id="__span-0-1014"><a id="__codelineno-0-1014" name="__codelineno-0-1014"></a>    <span class="p">)</span>
-</span><span id="__span-0-1015"><a id="__codelineno-0-1015" name="__codelineno-0-1015"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Examples&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Base&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
-</span><span id="__span-0-1016"><a id="__codelineno-0-1016" name="__codelineno-0-1016"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="__span-0-1017"><a id="__codelineno-0-1017" name="__codelineno-0-1017"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-1018"><a id="__codelineno-0-1018" name="__codelineno-0-1018"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">x</span><span class="p">,</span> <span class="s2">&quot;Examples&quot;</span>
-</span><span id="__span-0-1019"><a id="__codelineno-0-1019" name="__codelineno-0-1019"></a>            <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-1020"><a id="__codelineno-0-1020" name="__codelineno-0-1020"></a>            <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="s2">&quot;TemplateId&quot;</span>
-</span><span id="__span-0-1021"><a id="__codelineno-0-1021" name="__codelineno-0-1021"></a>            <span class="k">else</span> <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-1022"><a id="__codelineno-0-1022" name="__codelineno-0-1022"></a>        <span class="p">)</span>
-</span><span id="__span-0-1023"><a id="__codelineno-0-1023" name="__codelineno-0-1023"></a>    <span class="p">)</span>
-</span><span id="__span-0-1024"><a id="__codelineno-0-1024" name="__codelineno-0-1024"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Base&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
-</span><span id="__span-0-1025"><a id="__codelineno-0-1025" name="__codelineno-0-1025"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="__span-0-1026"><a id="__codelineno-0-1026" name="__codelineno-0-1026"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-1027"><a id="__codelineno-0-1027" name="__codelineno-0-1027"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">x</span><span class="p">,</span> <span class="s2">&quot;From regex&quot;</span>
-</span><span id="__span-0-1028"><a id="__codelineno-0-1028" name="__codelineno-0-1028"></a>            <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-1029"><a id="__codelineno-0-1029" name="__codelineno-0-1029"></a>            <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="s2">&quot;TemplateId&quot;</span>
-</span><span id="__span-0-1030"><a id="__codelineno-0-1030" name="__codelineno-0-1030"></a>            <span class="k">else</span> <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-1031"><a id="__codelineno-0-1031" name="__codelineno-0-1031"></a>        <span class="p">)</span>
-</span><span id="__span-0-1032"><a id="__codelineno-0-1032" name="__codelineno-0-1032"></a>    <span class="p">)</span>
-</span><span id="__span-0-1033"><a id="__codelineno-0-1033" name="__codelineno-0-1033"></a>
-</span><span id="__span-0-1034"><a id="__codelineno-0-1034" name="__codelineno-0-1034"></a>    <span class="c1"># Bring in template text, only for appropriate base variables.</span>
-</span><span id="__span-0-1035"><a id="__codelineno-0-1035" name="__codelineno-0-1035"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
-</span><span id="__span-0-1036"><a id="__codelineno-0-1036" name="__codelineno-0-1036"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="__span-0-1037"><a id="__codelineno-0-1037" name="__codelineno-0-1037"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-1038"><a id="__codelineno-0-1038" name="__codelineno-0-1038"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span>
-</span><span id="__span-0-1039"><a id="__codelineno-0-1039" name="__codelineno-0-1039"></a>                <span class="o">==</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">x</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">])</span><span class="o">.</span><span class="n">template_id</span><span class="p">(),</span>
-</span><span id="__span-0-1040"><a id="__codelineno-0-1040" name="__codelineno-0-1040"></a>                <span class="s2">&quot;TemplateText&quot;</span><span class="p">,</span>
-</span><span id="__span-0-1041"><a id="__codelineno-0-1041" name="__codelineno-0-1041"></a>            <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-1042"><a id="__codelineno-0-1042" name="__codelineno-0-1042"></a>            <span class="k">if</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="kc">False</span>
-</span><span id="__span-0-1043"><a id="__codelineno-0-1043" name="__codelineno-0-1043"></a>            <span class="k">else</span> <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-1044"><a id="__codelineno-0-1044" name="__codelineno-0-1044"></a>        <span class="p">),</span>
-</span><span id="__span-0-1045"><a id="__codelineno-0-1045" name="__codelineno-0-1045"></a>        <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-</span><span id="__span-0-1046"><a id="__codelineno-0-1046" name="__codelineno-0-1046"></a>    <span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-1046">1046</a></span>
+<span class="normal"><a href="#__codelineno-0-1047">1047</a></span>
+<span class="normal"><a href="#__codelineno-0-1048">1048</a></span>
+<span class="normal"><a href="#__codelineno-0-1049">1049</a></span>
+<span class="normal"><a href="#__codelineno-0-1050">1050</a></span>
+<span class="normal"><a href="#__codelineno-0-1051">1051</a></span>
+<span class="normal"><a href="#__codelineno-0-1052">1052</a></span>
+<span class="normal"><a href="#__codelineno-0-1053">1053</a></span>
+<span class="normal"><a href="#__codelineno-0-1054">1054</a></span>
+<span class="normal"><a href="#__codelineno-0-1055">1055</a></span>
+<span class="normal"><a href="#__codelineno-0-1056">1056</a></span>
+<span class="normal"><a href="#__codelineno-0-1057">1057</a></span>
+<span class="normal"><a href="#__codelineno-0-1058">1058</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-970"><a id="__codelineno-0-970" name="__codelineno-0-970"></a><span class="k">def</span> <span class="nf">_generate_prepared_variables_df</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-971"><a id="__codelineno-0-971" name="__codelineno-0-971"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-972"><a id="__codelineno-0-972" name="__codelineno-0-972"></a><span class="sd">    Generate dataframe of prepared variables for later tagging etc.</span>
+</span><span id="__span-0-973"><a id="__codelineno-0-973" name="__codelineno-0-973"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-974"><a id="__codelineno-0-974" name="__codelineno-0-974"></a>
+</span><span id="__span-0-975"><a id="__codelineno-0-975" name="__codelineno-0-975"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">()</span>
+</span><span id="__span-0-976"><a id="__codelineno-0-976" name="__codelineno-0-976"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span>
+</span><span id="__span-0-977"><a id="__codelineno-0-977" name="__codelineno-0-977"></a>
+</span><span id="__span-0-978"><a id="__codelineno-0-978" name="__codelineno-0-978"></a>    <span class="c1"># Bring in varable name components leveraging PreparedVariableName</span>
+</span><span id="__span-0-979"><a id="__codelineno-0-979" name="__codelineno-0-979"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Base&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
+</span><span id="__span-0-980"><a id="__codelineno-0-980" name="__codelineno-0-980"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">x</span><span class="p">)</span><span class="o">.</span><span class="n">base_var</span><span class="p">()</span>
+</span><span id="__span-0-981"><a id="__codelineno-0-981" name="__codelineno-0-981"></a>    <span class="p">)</span>
+</span><span id="__span-0-982"><a id="__codelineno-0-982" name="__codelineno-0-982"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Pre-agg Value&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span>
+</span><span id="__span-0-983"><a id="__codelineno-0-983" name="__codelineno-0-983"></a>        <span class="s2">&quot;Name&quot;</span>
+</span><span id="__span-0-984"><a id="__codelineno-0-984" name="__codelineno-0-984"></a>    <span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span><span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">x</span><span class="p">)</span><span class="o">.</span><span class="n">pre_agg_value</span><span class="p">())</span>
+</span><span id="__span-0-985"><a id="__codelineno-0-985" name="__codelineno-0-985"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Agg&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
+</span><span id="__span-0-986"><a id="__codelineno-0-986" name="__codelineno-0-986"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">x</span><span class="p">)</span><span class="o">.</span><span class="n">aggregate</span><span class="p">()</span>
+</span><span id="__span-0-987"><a id="__codelineno-0-987" name="__codelineno-0-987"></a>    <span class="p">)</span>
+</span><span id="__span-0-988"><a id="__codelineno-0-988" name="__codelineno-0-988"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Post-agg Value&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span>
+</span><span id="__span-0-989"><a id="__codelineno-0-989" name="__codelineno-0-989"></a>        <span class="s2">&quot;Name&quot;</span>
+</span><span id="__span-0-990"><a id="__codelineno-0-990" name="__codelineno-0-990"></a>    <span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span><span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">x</span><span class="p">)</span><span class="o">.</span><span class="n">post_agg_value</span><span class="p">())</span>
+</span><span id="__span-0-991"><a id="__codelineno-0-991" name="__codelineno-0-991"></a>
+</span><span id="__span-0-992"><a id="__codelineno-0-992" name="__codelineno-0-992"></a>    <span class="c1"># Bring in other info from self._parsed_variables</span>
+</span><span id="__span-0-993"><a id="__codelineno-0-993" name="__codelineno-0-993"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
+</span><span id="__span-0-994"><a id="__codelineno-0-994" name="__codelineno-0-994"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="__span-0-995"><a id="__codelineno-0-995" name="__codelineno-0-995"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-996"><a id="__codelineno-0-996" name="__codelineno-0-996"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Base&quot;</span><span class="p">],</span>
+</span><span id="__span-0-997"><a id="__codelineno-0-997" name="__codelineno-0-997"></a>                <span class="s2">&quot;Tag&quot;</span><span class="p">,</span>
+</span><span id="__span-0-998"><a id="__codelineno-0-998" name="__codelineno-0-998"></a>            <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-999"><a id="__codelineno-0-999" name="__codelineno-0-999"></a>            <span class="k">if</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Base&quot;</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;TemplateId&quot;</span>
+</span><span id="__span-0-1000"><a id="__codelineno-0-1000" name="__codelineno-0-1000"></a>            <span class="k">else</span> <span class="s2">&quot;TemplateId&quot;</span>
+</span><span id="__span-0-1001"><a id="__codelineno-0-1001" name="__codelineno-0-1001"></a>        <span class="p">)</span>
+</span><span id="__span-0-1002"><a id="__codelineno-0-1002" name="__codelineno-0-1002"></a>        <span class="o">+</span> <span class="p">(</span><span class="sa">f</span><span class="s2">&quot; </span><span class="si">{</span><span class="n">x</span><span class="p">[</span><span class="s1">&#39;Pre-agg Value&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span> <span class="k">if</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Pre-agg Value&quot;</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;&quot;</span> <span class="k">else</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1003"><a id="__codelineno-0-1003" name="__codelineno-0-1003"></a>        <span class="o">+</span> <span class="p">(</span><span class="sa">f</span><span class="s2">&quot; </span><span class="si">{</span><span class="n">x</span><span class="p">[</span><span class="s1">&#39;Agg&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span> <span class="k">if</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Agg&quot;</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;&quot;</span> <span class="k">else</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1004"><a id="__codelineno-0-1004" name="__codelineno-0-1004"></a>        <span class="o">+</span> <span class="p">(</span><span class="sa">f</span><span class="s2">&quot; </span><span class="si">{</span><span class="n">x</span><span class="p">[</span><span class="s1">&#39;Post-agg Value&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span> <span class="k">if</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;Post-agg Value&quot;</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;&quot;</span> <span class="k">else</span> <span class="s2">&quot;&quot;</span><span class="p">),</span>
+</span><span id="__span-0-1005"><a id="__codelineno-0-1005" name="__codelineno-0-1005"></a>        <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+</span><span id="__span-0-1006"><a id="__codelineno-0-1006" name="__codelineno-0-1006"></a>    <span class="p">)</span>
+</span><span id="__span-0-1007"><a id="__codelineno-0-1007" name="__codelineno-0-1007"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Base Variable Occurences&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span>
+</span><span id="__span-0-1008"><a id="__codelineno-0-1008" name="__codelineno-0-1008"></a>        <span class="s2">&quot;Base&quot;</span>
+</span><span id="__span-0-1009"><a id="__codelineno-0-1009" name="__codelineno-0-1009"></a>    <span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
+</span><span id="__span-0-1010"><a id="__codelineno-0-1010" name="__codelineno-0-1010"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="__span-0-1011"><a id="__codelineno-0-1011" name="__codelineno-0-1011"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-1012"><a id="__codelineno-0-1012" name="__codelineno-0-1012"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">x</span><span class="p">,</span> <span class="s2">&quot;Occurrences&quot;</span>
+</span><span id="__span-0-1013"><a id="__codelineno-0-1013" name="__codelineno-0-1013"></a>            <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-1014"><a id="__codelineno-0-1014" name="__codelineno-0-1014"></a>            <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="s2">&quot;TemplateId&quot;</span>
+</span><span id="__span-0-1015"><a id="__codelineno-0-1015" name="__codelineno-0-1015"></a>            <span class="k">else</span> <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-1016"><a id="__codelineno-0-1016" name="__codelineno-0-1016"></a>        <span class="p">)</span>
+</span><span id="__span-0-1017"><a id="__codelineno-0-1017" name="__codelineno-0-1017"></a>    <span class="p">)</span>
+</span><span id="__span-0-1018"><a id="__codelineno-0-1018" name="__codelineno-0-1018"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Type&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Base&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
+</span><span id="__span-0-1019"><a id="__codelineno-0-1019" name="__codelineno-0-1019"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="__span-0-1020"><a id="__codelineno-0-1020" name="__codelineno-0-1020"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-1021"><a id="__codelineno-0-1021" name="__codelineno-0-1021"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">x</span><span class="p">,</span> <span class="s2">&quot;Type&quot;</span>
+</span><span id="__span-0-1022"><a id="__codelineno-0-1022" name="__codelineno-0-1022"></a>            <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-1023"><a id="__codelineno-0-1023" name="__codelineno-0-1023"></a>            <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="s2">&quot;TemplateId&quot;</span>
+</span><span id="__span-0-1024"><a id="__codelineno-0-1024" name="__codelineno-0-1024"></a>            <span class="k">else</span> <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-1025"><a id="__codelineno-0-1025" name="__codelineno-0-1025"></a>        <span class="p">)</span>
+</span><span id="__span-0-1026"><a id="__codelineno-0-1026" name="__codelineno-0-1026"></a>    <span class="p">)</span>
+</span><span id="__span-0-1027"><a id="__codelineno-0-1027" name="__codelineno-0-1027"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Examples&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Base&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
+</span><span id="__span-0-1028"><a id="__codelineno-0-1028" name="__codelineno-0-1028"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="__span-0-1029"><a id="__codelineno-0-1029" name="__codelineno-0-1029"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-1030"><a id="__codelineno-0-1030" name="__codelineno-0-1030"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">x</span><span class="p">,</span> <span class="s2">&quot;Examples&quot;</span>
+</span><span id="__span-0-1031"><a id="__codelineno-0-1031" name="__codelineno-0-1031"></a>            <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-1032"><a id="__codelineno-0-1032" name="__codelineno-0-1032"></a>            <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="s2">&quot;TemplateId&quot;</span>
+</span><span id="__span-0-1033"><a id="__codelineno-0-1033" name="__codelineno-0-1033"></a>            <span class="k">else</span> <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-1034"><a id="__codelineno-0-1034" name="__codelineno-0-1034"></a>        <span class="p">)</span>
+</span><span id="__span-0-1035"><a id="__codelineno-0-1035" name="__codelineno-0-1035"></a>    <span class="p">)</span>
+</span><span id="__span-0-1036"><a id="__codelineno-0-1036" name="__codelineno-0-1036"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;Base&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
+</span><span id="__span-0-1037"><a id="__codelineno-0-1037" name="__codelineno-0-1037"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="__span-0-1038"><a id="__codelineno-0-1038" name="__codelineno-0-1038"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-1039"><a id="__codelineno-0-1039" name="__codelineno-0-1039"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">x</span><span class="p">,</span> <span class="s2">&quot;From regex&quot;</span>
+</span><span id="__span-0-1040"><a id="__codelineno-0-1040" name="__codelineno-0-1040"></a>            <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-1041"><a id="__codelineno-0-1041" name="__codelineno-0-1041"></a>            <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="s2">&quot;TemplateId&quot;</span>
+</span><span id="__span-0-1042"><a id="__codelineno-0-1042" name="__codelineno-0-1042"></a>            <span class="k">else</span> <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-1043"><a id="__codelineno-0-1043" name="__codelineno-0-1043"></a>        <span class="p">)</span>
+</span><span id="__span-0-1044"><a id="__codelineno-0-1044" name="__codelineno-0-1044"></a>    <span class="p">)</span>
+</span><span id="__span-0-1045"><a id="__codelineno-0-1045" name="__codelineno-0-1045"></a>
+</span><span id="__span-0-1046"><a id="__codelineno-0-1046" name="__codelineno-0-1046"></a>    <span class="c1"># Bring in template text, only for appropriate base variables.</span>
+</span><span id="__span-0-1047"><a id="__codelineno-0-1047" name="__codelineno-0-1047"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">[</span><span class="s2">&quot;TemplateText&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
+</span><span id="__span-0-1048"><a id="__codelineno-0-1048" name="__codelineno-0-1048"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="__span-0-1049"><a id="__codelineno-0-1049" name="__codelineno-0-1049"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-1050"><a id="__codelineno-0-1050" name="__codelineno-0-1050"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span>
+</span><span id="__span-0-1051"><a id="__codelineno-0-1051" name="__codelineno-0-1051"></a>                <span class="o">==</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">x</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">])</span><span class="o">.</span><span class="n">template_id</span><span class="p">(),</span>
+</span><span id="__span-0-1052"><a id="__codelineno-0-1052" name="__codelineno-0-1052"></a>                <span class="s2">&quot;TemplateText&quot;</span><span class="p">,</span>
+</span><span id="__span-0-1053"><a id="__codelineno-0-1053" name="__codelineno-0-1053"></a>            <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-1054"><a id="__codelineno-0-1054" name="__codelineno-0-1054"></a>            <span class="k">if</span> <span class="n">x</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="kc">False</span>
+</span><span id="__span-0-1055"><a id="__codelineno-0-1055" name="__codelineno-0-1055"></a>            <span class="k">else</span> <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-1056"><a id="__codelineno-0-1056" name="__codelineno-0-1056"></a>        <span class="p">),</span>
+</span><span id="__span-0-1057"><a id="__codelineno-0-1057" name="__codelineno-0-1057"></a>        <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+</span><span id="__span-0-1058"><a id="__codelineno-0-1058" name="__codelineno-0-1058"></a>    <span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -8761,19 +8874,7 @@ <h3 id="logos.logos.LOGos.inspect" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1048">1048</a></span>
-<span class="normal"><a href="#__codelineno-0-1049">1049</a></span>
-<span class="normal"><a href="#__codelineno-0-1050">1050</a></span>
-<span class="normal"><a href="#__codelineno-0-1051">1051</a></span>
-<span class="normal"><a href="#__codelineno-0-1052">1052</a></span>
-<span class="normal"><a href="#__codelineno-0-1053">1053</a></span>
-<span class="normal"><a href="#__codelineno-0-1054">1054</a></span>
-<span class="normal"><a href="#__codelineno-0-1055">1055</a></span>
-<span class="normal"><a href="#__codelineno-0-1056">1056</a></span>
-<span class="normal"><a href="#__codelineno-0-1057">1057</a></span>
-<span class="normal"><a href="#__codelineno-0-1058">1058</a></span>
-<span class="normal"><a href="#__codelineno-0-1059">1059</a></span>
-<span class="normal"><a href="#__codelineno-0-1060">1060</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1060">1060</a></span>
 <span class="normal"><a href="#__codelineno-0-1061">1061</a></span>
 <span class="normal"><a href="#__codelineno-0-1062">1062</a></span>
 <span class="normal"><a href="#__codelineno-0-1063">1063</a></span>
@@ -8820,66 +8921,78 @@ <h3 id="logos.logos.LOGos.inspect" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-1104">1104</a></span>
 <span class="normal"><a href="#__codelineno-0-1105">1105</a></span>
 <span class="normal"><a href="#__codelineno-0-1106">1106</a></span>
-<span class="normal"><a href="#__codelineno-0-1107">1107</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1048"><a id="__codelineno-0-1048" name="__codelineno-0-1048"></a><span class="k">def</span> <span class="nf">inspect</span><span class="p">(</span>
-</span><span id="__span-0-1049"><a id="__codelineno-0-1049" name="__codelineno-0-1049"></a>    <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-1050"><a id="__codelineno-0-1050" name="__codelineno-0-1050"></a>    <span class="n">var</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="__span-0-1051"><a id="__codelineno-0-1051" name="__codelineno-0-1051"></a>    <span class="n">ref_var</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-1052"><a id="__codelineno-0-1052" name="__codelineno-0-1052"></a>    <span class="n">row_limit</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">=</span> <span class="mi">10</span><span class="p">,</span>
-</span><span id="__span-0-1053"><a id="__codelineno-0-1053" name="__codelineno-0-1053"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">]:</span>
-</span><span id="__span-0-1054"><a id="__codelineno-0-1054" name="__codelineno-0-1054"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1055"><a id="__codelineno-0-1055" name="__codelineno-0-1055"></a><span class="sd">    Print information about a specific prepared variable.</span>
-</span><span id="__span-0-1056"><a id="__codelineno-0-1056" name="__codelineno-0-1056"></a>
-</span><span id="__span-0-1057"><a id="__codelineno-0-1057" name="__codelineno-0-1057"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-1058"><a id="__codelineno-0-1058" name="__codelineno-0-1058"></a><span class="sd">        var: The name or tag of the variable.</span>
-</span><span id="__span-0-1059"><a id="__codelineno-0-1059" name="__codelineno-0-1059"></a><span class="sd">        ref_var: The name or tag of a reference variable.</span>
-</span><span id="__span-0-1060"><a id="__codelineno-0-1060" name="__codelineno-0-1060"></a><span class="sd">        row_limit: The number of rows of the prepared log to print out,</span>
-</span><span id="__span-0-1061"><a id="__codelineno-0-1061" name="__codelineno-0-1061"></a><span class="sd">            to illustrate example values of this variable.</span>
-</span><span id="__span-0-1062"><a id="__codelineno-0-1062" name="__codelineno-0-1062"></a>
-</span><span id="__span-0-1063"><a id="__codelineno-0-1063" name="__codelineno-0-1063"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-1064"><a id="__codelineno-0-1064" name="__codelineno-0-1064"></a><span class="sd">        A tuple containing:</span>
-</span><span id="__span-0-1065"><a id="__codelineno-0-1065" name="__codelineno-0-1065"></a><span class="sd">            (1) Information about the base variable of `var`, if `var` is not related to the</span>
-</span><span id="__span-0-1066"><a id="__codelineno-0-1066" name="__codelineno-0-1066"></a><span class="sd">                occurrence count of a template.</span>
-</span><span id="__span-0-1067"><a id="__codelineno-0-1067" name="__codelineno-0-1067"></a><span class="sd">            (2) Information about the template of `var`, if `var` was not created from a regex.</span>
-</span><span id="__span-0-1068"><a id="__codelineno-0-1068" name="__codelineno-0-1068"></a><span class="sd">            (3) A sample of the prepared log, with `row_limit` rows.</span>
-</span><span id="__span-0-1069"><a id="__codelineno-0-1069" name="__codelineno-0-1069"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1070"><a id="__codelineno-0-1070" name="__codelineno-0-1070"></a>
-</span><span id="__span-0-1071"><a id="__codelineno-0-1071" name="__codelineno-0-1071"></a>    <span class="c1"># Retrieve the name of this variable, if a tag was passed in.</span>
-</span><span id="__span-0-1072"><a id="__codelineno-0-1072" name="__codelineno-0-1072"></a>    <span class="n">name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">var</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1073"><a id="__codelineno-0-1073" name="__codelineno-0-1073"></a>
-</span><span id="__span-0-1074"><a id="__codelineno-0-1074" name="__codelineno-0-1074"></a>    <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Information about prepared variable </span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2">:</span><span class="se">\n</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1075"><a id="__codelineno-0-1075" name="__codelineno-0-1075"></a>    <span class="n">base_var</span> <span class="o">=</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">name</span><span class="p">)</span><span class="o">.</span><span class="n">base_var</span><span class="p">()</span>
-</span><span id="__span-0-1076"><a id="__codelineno-0-1076" name="__codelineno-0-1076"></a>    <span class="n">from_regex</span> <span class="o">=</span> <span class="kc">False</span>
-</span><span id="__span-0-1077"><a id="__codelineno-0-1077" name="__codelineno-0-1077"></a>
-</span><span id="__span-0-1078"><a id="__codelineno-0-1078" name="__codelineno-0-1078"></a>    <span class="n">base_var_info_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">()</span>
-</span><span id="__span-0-1079"><a id="__codelineno-0-1079" name="__codelineno-0-1079"></a>    <span class="k">if</span> <span class="n">base_var</span> <span class="o">!=</span> <span class="s2">&quot;TemplateId&quot;</span><span class="p">:</span>
-</span><span id="__span-0-1080"><a id="__codelineno-0-1080" name="__codelineno-0-1080"></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;--&gt; Variable Information about </span><span class="si">{</span><span class="n">base_var</span><span class="si">}</span><span class="s2">:&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1081"><a id="__codelineno-0-1081" name="__codelineno-0-1081"></a>        <span class="n">base_var_info_df</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span>
-</span><span id="__span-0-1082"><a id="__codelineno-0-1082" name="__codelineno-0-1082"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">base_var</span>
-</span><span id="__span-0-1083"><a id="__codelineno-0-1083" name="__codelineno-0-1083"></a>        <span class="p">]</span>
-</span><span id="__span-0-1084"><a id="__codelineno-0-1084" name="__codelineno-0-1084"></a>        <span class="n">from_regex</span> <span class="o">=</span> <span class="n">base_var_info_df</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-1085"><a id="__codelineno-0-1085" name="__codelineno-0-1085"></a>        <span class="n">display</span><span class="p">(</span><span class="n">base_var_info_df</span><span class="p">)</span>
-</span><span id="__span-0-1086"><a id="__codelineno-0-1086" name="__codelineno-0-1086"></a>
-</span><span id="__span-0-1087"><a id="__codelineno-0-1087" name="__codelineno-0-1087"></a>    <span class="n">template_info_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">()</span>
-</span><span id="__span-0-1088"><a id="__codelineno-0-1088" name="__codelineno-0-1088"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">from_regex</span><span class="p">:</span>
-</span><span id="__span-0-1089"><a id="__codelineno-0-1089" name="__codelineno-0-1089"></a>        <span class="n">template_id</span> <span class="o">=</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">name</span><span class="p">)</span><span class="o">.</span><span class="n">template_id</span><span class="p">()</span>
-</span><span id="__span-0-1090"><a id="__codelineno-0-1090" name="__codelineno-0-1090"></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;--&gt; Template Information about </span><span class="si">{</span><span class="n">template_id</span><span class="si">}</span><span class="s2">:&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1091"><a id="__codelineno-0-1091" name="__codelineno-0-1091"></a>        <span class="n">template_info_df</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span>
-</span><span id="__span-0-1092"><a id="__codelineno-0-1092" name="__codelineno-0-1092"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">template_id</span>
-</span><span id="__span-0-1093"><a id="__codelineno-0-1093" name="__codelineno-0-1093"></a>        <span class="p">]</span>
-</span><span id="__span-0-1094"><a id="__codelineno-0-1094" name="__codelineno-0-1094"></a>        <span class="n">display</span><span class="p">(</span><span class="n">template_info_df</span><span class="p">)</span>
-</span><span id="__span-0-1095"><a id="__codelineno-0-1095" name="__codelineno-0-1095"></a>
-</span><span id="__span-0-1096"><a id="__codelineno-0-1096" name="__codelineno-0-1096"></a>    <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;--&gt; Causal Unit Partial Information:&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1097"><a id="__codelineno-0-1097" name="__codelineno-0-1097"></a>    <span class="k">if</span> <span class="n">row_limit</span> <span class="o">==</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-1098"><a id="__codelineno-0-1098" name="__codelineno-0-1098"></a>        <span class="n">row_limit</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">)</span>
-</span><span id="__span-0-1099"><a id="__codelineno-0-1099" name="__codelineno-0-1099"></a>    <span class="n">col_list</span> <span class="o">=</span> <span class="p">[</span><span class="n">name</span><span class="p">]</span>
-</span><span id="__span-0-1100"><a id="__codelineno-0-1100" name="__codelineno-0-1100"></a>    <span class="n">col_list</span><span class="o">.</span><span class="n">extend</span><span class="p">([</span><span class="n">ref_var</span><span class="p">]</span> <span class="k">if</span> <span class="n">ref_var</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="k">else</span> <span class="p">[])</span>
-</span><span id="__span-0-1101"><a id="__codelineno-0-1101" name="__codelineno-0-1101"></a>    <span class="n">prepared_log_info_df</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">col_list</span><span class="p">]</span><span class="o">.</span><span class="n">head</span><span class="p">(</span><span class="n">row_limit</span><span class="p">)</span>
-</span><span id="__span-0-1102"><a id="__codelineno-0-1102" name="__codelineno-0-1102"></a>    <span class="n">col_names</span> <span class="o">=</span> <span class="p">[</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> (candidate)&quot;</span><span class="p">]</span>
-</span><span id="__span-0-1103"><a id="__codelineno-0-1103" name="__codelineno-0-1103"></a>    <span class="n">col_names</span><span class="o">.</span><span class="n">extend</span><span class="p">([</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">ref_var</span><span class="si">}</span><span class="s2"> (outcome)&quot;</span><span class="p">]</span> <span class="k">if</span> <span class="n">ref_var</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="k">else</span> <span class="p">[])</span>
-</span><span id="__span-0-1104"><a id="__codelineno-0-1104" name="__codelineno-0-1104"></a>    <span class="n">prepared_log_info_df</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="n">col_names</span>
-</span><span id="__span-0-1105"><a id="__codelineno-0-1105" name="__codelineno-0-1105"></a>    <span class="n">display</span><span class="p">(</span><span class="n">prepared_log_info_df</span><span class="p">)</span>
-</span><span id="__span-0-1106"><a id="__codelineno-0-1106" name="__codelineno-0-1106"></a>
-</span><span id="__span-0-1107"><a id="__codelineno-0-1107" name="__codelineno-0-1107"></a>    <span class="k">return</span> <span class="n">base_var_info_df</span><span class="p">,</span> <span class="n">template_info_df</span><span class="p">,</span> <span class="n">prepared_log_info_df</span>
+<span class="normal"><a href="#__codelineno-0-1107">1107</a></span>
+<span class="normal"><a href="#__codelineno-0-1108">1108</a></span>
+<span class="normal"><a href="#__codelineno-0-1109">1109</a></span>
+<span class="normal"><a href="#__codelineno-0-1110">1110</a></span>
+<span class="normal"><a href="#__codelineno-0-1111">1111</a></span>
+<span class="normal"><a href="#__codelineno-0-1112">1112</a></span>
+<span class="normal"><a href="#__codelineno-0-1113">1113</a></span>
+<span class="normal"><a href="#__codelineno-0-1114">1114</a></span>
+<span class="normal"><a href="#__codelineno-0-1115">1115</a></span>
+<span class="normal"><a href="#__codelineno-0-1116">1116</a></span>
+<span class="normal"><a href="#__codelineno-0-1117">1117</a></span>
+<span class="normal"><a href="#__codelineno-0-1118">1118</a></span>
+<span class="normal"><a href="#__codelineno-0-1119">1119</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1060"><a id="__codelineno-0-1060" name="__codelineno-0-1060"></a><span class="k">def</span> <span class="nf">inspect</span><span class="p">(</span>
+</span><span id="__span-0-1061"><a id="__codelineno-0-1061" name="__codelineno-0-1061"></a>    <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-1062"><a id="__codelineno-0-1062" name="__codelineno-0-1062"></a>    <span class="n">var</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-1063"><a id="__codelineno-0-1063" name="__codelineno-0-1063"></a>    <span class="n">ref_var</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-1064"><a id="__codelineno-0-1064" name="__codelineno-0-1064"></a>    <span class="n">row_limit</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">=</span> <span class="mi">10</span><span class="p">,</span>
+</span><span id="__span-0-1065"><a id="__codelineno-0-1065" name="__codelineno-0-1065"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">]:</span>
+</span><span id="__span-0-1066"><a id="__codelineno-0-1066" name="__codelineno-0-1066"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1067"><a id="__codelineno-0-1067" name="__codelineno-0-1067"></a><span class="sd">    Print information about a specific prepared variable.</span>
+</span><span id="__span-0-1068"><a id="__codelineno-0-1068" name="__codelineno-0-1068"></a>
+</span><span id="__span-0-1069"><a id="__codelineno-0-1069" name="__codelineno-0-1069"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-1070"><a id="__codelineno-0-1070" name="__codelineno-0-1070"></a><span class="sd">        var: The name or tag of the variable.</span>
+</span><span id="__span-0-1071"><a id="__codelineno-0-1071" name="__codelineno-0-1071"></a><span class="sd">        ref_var: The name or tag of a reference variable.</span>
+</span><span id="__span-0-1072"><a id="__codelineno-0-1072" name="__codelineno-0-1072"></a><span class="sd">        row_limit: The number of rows of the prepared log to print out,</span>
+</span><span id="__span-0-1073"><a id="__codelineno-0-1073" name="__codelineno-0-1073"></a><span class="sd">            to illustrate example values of this variable.</span>
+</span><span id="__span-0-1074"><a id="__codelineno-0-1074" name="__codelineno-0-1074"></a>
+</span><span id="__span-0-1075"><a id="__codelineno-0-1075" name="__codelineno-0-1075"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-1076"><a id="__codelineno-0-1076" name="__codelineno-0-1076"></a><span class="sd">        A tuple containing:</span>
+</span><span id="__span-0-1077"><a id="__codelineno-0-1077" name="__codelineno-0-1077"></a><span class="sd">            (1) Information about the base variable of `var`, if `var` is not related to the</span>
+</span><span id="__span-0-1078"><a id="__codelineno-0-1078" name="__codelineno-0-1078"></a><span class="sd">                occurrence count of a template.</span>
+</span><span id="__span-0-1079"><a id="__codelineno-0-1079" name="__codelineno-0-1079"></a><span class="sd">            (2) Information about the template of `var`, if `var` was not created from a regex.</span>
+</span><span id="__span-0-1080"><a id="__codelineno-0-1080" name="__codelineno-0-1080"></a><span class="sd">            (3) A sample of the prepared log, with `row_limit` rows.</span>
+</span><span id="__span-0-1081"><a id="__codelineno-0-1081" name="__codelineno-0-1081"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1082"><a id="__codelineno-0-1082" name="__codelineno-0-1082"></a>
+</span><span id="__span-0-1083"><a id="__codelineno-0-1083" name="__codelineno-0-1083"></a>    <span class="c1"># Retrieve the name of this variable, if a tag was passed in.</span>
+</span><span id="__span-0-1084"><a id="__codelineno-0-1084" name="__codelineno-0-1084"></a>    <span class="n">name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">var</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1085"><a id="__codelineno-0-1085" name="__codelineno-0-1085"></a>
+</span><span id="__span-0-1086"><a id="__codelineno-0-1086" name="__codelineno-0-1086"></a>    <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Information about prepared variable </span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2">:</span><span class="se">\n</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1087"><a id="__codelineno-0-1087" name="__codelineno-0-1087"></a>    <span class="n">base_var</span> <span class="o">=</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">name</span><span class="p">)</span><span class="o">.</span><span class="n">base_var</span><span class="p">()</span>
+</span><span id="__span-0-1088"><a id="__codelineno-0-1088" name="__codelineno-0-1088"></a>    <span class="n">from_regex</span> <span class="o">=</span> <span class="kc">False</span>
+</span><span id="__span-0-1089"><a id="__codelineno-0-1089" name="__codelineno-0-1089"></a>
+</span><span id="__span-0-1090"><a id="__codelineno-0-1090" name="__codelineno-0-1090"></a>    <span class="n">base_var_info_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">()</span>
+</span><span id="__span-0-1091"><a id="__codelineno-0-1091" name="__codelineno-0-1091"></a>    <span class="k">if</span> <span class="n">base_var</span> <span class="o">!=</span> <span class="s2">&quot;TemplateId&quot;</span><span class="p">:</span>
+</span><span id="__span-0-1092"><a id="__codelineno-0-1092" name="__codelineno-0-1092"></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;--&gt; Variable Information about </span><span class="si">{</span><span class="n">base_var</span><span class="si">}</span><span class="s2">:&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1093"><a id="__codelineno-0-1093" name="__codelineno-0-1093"></a>        <span class="n">base_var_info_df</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span>
+</span><span id="__span-0-1094"><a id="__codelineno-0-1094" name="__codelineno-0-1094"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_variables</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">base_var</span>
+</span><span id="__span-0-1095"><a id="__codelineno-0-1095" name="__codelineno-0-1095"></a>        <span class="p">]</span>
+</span><span id="__span-0-1096"><a id="__codelineno-0-1096" name="__codelineno-0-1096"></a>        <span class="n">from_regex</span> <span class="o">=</span> <span class="n">base_var_info_df</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-1097"><a id="__codelineno-0-1097" name="__codelineno-0-1097"></a>        <span class="n">display</span><span class="p">(</span><span class="n">base_var_info_df</span><span class="p">)</span>
+</span><span id="__span-0-1098"><a id="__codelineno-0-1098" name="__codelineno-0-1098"></a>
+</span><span id="__span-0-1099"><a id="__codelineno-0-1099" name="__codelineno-0-1099"></a>    <span class="n">template_info_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">()</span>
+</span><span id="__span-0-1100"><a id="__codelineno-0-1100" name="__codelineno-0-1100"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">from_regex</span><span class="p">:</span>
+</span><span id="__span-0-1101"><a id="__codelineno-0-1101" name="__codelineno-0-1101"></a>        <span class="n">template_id</span> <span class="o">=</span> <span class="n">PreparedVariableName</span><span class="p">(</span><span class="n">name</span><span class="p">)</span><span class="o">.</span><span class="n">template_id</span><span class="p">()</span>
+</span><span id="__span-0-1102"><a id="__codelineno-0-1102" name="__codelineno-0-1102"></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;--&gt; Template Information about </span><span class="si">{</span><span class="n">template_id</span><span class="si">}</span><span class="s2">:&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1103"><a id="__codelineno-0-1103" name="__codelineno-0-1103"></a>        <span class="n">template_info_df</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span>
+</span><span id="__span-0-1104"><a id="__codelineno-0-1104" name="__codelineno-0-1104"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_parsed_templates</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">template_id</span>
+</span><span id="__span-0-1105"><a id="__codelineno-0-1105" name="__codelineno-0-1105"></a>        <span class="p">]</span>
+</span><span id="__span-0-1106"><a id="__codelineno-0-1106" name="__codelineno-0-1106"></a>        <span class="n">display</span><span class="p">(</span><span class="n">template_info_df</span><span class="p">)</span>
+</span><span id="__span-0-1107"><a id="__codelineno-0-1107" name="__codelineno-0-1107"></a>
+</span><span id="__span-0-1108"><a id="__codelineno-0-1108" name="__codelineno-0-1108"></a>    <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;--&gt; Causal Unit Partial Information:&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1109"><a id="__codelineno-0-1109" name="__codelineno-0-1109"></a>    <span class="k">if</span> <span class="n">row_limit</span> <span class="o">==</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-1110"><a id="__codelineno-0-1110" name="__codelineno-0-1110"></a>        <span class="n">row_limit</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">)</span>
+</span><span id="__span-0-1111"><a id="__codelineno-0-1111" name="__codelineno-0-1111"></a>    <span class="n">col_list</span> <span class="o">=</span> <span class="p">[</span><span class="n">name</span><span class="p">]</span>
+</span><span id="__span-0-1112"><a id="__codelineno-0-1112" name="__codelineno-0-1112"></a>    <span class="n">col_list</span><span class="o">.</span><span class="n">extend</span><span class="p">([</span><span class="n">ref_var</span><span class="p">]</span> <span class="k">if</span> <span class="n">ref_var</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="k">else</span> <span class="p">[])</span>
+</span><span id="__span-0-1113"><a id="__codelineno-0-1113" name="__codelineno-0-1113"></a>    <span class="n">prepared_log_info_df</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">[</span><span class="n">col_list</span><span class="p">]</span><span class="o">.</span><span class="n">head</span><span class="p">(</span><span class="n">row_limit</span><span class="p">)</span>
+</span><span id="__span-0-1114"><a id="__codelineno-0-1114" name="__codelineno-0-1114"></a>    <span class="n">col_names</span> <span class="o">=</span> <span class="p">[</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> (candidate)&quot;</span><span class="p">]</span>
+</span><span id="__span-0-1115"><a id="__codelineno-0-1115" name="__codelineno-0-1115"></a>    <span class="n">col_names</span><span class="o">.</span><span class="n">extend</span><span class="p">([</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">ref_var</span><span class="si">}</span><span class="s2"> (outcome)&quot;</span><span class="p">]</span> <span class="k">if</span> <span class="n">ref_var</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="k">else</span> <span class="p">[])</span>
+</span><span id="__span-0-1116"><a id="__codelineno-0-1116" name="__codelineno-0-1116"></a>    <span class="n">prepared_log_info_df</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="n">col_names</span>
+</span><span id="__span-0-1117"><a id="__codelineno-0-1117" name="__codelineno-0-1117"></a>    <span class="n">display</span><span class="p">(</span><span class="n">prepared_log_info_df</span><span class="p">)</span>
+</span><span id="__span-0-1118"><a id="__codelineno-0-1118" name="__codelineno-0-1118"></a>
+</span><span id="__span-0-1119"><a id="__codelineno-0-1119" name="__codelineno-0-1119"></a>    <span class="k">return</span> <span class="n">base_var_info_df</span><span class="p">,</span> <span class="n">template_info_df</span><span class="p">,</span> <span class="n">prepared_log_info_df</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -8930,29 +9043,29 @@ <h3 id="logos.logos.LOGos.clear_graph" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1109">1109</a></span>
-<span class="normal"><a href="#__codelineno-0-1110">1110</a></span>
-<span class="normal"><a href="#__codelineno-0-1111">1111</a></span>
-<span class="normal"><a href="#__codelineno-0-1112">1112</a></span>
-<span class="normal"><a href="#__codelineno-0-1113">1113</a></span>
-<span class="normal"><a href="#__codelineno-0-1114">1114</a></span>
-<span class="normal"><a href="#__codelineno-0-1115">1115</a></span>
-<span class="normal"><a href="#__codelineno-0-1116">1116</a></span>
-<span class="normal"><a href="#__codelineno-0-1117">1117</a></span>
-<span class="normal"><a href="#__codelineno-0-1118">1118</a></span>
-<span class="normal"><a href="#__codelineno-0-1119">1119</a></span>
-<span class="normal"><a href="#__codelineno-0-1120">1120</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1109"><a id="__codelineno-0-1109" name="__codelineno-0-1109"></a><span class="k">def</span> <span class="nf">clear_graph</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">clear_edge_states</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-1110"><a id="__codelineno-0-1110" name="__codelineno-0-1110"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1111"><a id="__codelineno-0-1111" name="__codelineno-0-1111"></a><span class="sd">    Clear the graph and possibly edge states.</span>
-</span><span id="__span-0-1112"><a id="__codelineno-0-1112" name="__codelineno-0-1112"></a>
-</span><span id="__span-0-1113"><a id="__codelineno-0-1113" name="__codelineno-0-1113"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-1114"><a id="__codelineno-0-1114" name="__codelineno-0-1114"></a><span class="sd">        clear_edge_states: Whether to also clear the edge states.</span>
-</span><span id="__span-0-1115"><a id="__codelineno-0-1115" name="__codelineno-0-1115"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1116"><a id="__codelineno-0-1116" name="__codelineno-0-1116"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span> <span class="o">=</span> <span class="n">nx</span><span class="o">.</span><span class="n">DiGraph</span><span class="p">()</span>
-</span><span id="__span-0-1117"><a id="__codelineno-0-1117" name="__codelineno-0-1117"></a>    <span class="k">if</span> <span class="n">clear_edge_states</span><span class="p">:</span>
-</span><span id="__span-0-1118"><a id="__codelineno-0-1118" name="__codelineno-0-1118"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span> <span class="o">=</span> <span class="n">EdgeStateMatrix</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">prepared_variable_names</span><span class="p">)</span>
-</span><span id="__span-0-1119"><a id="__codelineno-0-1119" name="__codelineno-0-1119"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="p">:</span>
-</span><span id="__span-0-1120"><a id="__codelineno-0-1120" name="__codelineno-0-1120"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">clear_graph</span><span class="p">(</span><span class="n">clear_edge_states</span><span class="p">)</span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1121">1121</a></span>
+<span class="normal"><a href="#__codelineno-0-1122">1122</a></span>
+<span class="normal"><a href="#__codelineno-0-1123">1123</a></span>
+<span class="normal"><a href="#__codelineno-0-1124">1124</a></span>
+<span class="normal"><a href="#__codelineno-0-1125">1125</a></span>
+<span class="normal"><a href="#__codelineno-0-1126">1126</a></span>
+<span class="normal"><a href="#__codelineno-0-1127">1127</a></span>
+<span class="normal"><a href="#__codelineno-0-1128">1128</a></span>
+<span class="normal"><a href="#__codelineno-0-1129">1129</a></span>
+<span class="normal"><a href="#__codelineno-0-1130">1130</a></span>
+<span class="normal"><a href="#__codelineno-0-1131">1131</a></span>
+<span class="normal"><a href="#__codelineno-0-1132">1132</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1121"><a id="__codelineno-0-1121" name="__codelineno-0-1121"></a><span class="k">def</span> <span class="nf">clear_graph</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">clear_edge_states</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-1122"><a id="__codelineno-0-1122" name="__codelineno-0-1122"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1123"><a id="__codelineno-0-1123" name="__codelineno-0-1123"></a><span class="sd">    Clear the graph and possibly edge states.</span>
+</span><span id="__span-0-1124"><a id="__codelineno-0-1124" name="__codelineno-0-1124"></a>
+</span><span id="__span-0-1125"><a id="__codelineno-0-1125" name="__codelineno-0-1125"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-1126"><a id="__codelineno-0-1126" name="__codelineno-0-1126"></a><span class="sd">        clear_edge_states: Whether to also clear the edge states.</span>
+</span><span id="__span-0-1127"><a id="__codelineno-0-1127" name="__codelineno-0-1127"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1128"><a id="__codelineno-0-1128" name="__codelineno-0-1128"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span> <span class="o">=</span> <span class="n">nx</span><span class="o">.</span><span class="n">DiGraph</span><span class="p">()</span>
+</span><span id="__span-0-1129"><a id="__codelineno-0-1129" name="__codelineno-0-1129"></a>    <span class="k">if</span> <span class="n">clear_edge_states</span><span class="p">:</span>
+</span><span id="__span-0-1130"><a id="__codelineno-0-1130" name="__codelineno-0-1130"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span> <span class="o">=</span> <span class="n">EdgeStateMatrix</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">prepared_variable_names</span><span class="p">)</span>
+</span><span id="__span-0-1131"><a id="__codelineno-0-1131" name="__codelineno-0-1131"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="p">:</span>
+</span><span id="__span-0-1132"><a id="__codelineno-0-1132" name="__codelineno-0-1132"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">clear_graph</span><span class="p">(</span><span class="n">clear_edge_states</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -8974,15 +9087,15 @@ <h3 id="logos.logos.LOGos.display_graph" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1122">1122</a></span>
-<span class="normal"><a href="#__codelineno-0-1123">1123</a></span>
-<span class="normal"><a href="#__codelineno-0-1124">1124</a></span>
-<span class="normal"><a href="#__codelineno-0-1125">1125</a></span>
-<span class="normal"><a href="#__codelineno-0-1126">1126</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1122"><a id="__codelineno-0-1122" name="__codelineno-0-1122"></a><span class="k">def</span> <span class="nf">display_graph</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-1123"><a id="__codelineno-0-1123" name="__codelineno-0-1123"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1124"><a id="__codelineno-0-1124" name="__codelineno-0-1124"></a><span class="sd">    Display the current graph.</span>
-</span><span id="__span-0-1125"><a id="__codelineno-0-1125" name="__codelineno-0-1125"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1126"><a id="__codelineno-0-1126" name="__codelineno-0-1126"></a>    <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">display_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1134">1134</a></span>
+<span class="normal"><a href="#__codelineno-0-1135">1135</a></span>
+<span class="normal"><a href="#__codelineno-0-1136">1136</a></span>
+<span class="normal"><a href="#__codelineno-0-1137">1137</a></span>
+<span class="normal"><a href="#__codelineno-0-1138">1138</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1134"><a id="__codelineno-0-1134" name="__codelineno-0-1134"></a><span class="k">def</span> <span class="nf">display_graph</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-1135"><a id="__codelineno-0-1135" name="__codelineno-0-1135"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1136"><a id="__codelineno-0-1136" name="__codelineno-0-1136"></a><span class="sd">    Display the current graph.</span>
+</span><span id="__span-0-1137"><a id="__codelineno-0-1137" name="__codelineno-0-1137"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1138"><a id="__codelineno-0-1138" name="__codelineno-0-1138"></a>    <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">display_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -9033,21 +9146,21 @@ <h3 id="logos.logos.LOGos.save_graph" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1128">1128</a></span>
-<span class="normal"><a href="#__codelineno-0-1129">1129</a></span>
-<span class="normal"><a href="#__codelineno-0-1130">1130</a></span>
-<span class="normal"><a href="#__codelineno-0-1131">1131</a></span>
-<span class="normal"><a href="#__codelineno-0-1132">1132</a></span>
-<span class="normal"><a href="#__codelineno-0-1133">1133</a></span>
-<span class="normal"><a href="#__codelineno-0-1134">1134</a></span>
-<span class="normal"><a href="#__codelineno-0-1135">1135</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1128"><a id="__codelineno-0-1128" name="__codelineno-0-1128"></a><span class="k">def</span> <span class="nf">save_graph</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filename</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-1129"><a id="__codelineno-0-1129" name="__codelineno-0-1129"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1130"><a id="__codelineno-0-1130" name="__codelineno-0-1130"></a><span class="sd">    Save the current graph to a file.</span>
-</span><span id="__span-0-1131"><a id="__codelineno-0-1131" name="__codelineno-0-1131"></a>
-</span><span id="__span-0-1132"><a id="__codelineno-0-1132" name="__codelineno-0-1132"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-1133"><a id="__codelineno-0-1133" name="__codelineno-0-1133"></a><span class="sd">        filename: The name of the file to save to.</span>
-</span><span id="__span-0-1134"><a id="__codelineno-0-1134" name="__codelineno-0-1134"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1135"><a id="__codelineno-0-1135" name="__codelineno-0-1135"></a>    <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">save_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">filename</span><span class="p">)</span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1140">1140</a></span>
+<span class="normal"><a href="#__codelineno-0-1141">1141</a></span>
+<span class="normal"><a href="#__codelineno-0-1142">1142</a></span>
+<span class="normal"><a href="#__codelineno-0-1143">1143</a></span>
+<span class="normal"><a href="#__codelineno-0-1144">1144</a></span>
+<span class="normal"><a href="#__codelineno-0-1145">1145</a></span>
+<span class="normal"><a href="#__codelineno-0-1146">1146</a></span>
+<span class="normal"><a href="#__codelineno-0-1147">1147</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1140"><a id="__codelineno-0-1140" name="__codelineno-0-1140"></a><span class="k">def</span> <span class="nf">save_graph</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filename</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-1141"><a id="__codelineno-0-1141" name="__codelineno-0-1141"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1142"><a id="__codelineno-0-1142" name="__codelineno-0-1142"></a><span class="sd">    Save the current graph to a file.</span>
+</span><span id="__span-0-1143"><a id="__codelineno-0-1143" name="__codelineno-0-1143"></a>
+</span><span id="__span-0-1144"><a id="__codelineno-0-1144" name="__codelineno-0-1144"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-1145"><a id="__codelineno-0-1145" name="__codelineno-0-1145"></a><span class="sd">        filename: The name of the file to save to.</span>
+</span><span id="__span-0-1146"><a id="__codelineno-0-1146" name="__codelineno-0-1146"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1147"><a id="__codelineno-0-1147" name="__codelineno-0-1147"></a>    <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">save_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">filename</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -9058,7 +9171,7 @@ <h3 id="logos.logos.LOGos.save_graph" class="doc doc-heading">
 
 
 <h3 id="logos.logos.LOGos.accept" class="doc doc-heading">
-            <code class="highlight language-python"><span class="n">accept</span><span class="p">(</span><span class="n">src</span><span class="p">,</span> <span class="n">dst</span><span class="p">,</span> <span class="n">also_fix</span><span class="p">,</span> <span class="n">interactive</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span></code>
+            <code class="highlight language-python"><span class="n">accept</span><span class="p">(</span><span class="n">src</span><span class="p">,</span> <span class="n">dst</span><span class="p">,</span> <span class="n">also_fix</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">interactive</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span></code>
 
 </h3>
 
@@ -9120,7 +9233,7 @@ <h3 id="logos.logos.LOGos.accept" class="doc doc-heading">
               </div>
             </td>
             <td>
-                <em>required</em>
+                  <code>False</code>
             </td>
           </tr>
           <tr class="doc-section-item">
@@ -9168,19 +9281,7 @@ <h3 id="logos.logos.LOGos.accept" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1137">1137</a></span>
-<span class="normal"><a href="#__codelineno-0-1138">1138</a></span>
-<span class="normal"><a href="#__codelineno-0-1139">1139</a></span>
-<span class="normal"><a href="#__codelineno-0-1140">1140</a></span>
-<span class="normal"><a href="#__codelineno-0-1141">1141</a></span>
-<span class="normal"><a href="#__codelineno-0-1142">1142</a></span>
-<span class="normal"><a href="#__codelineno-0-1143">1143</a></span>
-<span class="normal"><a href="#__codelineno-0-1144">1144</a></span>
-<span class="normal"><a href="#__codelineno-0-1145">1145</a></span>
-<span class="normal"><a href="#__codelineno-0-1146">1146</a></span>
-<span class="normal"><a href="#__codelineno-0-1147">1147</a></span>
-<span class="normal"><a href="#__codelineno-0-1148">1148</a></span>
-<span class="normal"><a href="#__codelineno-0-1149">1149</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1149">1149</a></span>
 <span class="normal"><a href="#__codelineno-0-1150">1150</a></span>
 <span class="normal"><a href="#__codelineno-0-1151">1151</a></span>
 <span class="normal"><a href="#__codelineno-0-1152">1152</a></span>
@@ -9222,61 +9323,73 @@ <h3 id="logos.logos.LOGos.accept" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-1188">1188</a></span>
 <span class="normal"><a href="#__codelineno-0-1189">1189</a></span>
 <span class="normal"><a href="#__codelineno-0-1190">1190</a></span>
-<span class="normal"><a href="#__codelineno-0-1191">1191</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1137"><a id="__codelineno-0-1137" name="__codelineno-0-1137"></a><span class="k">def</span> <span class="nf">accept</span><span class="p">(</span>
-</span><span id="__span-0-1138"><a id="__codelineno-0-1138" name="__codelineno-0-1138"></a>    <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-1139"><a id="__codelineno-0-1139" name="__codelineno-0-1139"></a>    <span class="n">src</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="__span-0-1140"><a id="__codelineno-0-1140" name="__codelineno-0-1140"></a>    <span class="n">dst</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="__span-0-1141"><a id="__codelineno-0-1141" name="__codelineno-0-1141"></a>    <span class="n">also_fix</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
-</span><span id="__span-0-1142"><a id="__codelineno-0-1142" name="__codelineno-0-1142"></a>    <span class="n">interactive</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="__span-0-1143"><a id="__codelineno-0-1143" name="__codelineno-0-1143"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
-</span><span id="__span-0-1144"><a id="__codelineno-0-1144" name="__codelineno-0-1144"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1145"><a id="__codelineno-0-1145" name="__codelineno-0-1145"></a><span class="sd">    Mark a causal graph edge as accepted.</span>
-</span><span id="__span-0-1146"><a id="__codelineno-0-1146" name="__codelineno-0-1146"></a>
-</span><span id="__span-0-1147"><a id="__codelineno-0-1147" name="__codelineno-0-1147"></a><span class="sd">    This will also reject the edge from `dst` to `src` and remove any other variables with the</span>
-</span><span id="__span-0-1148"><a id="__codelineno-0-1148" name="__codelineno-0-1148"></a><span class="sd">    same base variable as either `src` or `dst` from consideration for the partial causal graph.</span>
-</span><span id="__span-0-1149"><a id="__codelineno-0-1149" name="__codelineno-0-1149"></a>
-</span><span id="__span-0-1150"><a id="__codelineno-0-1150" name="__codelineno-0-1150"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-1151"><a id="__codelineno-0-1151" name="__codelineno-0-1151"></a><span class="sd">        src: The name or tag of the source variable.</span>
-</span><span id="__span-0-1152"><a id="__codelineno-0-1152" name="__codelineno-0-1152"></a><span class="sd">        dst: The name or tag of the destination variable.</span>
-</span><span id="__span-0-1153"><a id="__codelineno-0-1153" name="__codelineno-0-1153"></a><span class="sd">        also_fix: Whether to also fix the edge, for ECCS.</span>
-</span><span id="__span-0-1154"><a id="__codelineno-0-1154" name="__codelineno-0-1154"></a><span class="sd">        interactive: Whether to display the graph interactively after accepting the edge.</span>
-</span><span id="__span-0-1155"><a id="__codelineno-0-1155" name="__codelineno-0-1155"></a>
-</span><span id="__span-0-1156"><a id="__codelineno-0-1156" name="__codelineno-0-1156"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-1157"><a id="__codelineno-0-1157" name="__codelineno-0-1157"></a><span class="sd">        A tuple containing:</span>
-</span><span id="__span-0-1158"><a id="__codelineno-0-1158" name="__codelineno-0-1158"></a><span class="sd">            (1) the exploration score after the edge addition,</span>
-</span><span id="__span-0-1159"><a id="__codelineno-0-1159" name="__codelineno-0-1159"></a><span class="sd">            (2) the max-impact variable to explore next, if any,</span>
-</span><span id="__span-0-1160"><a id="__codelineno-0-1160" name="__codelineno-0-1160"></a><span class="sd">            (3) optionally a string representation of the graph, if `interactive` is False.</span>
-</span><span id="__span-0-1161"><a id="__codelineno-0-1161" name="__codelineno-0-1161"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1162"><a id="__codelineno-0-1162" name="__codelineno-0-1162"></a>
-</span><span id="__span-0-1163"><a id="__codelineno-0-1163" name="__codelineno-0-1163"></a>    <span class="n">src_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">src</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1164"><a id="__codelineno-0-1164" name="__codelineno-0-1164"></a>    <span class="n">dst_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">dst</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1165"><a id="__codelineno-0-1165" name="__codelineno-0-1165"></a>    <span class="n">to_drop</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">mark_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">,</span> <span class="s2">&quot;Accepted&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1166"><a id="__codelineno-0-1166" name="__codelineno-0-1166"></a>    <span class="k">for</span> <span class="n">node</span> <span class="ow">in</span> <span class="n">to_drop</span><span class="p">:</span>
-</span><span id="__span-0-1167"><a id="__codelineno-0-1167" name="__codelineno-0-1167"></a>        <span class="k">if</span> <span class="n">node</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">nodes</span><span class="p">:</span>
-</span><span id="__span-0-1168"><a id="__codelineno-0-1168" name="__codelineno-0-1168"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">remove_node</span><span class="p">(</span><span class="n">node</span><span class="p">)</span>
-</span><span id="__span-0-1169"><a id="__codelineno-0-1169" name="__codelineno-0-1169"></a>
-</span><span id="__span-0-1170"><a id="__codelineno-0-1170" name="__codelineno-0-1170"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">add_node</span><span class="p">(</span><span class="n">src_name</span><span class="p">)</span>
-</span><span id="__span-0-1171"><a id="__codelineno-0-1171" name="__codelineno-0-1171"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">add_node</span><span class="p">(</span><span class="n">dst_name</span><span class="p">)</span>
-</span><span id="__span-0-1172"><a id="__codelineno-0-1172" name="__codelineno-0-1172"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">add_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">)</span>
-</span><span id="__span-0-1173"><a id="__codelineno-0-1173" name="__codelineno-0-1173"></a>    <span class="k">if</span> <span class="p">(</span><span class="n">dst_name</span><span class="p">,</span> <span class="n">src_name</span><span class="p">)</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">edges</span><span class="p">:</span>
-</span><span id="__span-0-1174"><a id="__codelineno-0-1174" name="__codelineno-0-1174"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">remove_edge</span><span class="p">(</span><span class="n">dst_name</span><span class="p">,</span> <span class="n">src_name</span><span class="p">)</span>
-</span><span id="__span-0-1175"><a id="__codelineno-0-1175" name="__codelineno-0-1175"></a>    <span class="k">if</span> <span class="n">interactive</span><span class="p">:</span>
-</span><span id="__span-0-1176"><a id="__codelineno-0-1176" name="__codelineno-0-1176"></a>        <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">display_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
-</span><span id="__span-0-1177"><a id="__codelineno-0-1177" name="__codelineno-0-1177"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="p">:</span>
-</span><span id="__span-0-1178"><a id="__codelineno-0-1178" name="__codelineno-0-1178"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">remove_edge</span><span class="p">(</span><span class="n">dst_name</span><span class="p">,</span> <span class="n">src_name</span><span class="p">)</span>
-</span><span id="__span-0-1179"><a id="__codelineno-0-1179" name="__codelineno-0-1179"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">add_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">)</span>
-</span><span id="__span-0-1180"><a id="__codelineno-0-1180" name="__codelineno-0-1180"></a>        <span class="k">if</span> <span class="n">also_fix</span><span class="p">:</span>
-</span><span id="__span-0-1181"><a id="__codelineno-0-1181" name="__codelineno-0-1181"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">fix_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">)</span>
-</span><span id="__span-0-1182"><a id="__codelineno-0-1182" name="__codelineno-0-1182"></a>
-</span><span id="__span-0-1183"><a id="__codelineno-0-1183" name="__codelineno-0-1183"></a>    <span class="k">return</span> <span class="p">(</span>
-</span><span id="__span-0-1184"><a id="__codelineno-0-1184" name="__codelineno-0-1184"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">exploration_score</span><span class="p">,</span>
-</span><span id="__span-0-1185"><a id="__codelineno-0-1185" name="__codelineno-0-1185"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">suggest_next_exploration</span><span class="p">(),</span>
-</span><span id="__span-0-1186"><a id="__codelineno-0-1186" name="__codelineno-0-1186"></a>        <span class="p">(</span>
-</span><span id="__span-0-1187"><a id="__codelineno-0-1187" name="__codelineno-0-1187"></a>            <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">draw_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
-</span><span id="__span-0-1188"><a id="__codelineno-0-1188" name="__codelineno-0-1188"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">interactive</span>
-</span><span id="__span-0-1189"><a id="__codelineno-0-1189" name="__codelineno-0-1189"></a>            <span class="k">else</span> <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-1190"><a id="__codelineno-0-1190" name="__codelineno-0-1190"></a>        <span class="p">),</span>
-</span><span id="__span-0-1191"><a id="__codelineno-0-1191" name="__codelineno-0-1191"></a>    <span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-1191">1191</a></span>
+<span class="normal"><a href="#__codelineno-0-1192">1192</a></span>
+<span class="normal"><a href="#__codelineno-0-1193">1193</a></span>
+<span class="normal"><a href="#__codelineno-0-1194">1194</a></span>
+<span class="normal"><a href="#__codelineno-0-1195">1195</a></span>
+<span class="normal"><a href="#__codelineno-0-1196">1196</a></span>
+<span class="normal"><a href="#__codelineno-0-1197">1197</a></span>
+<span class="normal"><a href="#__codelineno-0-1198">1198</a></span>
+<span class="normal"><a href="#__codelineno-0-1199">1199</a></span>
+<span class="normal"><a href="#__codelineno-0-1200">1200</a></span>
+<span class="normal"><a href="#__codelineno-0-1201">1201</a></span>
+<span class="normal"><a href="#__codelineno-0-1202">1202</a></span>
+<span class="normal"><a href="#__codelineno-0-1203">1203</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1149"><a id="__codelineno-0-1149" name="__codelineno-0-1149"></a><span class="k">def</span> <span class="nf">accept</span><span class="p">(</span>
+</span><span id="__span-0-1150"><a id="__codelineno-0-1150" name="__codelineno-0-1150"></a>    <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-1151"><a id="__codelineno-0-1151" name="__codelineno-0-1151"></a>    <span class="n">src</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-1152"><a id="__codelineno-0-1152" name="__codelineno-0-1152"></a>    <span class="n">dst</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-1153"><a id="__codelineno-0-1153" name="__codelineno-0-1153"></a>    <span class="n">also_fix</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-1154"><a id="__codelineno-0-1154" name="__codelineno-0-1154"></a>    <span class="n">interactive</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="__span-0-1155"><a id="__codelineno-0-1155" name="__codelineno-0-1155"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
+</span><span id="__span-0-1156"><a id="__codelineno-0-1156" name="__codelineno-0-1156"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1157"><a id="__codelineno-0-1157" name="__codelineno-0-1157"></a><span class="sd">    Mark a causal graph edge as accepted.</span>
+</span><span id="__span-0-1158"><a id="__codelineno-0-1158" name="__codelineno-0-1158"></a>
+</span><span id="__span-0-1159"><a id="__codelineno-0-1159" name="__codelineno-0-1159"></a><span class="sd">    This will also reject the edge from `dst` to `src` and remove any other variables with the</span>
+</span><span id="__span-0-1160"><a id="__codelineno-0-1160" name="__codelineno-0-1160"></a><span class="sd">    same base variable as either `src` or `dst` from consideration for the partial causal graph.</span>
+</span><span id="__span-0-1161"><a id="__codelineno-0-1161" name="__codelineno-0-1161"></a>
+</span><span id="__span-0-1162"><a id="__codelineno-0-1162" name="__codelineno-0-1162"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-1163"><a id="__codelineno-0-1163" name="__codelineno-0-1163"></a><span class="sd">        src: The name or tag of the source variable.</span>
+</span><span id="__span-0-1164"><a id="__codelineno-0-1164" name="__codelineno-0-1164"></a><span class="sd">        dst: The name or tag of the destination variable.</span>
+</span><span id="__span-0-1165"><a id="__codelineno-0-1165" name="__codelineno-0-1165"></a><span class="sd">        also_fix: Whether to also fix the edge, for ECCS.</span>
+</span><span id="__span-0-1166"><a id="__codelineno-0-1166" name="__codelineno-0-1166"></a><span class="sd">        interactive: Whether to display the graph interactively after accepting the edge.</span>
+</span><span id="__span-0-1167"><a id="__codelineno-0-1167" name="__codelineno-0-1167"></a>
+</span><span id="__span-0-1168"><a id="__codelineno-0-1168" name="__codelineno-0-1168"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-1169"><a id="__codelineno-0-1169" name="__codelineno-0-1169"></a><span class="sd">        A tuple containing:</span>
+</span><span id="__span-0-1170"><a id="__codelineno-0-1170" name="__codelineno-0-1170"></a><span class="sd">            (1) the exploration score after the edge addition,</span>
+</span><span id="__span-0-1171"><a id="__codelineno-0-1171" name="__codelineno-0-1171"></a><span class="sd">            (2) the max-impact variable to explore next, if any,</span>
+</span><span id="__span-0-1172"><a id="__codelineno-0-1172" name="__codelineno-0-1172"></a><span class="sd">            (3) optionally a string representation of the graph, if `interactive` is False.</span>
+</span><span id="__span-0-1173"><a id="__codelineno-0-1173" name="__codelineno-0-1173"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1174"><a id="__codelineno-0-1174" name="__codelineno-0-1174"></a>
+</span><span id="__span-0-1175"><a id="__codelineno-0-1175" name="__codelineno-0-1175"></a>    <span class="n">src_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">src</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1176"><a id="__codelineno-0-1176" name="__codelineno-0-1176"></a>    <span class="n">dst_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">dst</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1177"><a id="__codelineno-0-1177" name="__codelineno-0-1177"></a>    <span class="n">to_drop</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">mark_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">,</span> <span class="s2">&quot;Accepted&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1178"><a id="__codelineno-0-1178" name="__codelineno-0-1178"></a>    <span class="k">for</span> <span class="n">node</span> <span class="ow">in</span> <span class="n">to_drop</span><span class="p">:</span>
+</span><span id="__span-0-1179"><a id="__codelineno-0-1179" name="__codelineno-0-1179"></a>        <span class="k">if</span> <span class="n">node</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">nodes</span><span class="p">:</span>
+</span><span id="__span-0-1180"><a id="__codelineno-0-1180" name="__codelineno-0-1180"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">remove_node</span><span class="p">(</span><span class="n">node</span><span class="p">)</span>
+</span><span id="__span-0-1181"><a id="__codelineno-0-1181" name="__codelineno-0-1181"></a>
+</span><span id="__span-0-1182"><a id="__codelineno-0-1182" name="__codelineno-0-1182"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">add_node</span><span class="p">(</span><span class="n">src_name</span><span class="p">)</span>
+</span><span id="__span-0-1183"><a id="__codelineno-0-1183" name="__codelineno-0-1183"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">add_node</span><span class="p">(</span><span class="n">dst_name</span><span class="p">)</span>
+</span><span id="__span-0-1184"><a id="__codelineno-0-1184" name="__codelineno-0-1184"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">add_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">)</span>
+</span><span id="__span-0-1185"><a id="__codelineno-0-1185" name="__codelineno-0-1185"></a>    <span class="k">if</span> <span class="p">(</span><span class="n">dst_name</span><span class="p">,</span> <span class="n">src_name</span><span class="p">)</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">edges</span><span class="p">:</span>
+</span><span id="__span-0-1186"><a id="__codelineno-0-1186" name="__codelineno-0-1186"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">remove_edge</span><span class="p">(</span><span class="n">dst_name</span><span class="p">,</span> <span class="n">src_name</span><span class="p">)</span>
+</span><span id="__span-0-1187"><a id="__codelineno-0-1187" name="__codelineno-0-1187"></a>    <span class="k">if</span> <span class="n">interactive</span><span class="p">:</span>
+</span><span id="__span-0-1188"><a id="__codelineno-0-1188" name="__codelineno-0-1188"></a>        <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">display_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
+</span><span id="__span-0-1189"><a id="__codelineno-0-1189" name="__codelineno-0-1189"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="p">:</span>
+</span><span id="__span-0-1190"><a id="__codelineno-0-1190" name="__codelineno-0-1190"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">remove_edge</span><span class="p">(</span><span class="n">dst_name</span><span class="p">,</span> <span class="n">src_name</span><span class="p">)</span>
+</span><span id="__span-0-1191"><a id="__codelineno-0-1191" name="__codelineno-0-1191"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">add_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">)</span>
+</span><span id="__span-0-1192"><a id="__codelineno-0-1192" name="__codelineno-0-1192"></a>        <span class="k">if</span> <span class="n">also_fix</span><span class="p">:</span>
+</span><span id="__span-0-1193"><a id="__codelineno-0-1193" name="__codelineno-0-1193"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">fix_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">)</span>
+</span><span id="__span-0-1194"><a id="__codelineno-0-1194" name="__codelineno-0-1194"></a>
+</span><span id="__span-0-1195"><a id="__codelineno-0-1195" name="__codelineno-0-1195"></a>    <span class="k">return</span> <span class="p">(</span>
+</span><span id="__span-0-1196"><a id="__codelineno-0-1196" name="__codelineno-0-1196"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">exploration_score</span><span class="p">,</span>
+</span><span id="__span-0-1197"><a id="__codelineno-0-1197" name="__codelineno-0-1197"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">suggest_next_exploration</span><span class="p">(),</span>
+</span><span id="__span-0-1198"><a id="__codelineno-0-1198" name="__codelineno-0-1198"></a>        <span class="p">(</span>
+</span><span id="__span-0-1199"><a id="__codelineno-0-1199" name="__codelineno-0-1199"></a>            <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">draw_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
+</span><span id="__span-0-1200"><a id="__codelineno-0-1200" name="__codelineno-0-1200"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">interactive</span>
+</span><span id="__span-0-1201"><a id="__codelineno-0-1201" name="__codelineno-0-1201"></a>            <span class="k">else</span> <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-1202"><a id="__codelineno-0-1202" name="__codelineno-0-1202"></a>        <span class="p">),</span>
+</span><span id="__span-0-1203"><a id="__codelineno-0-1203" name="__codelineno-0-1203"></a>    <span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -9395,19 +9508,7 @@ <h3 id="logos.logos.LOGos.reject" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1193">1193</a></span>
-<span class="normal"><a href="#__codelineno-0-1194">1194</a></span>
-<span class="normal"><a href="#__codelineno-0-1195">1195</a></span>
-<span class="normal"><a href="#__codelineno-0-1196">1196</a></span>
-<span class="normal"><a href="#__codelineno-0-1197">1197</a></span>
-<span class="normal"><a href="#__codelineno-0-1198">1198</a></span>
-<span class="normal"><a href="#__codelineno-0-1199">1199</a></span>
-<span class="normal"><a href="#__codelineno-0-1200">1200</a></span>
-<span class="normal"><a href="#__codelineno-0-1201">1201</a></span>
-<span class="normal"><a href="#__codelineno-0-1202">1202</a></span>
-<span class="normal"><a href="#__codelineno-0-1203">1203</a></span>
-<span class="normal"><a href="#__codelineno-0-1204">1204</a></span>
-<span class="normal"><a href="#__codelineno-0-1205">1205</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1205">1205</a></span>
 <span class="normal"><a href="#__codelineno-0-1206">1206</a></span>
 <span class="normal"><a href="#__codelineno-0-1207">1207</a></span>
 <span class="normal"><a href="#__codelineno-0-1208">1208</a></span>
@@ -9435,47 +9536,59 @@ <h3 id="logos.logos.LOGos.reject" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-1230">1230</a></span>
 <span class="normal"><a href="#__codelineno-0-1231">1231</a></span>
 <span class="normal"><a href="#__codelineno-0-1232">1232</a></span>
-<span class="normal"><a href="#__codelineno-0-1233">1233</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1193"><a id="__codelineno-0-1193" name="__codelineno-0-1193"></a><span class="k">def</span> <span class="nf">reject</span><span class="p">(</span>
-</span><span id="__span-0-1194"><a id="__codelineno-0-1194" name="__codelineno-0-1194"></a>    <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-1195"><a id="__codelineno-0-1195" name="__codelineno-0-1195"></a>    <span class="n">src</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="__span-0-1196"><a id="__codelineno-0-1196" name="__codelineno-0-1196"></a>    <span class="n">dst</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="__span-0-1197"><a id="__codelineno-0-1197" name="__codelineno-0-1197"></a>    <span class="n">also_ban</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
-</span><span id="__span-0-1198"><a id="__codelineno-0-1198" name="__codelineno-0-1198"></a>    <span class="n">interactive</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="__span-0-1199"><a id="__codelineno-0-1199" name="__codelineno-0-1199"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
-</span><span id="__span-0-1200"><a id="__codelineno-0-1200" name="__codelineno-0-1200"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1201"><a id="__codelineno-0-1201" name="__codelineno-0-1201"></a><span class="sd">    Mark a causal graph edge as rejected.</span>
-</span><span id="__span-0-1202"><a id="__codelineno-0-1202" name="__codelineno-0-1202"></a>
-</span><span id="__span-0-1203"><a id="__codelineno-0-1203" name="__codelineno-0-1203"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-1204"><a id="__codelineno-0-1204" name="__codelineno-0-1204"></a><span class="sd">        src: The name or tag of the source variable.</span>
-</span><span id="__span-0-1205"><a id="__codelineno-0-1205" name="__codelineno-0-1205"></a><span class="sd">        dst: The name or tag of the destination variable.</span>
-</span><span id="__span-0-1206"><a id="__codelineno-0-1206" name="__codelineno-0-1206"></a><span class="sd">        also_ban: Whether to also ban the edge, for ECCS.</span>
-</span><span id="__span-0-1207"><a id="__codelineno-0-1207" name="__codelineno-0-1207"></a><span class="sd">        interactive: Whether to display the graph interactively after rejecting the edge.</span>
-</span><span id="__span-0-1208"><a id="__codelineno-0-1208" name="__codelineno-0-1208"></a>
-</span><span id="__span-0-1209"><a id="__codelineno-0-1209" name="__codelineno-0-1209"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-1210"><a id="__codelineno-0-1210" name="__codelineno-0-1210"></a><span class="sd">        A tuple containing:</span>
-</span><span id="__span-0-1211"><a id="__codelineno-0-1211" name="__codelineno-0-1211"></a><span class="sd">            (1) the exploration score after the edge rejection,</span>
-</span><span id="__span-0-1212"><a id="__codelineno-0-1212" name="__codelineno-0-1212"></a><span class="sd">            (2) the max-impact variable to explore next, if any,</span>
-</span><span id="__span-0-1213"><a id="__codelineno-0-1213" name="__codelineno-0-1213"></a><span class="sd">            (3) optionally a string representation of the graph, if `interactive` is False.</span>
-</span><span id="__span-0-1214"><a id="__codelineno-0-1214" name="__codelineno-0-1214"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1215"><a id="__codelineno-0-1215" name="__codelineno-0-1215"></a>
-</span><span id="__span-0-1216"><a id="__codelineno-0-1216" name="__codelineno-0-1216"></a>    <span class="n">src_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">src</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1217"><a id="__codelineno-0-1217" name="__codelineno-0-1217"></a>    <span class="n">dst_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">dst</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1218"><a id="__codelineno-0-1218" name="__codelineno-0-1218"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">mark_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">,</span> <span class="s2">&quot;Rejected&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1219"><a id="__codelineno-0-1219" name="__codelineno-0-1219"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span> <span class="ow">and</span> <span class="n">also_ban</span><span class="p">:</span>
-</span><span id="__span-0-1220"><a id="__codelineno-0-1220" name="__codelineno-0-1220"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">ban_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">)</span>
-</span><span id="__span-0-1221"><a id="__codelineno-0-1221" name="__codelineno-0-1221"></a>
-</span><span id="__span-0-1222"><a id="__codelineno-0-1222" name="__codelineno-0-1222"></a>    <span class="k">if</span> <span class="n">interactive</span><span class="p">:</span>
-</span><span id="__span-0-1223"><a id="__codelineno-0-1223" name="__codelineno-0-1223"></a>        <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">display_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
-</span><span id="__span-0-1224"><a id="__codelineno-0-1224" name="__codelineno-0-1224"></a>
-</span><span id="__span-0-1225"><a id="__codelineno-0-1225" name="__codelineno-0-1225"></a>    <span class="k">return</span> <span class="p">(</span>
-</span><span id="__span-0-1226"><a id="__codelineno-0-1226" name="__codelineno-0-1226"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">exploration_score</span><span class="p">,</span>
-</span><span id="__span-0-1227"><a id="__codelineno-0-1227" name="__codelineno-0-1227"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">suggest_next_exploration</span><span class="p">(),</span>
-</span><span id="__span-0-1228"><a id="__codelineno-0-1228" name="__codelineno-0-1228"></a>        <span class="p">(</span>
-</span><span id="__span-0-1229"><a id="__codelineno-0-1229" name="__codelineno-0-1229"></a>            <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">draw_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
-</span><span id="__span-0-1230"><a id="__codelineno-0-1230" name="__codelineno-0-1230"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">interactive</span>
-</span><span id="__span-0-1231"><a id="__codelineno-0-1231" name="__codelineno-0-1231"></a>            <span class="k">else</span> <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-1232"><a id="__codelineno-0-1232" name="__codelineno-0-1232"></a>        <span class="p">),</span>
-</span><span id="__span-0-1233"><a id="__codelineno-0-1233" name="__codelineno-0-1233"></a>    <span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-1233">1233</a></span>
+<span class="normal"><a href="#__codelineno-0-1234">1234</a></span>
+<span class="normal"><a href="#__codelineno-0-1235">1235</a></span>
+<span class="normal"><a href="#__codelineno-0-1236">1236</a></span>
+<span class="normal"><a href="#__codelineno-0-1237">1237</a></span>
+<span class="normal"><a href="#__codelineno-0-1238">1238</a></span>
+<span class="normal"><a href="#__codelineno-0-1239">1239</a></span>
+<span class="normal"><a href="#__codelineno-0-1240">1240</a></span>
+<span class="normal"><a href="#__codelineno-0-1241">1241</a></span>
+<span class="normal"><a href="#__codelineno-0-1242">1242</a></span>
+<span class="normal"><a href="#__codelineno-0-1243">1243</a></span>
+<span class="normal"><a href="#__codelineno-0-1244">1244</a></span>
+<span class="normal"><a href="#__codelineno-0-1245">1245</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1205"><a id="__codelineno-0-1205" name="__codelineno-0-1205"></a><span class="k">def</span> <span class="nf">reject</span><span class="p">(</span>
+</span><span id="__span-0-1206"><a id="__codelineno-0-1206" name="__codelineno-0-1206"></a>    <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-1207"><a id="__codelineno-0-1207" name="__codelineno-0-1207"></a>    <span class="n">src</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-1208"><a id="__codelineno-0-1208" name="__codelineno-0-1208"></a>    <span class="n">dst</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-1209"><a id="__codelineno-0-1209" name="__codelineno-0-1209"></a>    <span class="n">also_ban</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
+</span><span id="__span-0-1210"><a id="__codelineno-0-1210" name="__codelineno-0-1210"></a>    <span class="n">interactive</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="__span-0-1211"><a id="__codelineno-0-1211" name="__codelineno-0-1211"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
+</span><span id="__span-0-1212"><a id="__codelineno-0-1212" name="__codelineno-0-1212"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1213"><a id="__codelineno-0-1213" name="__codelineno-0-1213"></a><span class="sd">    Mark a causal graph edge as rejected.</span>
+</span><span id="__span-0-1214"><a id="__codelineno-0-1214" name="__codelineno-0-1214"></a>
+</span><span id="__span-0-1215"><a id="__codelineno-0-1215" name="__codelineno-0-1215"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-1216"><a id="__codelineno-0-1216" name="__codelineno-0-1216"></a><span class="sd">        src: The name or tag of the source variable.</span>
+</span><span id="__span-0-1217"><a id="__codelineno-0-1217" name="__codelineno-0-1217"></a><span class="sd">        dst: The name or tag of the destination variable.</span>
+</span><span id="__span-0-1218"><a id="__codelineno-0-1218" name="__codelineno-0-1218"></a><span class="sd">        also_ban: Whether to also ban the edge, for ECCS.</span>
+</span><span id="__span-0-1219"><a id="__codelineno-0-1219" name="__codelineno-0-1219"></a><span class="sd">        interactive: Whether to display the graph interactively after rejecting the edge.</span>
+</span><span id="__span-0-1220"><a id="__codelineno-0-1220" name="__codelineno-0-1220"></a>
+</span><span id="__span-0-1221"><a id="__codelineno-0-1221" name="__codelineno-0-1221"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-1222"><a id="__codelineno-0-1222" name="__codelineno-0-1222"></a><span class="sd">        A tuple containing:</span>
+</span><span id="__span-0-1223"><a id="__codelineno-0-1223" name="__codelineno-0-1223"></a><span class="sd">            (1) the exploration score after the edge rejection,</span>
+</span><span id="__span-0-1224"><a id="__codelineno-0-1224" name="__codelineno-0-1224"></a><span class="sd">            (2) the max-impact variable to explore next, if any,</span>
+</span><span id="__span-0-1225"><a id="__codelineno-0-1225" name="__codelineno-0-1225"></a><span class="sd">            (3) optionally a string representation of the graph, if `interactive` is False.</span>
+</span><span id="__span-0-1226"><a id="__codelineno-0-1226" name="__codelineno-0-1226"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1227"><a id="__codelineno-0-1227" name="__codelineno-0-1227"></a>
+</span><span id="__span-0-1228"><a id="__codelineno-0-1228" name="__codelineno-0-1228"></a>    <span class="n">src_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">src</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1229"><a id="__codelineno-0-1229" name="__codelineno-0-1229"></a>    <span class="n">dst_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">dst</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1230"><a id="__codelineno-0-1230" name="__codelineno-0-1230"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">mark_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">,</span> <span class="s2">&quot;Rejected&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1231"><a id="__codelineno-0-1231" name="__codelineno-0-1231"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span> <span class="ow">and</span> <span class="n">also_ban</span><span class="p">:</span>
+</span><span id="__span-0-1232"><a id="__codelineno-0-1232" name="__codelineno-0-1232"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">ban_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">)</span>
+</span><span id="__span-0-1233"><a id="__codelineno-0-1233" name="__codelineno-0-1233"></a>
+</span><span id="__span-0-1234"><a id="__codelineno-0-1234" name="__codelineno-0-1234"></a>    <span class="k">if</span> <span class="n">interactive</span><span class="p">:</span>
+</span><span id="__span-0-1235"><a id="__codelineno-0-1235" name="__codelineno-0-1235"></a>        <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">display_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
+</span><span id="__span-0-1236"><a id="__codelineno-0-1236" name="__codelineno-0-1236"></a>
+</span><span id="__span-0-1237"><a id="__codelineno-0-1237" name="__codelineno-0-1237"></a>    <span class="k">return</span> <span class="p">(</span>
+</span><span id="__span-0-1238"><a id="__codelineno-0-1238" name="__codelineno-0-1238"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">exploration_score</span><span class="p">,</span>
+</span><span id="__span-0-1239"><a id="__codelineno-0-1239" name="__codelineno-0-1239"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">suggest_next_exploration</span><span class="p">(),</span>
+</span><span id="__span-0-1240"><a id="__codelineno-0-1240" name="__codelineno-0-1240"></a>        <span class="p">(</span>
+</span><span id="__span-0-1241"><a id="__codelineno-0-1241" name="__codelineno-0-1241"></a>            <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">draw_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
+</span><span id="__span-0-1242"><a id="__codelineno-0-1242" name="__codelineno-0-1242"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">interactive</span>
+</span><span id="__span-0-1243"><a id="__codelineno-0-1243" name="__codelineno-0-1243"></a>            <span class="k">else</span> <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-1244"><a id="__codelineno-0-1244" name="__codelineno-0-1244"></a>        <span class="p">),</span>
+</span><span id="__span-0-1245"><a id="__codelineno-0-1245" name="__codelineno-0-1245"></a>    <span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -9580,19 +9693,7 @@ <h3 id="logos.logos.LOGos.reject_undecided_incoming" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1235">1235</a></span>
-<span class="normal"><a href="#__codelineno-0-1236">1236</a></span>
-<span class="normal"><a href="#__codelineno-0-1237">1237</a></span>
-<span class="normal"><a href="#__codelineno-0-1238">1238</a></span>
-<span class="normal"><a href="#__codelineno-0-1239">1239</a></span>
-<span class="normal"><a href="#__codelineno-0-1240">1240</a></span>
-<span class="normal"><a href="#__codelineno-0-1241">1241</a></span>
-<span class="normal"><a href="#__codelineno-0-1242">1242</a></span>
-<span class="normal"><a href="#__codelineno-0-1243">1243</a></span>
-<span class="normal"><a href="#__codelineno-0-1244">1244</a></span>
-<span class="normal"><a href="#__codelineno-0-1245">1245</a></span>
-<span class="normal"><a href="#__codelineno-0-1246">1246</a></span>
-<span class="normal"><a href="#__codelineno-0-1247">1247</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1247">1247</a></span>
 <span class="normal"><a href="#__codelineno-0-1248">1248</a></span>
 <span class="normal"><a href="#__codelineno-0-1249">1249</a></span>
 <span class="normal"><a href="#__codelineno-0-1250">1250</a></span>
@@ -9615,42 +9716,54 @@ <h3 id="logos.logos.LOGos.reject_undecided_incoming" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-1267">1267</a></span>
 <span class="normal"><a href="#__codelineno-0-1268">1268</a></span>
 <span class="normal"><a href="#__codelineno-0-1269">1269</a></span>
-<span class="normal"><a href="#__codelineno-0-1270">1270</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1235"><a id="__codelineno-0-1235" name="__codelineno-0-1235"></a><span class="k">def</span> <span class="nf">reject_undecided_incoming</span><span class="p">(</span>
-</span><span id="__span-0-1236"><a id="__codelineno-0-1236" name="__codelineno-0-1236"></a>    <span class="bp">self</span><span class="p">,</span> <span class="n">dst</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">also_ban</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span> <span class="n">interactive</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span>
-</span><span id="__span-0-1237"><a id="__codelineno-0-1237" name="__codelineno-0-1237"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
-</span><span id="__span-0-1238"><a id="__codelineno-0-1238" name="__codelineno-0-1238"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1239"><a id="__codelineno-0-1239" name="__codelineno-0-1239"></a><span class="sd">    Mark all undecided incoming edges to a variable as rejected.</span>
-</span><span id="__span-0-1240"><a id="__codelineno-0-1240" name="__codelineno-0-1240"></a>
-</span><span id="__span-0-1241"><a id="__codelineno-0-1241" name="__codelineno-0-1241"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-1242"><a id="__codelineno-0-1242" name="__codelineno-0-1242"></a><span class="sd">        dst: The name or tag of the destination variable.</span>
-</span><span id="__span-0-1243"><a id="__codelineno-0-1243" name="__codelineno-0-1243"></a><span class="sd">        also_ban: Whether to also ban the edges, for ECCS.</span>
-</span><span id="__span-0-1244"><a id="__codelineno-0-1244" name="__codelineno-0-1244"></a><span class="sd">        interactive: Whether to display the graph interactively after rejecting the edges.</span>
-</span><span id="__span-0-1245"><a id="__codelineno-0-1245" name="__codelineno-0-1245"></a>
-</span><span id="__span-0-1246"><a id="__codelineno-0-1246" name="__codelineno-0-1246"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-1247"><a id="__codelineno-0-1247" name="__codelineno-0-1247"></a><span class="sd">        A tuple containing:</span>
-</span><span id="__span-0-1248"><a id="__codelineno-0-1248" name="__codelineno-0-1248"></a><span class="sd">            (1) the exploration score after the edge rejections,</span>
-</span><span id="__span-0-1249"><a id="__codelineno-0-1249" name="__codelineno-0-1249"></a><span class="sd">            (2) the max-impact variable to explore next, if any,</span>
-</span><span id="__span-0-1250"><a id="__codelineno-0-1250" name="__codelineno-0-1250"></a><span class="sd">            (3) optionally a string representation of the graph, if `interactive` is False.</span>
-</span><span id="__span-0-1251"><a id="__codelineno-0-1251" name="__codelineno-0-1251"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1252"><a id="__codelineno-0-1252" name="__codelineno-0-1252"></a>    <span class="n">dst_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">dst</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1253"><a id="__codelineno-0-1253" name="__codelineno-0-1253"></a>    <span class="k">for</span> <span class="n">v</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variable_names</span><span class="p">:</span>
-</span><span id="__span-0-1254"><a id="__codelineno-0-1254" name="__codelineno-0-1254"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">get_edge_state</span><span class="p">(</span><span class="n">v</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">)</span> <span class="o">==</span> <span class="s2">&quot;Undecided&quot;</span><span class="p">:</span>
-</span><span id="__span-0-1255"><a id="__codelineno-0-1255" name="__codelineno-0-1255"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">mark_edge</span><span class="p">(</span><span class="n">v</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">,</span> <span class="s2">&quot;Rejected&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1256"><a id="__codelineno-0-1256" name="__codelineno-0-1256"></a>            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span> <span class="ow">and</span> <span class="n">also_ban</span><span class="p">:</span>
-</span><span id="__span-0-1257"><a id="__codelineno-0-1257" name="__codelineno-0-1257"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">ban_edge</span><span class="p">(</span><span class="n">v</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">)</span>
-</span><span id="__span-0-1258"><a id="__codelineno-0-1258" name="__codelineno-0-1258"></a>
-</span><span id="__span-0-1259"><a id="__codelineno-0-1259" name="__codelineno-0-1259"></a>    <span class="k">if</span> <span class="n">interactive</span><span class="p">:</span>
-</span><span id="__span-0-1260"><a id="__codelineno-0-1260" name="__codelineno-0-1260"></a>        <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">display_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
-</span><span id="__span-0-1261"><a id="__codelineno-0-1261" name="__codelineno-0-1261"></a>
-</span><span id="__span-0-1262"><a id="__codelineno-0-1262" name="__codelineno-0-1262"></a>    <span class="k">return</span> <span class="p">(</span>
-</span><span id="__span-0-1263"><a id="__codelineno-0-1263" name="__codelineno-0-1263"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">exploration_score</span><span class="p">,</span>
-</span><span id="__span-0-1264"><a id="__codelineno-0-1264" name="__codelineno-0-1264"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">suggest_next_exploration</span><span class="p">(),</span>
-</span><span id="__span-0-1265"><a id="__codelineno-0-1265" name="__codelineno-0-1265"></a>        <span class="p">(</span>
-</span><span id="__span-0-1266"><a id="__codelineno-0-1266" name="__codelineno-0-1266"></a>            <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">draw_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
-</span><span id="__span-0-1267"><a id="__codelineno-0-1267" name="__codelineno-0-1267"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">interactive</span>
-</span><span id="__span-0-1268"><a id="__codelineno-0-1268" name="__codelineno-0-1268"></a>            <span class="k">else</span> <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-1269"><a id="__codelineno-0-1269" name="__codelineno-0-1269"></a>        <span class="p">),</span>
-</span><span id="__span-0-1270"><a id="__codelineno-0-1270" name="__codelineno-0-1270"></a>    <span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-1270">1270</a></span>
+<span class="normal"><a href="#__codelineno-0-1271">1271</a></span>
+<span class="normal"><a href="#__codelineno-0-1272">1272</a></span>
+<span class="normal"><a href="#__codelineno-0-1273">1273</a></span>
+<span class="normal"><a href="#__codelineno-0-1274">1274</a></span>
+<span class="normal"><a href="#__codelineno-0-1275">1275</a></span>
+<span class="normal"><a href="#__codelineno-0-1276">1276</a></span>
+<span class="normal"><a href="#__codelineno-0-1277">1277</a></span>
+<span class="normal"><a href="#__codelineno-0-1278">1278</a></span>
+<span class="normal"><a href="#__codelineno-0-1279">1279</a></span>
+<span class="normal"><a href="#__codelineno-0-1280">1280</a></span>
+<span class="normal"><a href="#__codelineno-0-1281">1281</a></span>
+<span class="normal"><a href="#__codelineno-0-1282">1282</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1247"><a id="__codelineno-0-1247" name="__codelineno-0-1247"></a><span class="k">def</span> <span class="nf">reject_undecided_incoming</span><span class="p">(</span>
+</span><span id="__span-0-1248"><a id="__codelineno-0-1248" name="__codelineno-0-1248"></a>    <span class="bp">self</span><span class="p">,</span> <span class="n">dst</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">also_ban</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span> <span class="n">interactive</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span>
+</span><span id="__span-0-1249"><a id="__codelineno-0-1249" name="__codelineno-0-1249"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
+</span><span id="__span-0-1250"><a id="__codelineno-0-1250" name="__codelineno-0-1250"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1251"><a id="__codelineno-0-1251" name="__codelineno-0-1251"></a><span class="sd">    Mark all undecided incoming edges to a variable as rejected.</span>
+</span><span id="__span-0-1252"><a id="__codelineno-0-1252" name="__codelineno-0-1252"></a>
+</span><span id="__span-0-1253"><a id="__codelineno-0-1253" name="__codelineno-0-1253"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-1254"><a id="__codelineno-0-1254" name="__codelineno-0-1254"></a><span class="sd">        dst: The name or tag of the destination variable.</span>
+</span><span id="__span-0-1255"><a id="__codelineno-0-1255" name="__codelineno-0-1255"></a><span class="sd">        also_ban: Whether to also ban the edges, for ECCS.</span>
+</span><span id="__span-0-1256"><a id="__codelineno-0-1256" name="__codelineno-0-1256"></a><span class="sd">        interactive: Whether to display the graph interactively after rejecting the edges.</span>
+</span><span id="__span-0-1257"><a id="__codelineno-0-1257" name="__codelineno-0-1257"></a>
+</span><span id="__span-0-1258"><a id="__codelineno-0-1258" name="__codelineno-0-1258"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-1259"><a id="__codelineno-0-1259" name="__codelineno-0-1259"></a><span class="sd">        A tuple containing:</span>
+</span><span id="__span-0-1260"><a id="__codelineno-0-1260" name="__codelineno-0-1260"></a><span class="sd">            (1) the exploration score after the edge rejections,</span>
+</span><span id="__span-0-1261"><a id="__codelineno-0-1261" name="__codelineno-0-1261"></a><span class="sd">            (2) the max-impact variable to explore next, if any,</span>
+</span><span id="__span-0-1262"><a id="__codelineno-0-1262" name="__codelineno-0-1262"></a><span class="sd">            (3) optionally a string representation of the graph, if `interactive` is False.</span>
+</span><span id="__span-0-1263"><a id="__codelineno-0-1263" name="__codelineno-0-1263"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1264"><a id="__codelineno-0-1264" name="__codelineno-0-1264"></a>    <span class="n">dst_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">dst</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1265"><a id="__codelineno-0-1265" name="__codelineno-0-1265"></a>    <span class="k">for</span> <span class="n">v</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variable_names</span><span class="p">:</span>
+</span><span id="__span-0-1266"><a id="__codelineno-0-1266" name="__codelineno-0-1266"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">get_edge_state</span><span class="p">(</span><span class="n">v</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">)</span> <span class="o">==</span> <span class="s2">&quot;Undecided&quot;</span><span class="p">:</span>
+</span><span id="__span-0-1267"><a id="__codelineno-0-1267" name="__codelineno-0-1267"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">mark_edge</span><span class="p">(</span><span class="n">v</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">,</span> <span class="s2">&quot;Rejected&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1268"><a id="__codelineno-0-1268" name="__codelineno-0-1268"></a>            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span> <span class="ow">and</span> <span class="n">also_ban</span><span class="p">:</span>
+</span><span id="__span-0-1269"><a id="__codelineno-0-1269" name="__codelineno-0-1269"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">ban_edge</span><span class="p">(</span><span class="n">v</span><span class="p">,</span> <span class="n">dst_name</span><span class="p">)</span>
+</span><span id="__span-0-1270"><a id="__codelineno-0-1270" name="__codelineno-0-1270"></a>
+</span><span id="__span-0-1271"><a id="__codelineno-0-1271" name="__codelineno-0-1271"></a>    <span class="k">if</span> <span class="n">interactive</span><span class="p">:</span>
+</span><span id="__span-0-1272"><a id="__codelineno-0-1272" name="__codelineno-0-1272"></a>        <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">display_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
+</span><span id="__span-0-1273"><a id="__codelineno-0-1273" name="__codelineno-0-1273"></a>
+</span><span id="__span-0-1274"><a id="__codelineno-0-1274" name="__codelineno-0-1274"></a>    <span class="k">return</span> <span class="p">(</span>
+</span><span id="__span-0-1275"><a id="__codelineno-0-1275" name="__codelineno-0-1275"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">exploration_score</span><span class="p">,</span>
+</span><span id="__span-0-1276"><a id="__codelineno-0-1276" name="__codelineno-0-1276"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">suggest_next_exploration</span><span class="p">(),</span>
+</span><span id="__span-0-1277"><a id="__codelineno-0-1277" name="__codelineno-0-1277"></a>        <span class="p">(</span>
+</span><span id="__span-0-1278"><a id="__codelineno-0-1278" name="__codelineno-0-1278"></a>            <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">draw_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
+</span><span id="__span-0-1279"><a id="__codelineno-0-1279" name="__codelineno-0-1279"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">interactive</span>
+</span><span id="__span-0-1280"><a id="__codelineno-0-1280" name="__codelineno-0-1280"></a>            <span class="k">else</span> <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-1281"><a id="__codelineno-0-1281" name="__codelineno-0-1281"></a>        <span class="p">),</span>
+</span><span id="__span-0-1282"><a id="__codelineno-0-1282" name="__codelineno-0-1282"></a>    <span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -9755,19 +9868,7 @@ <h3 id="logos.logos.LOGos.reject_undecided_outgoing" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1272">1272</a></span>
-<span class="normal"><a href="#__codelineno-0-1273">1273</a></span>
-<span class="normal"><a href="#__codelineno-0-1274">1274</a></span>
-<span class="normal"><a href="#__codelineno-0-1275">1275</a></span>
-<span class="normal"><a href="#__codelineno-0-1276">1276</a></span>
-<span class="normal"><a href="#__codelineno-0-1277">1277</a></span>
-<span class="normal"><a href="#__codelineno-0-1278">1278</a></span>
-<span class="normal"><a href="#__codelineno-0-1279">1279</a></span>
-<span class="normal"><a href="#__codelineno-0-1280">1280</a></span>
-<span class="normal"><a href="#__codelineno-0-1281">1281</a></span>
-<span class="normal"><a href="#__codelineno-0-1282">1282</a></span>
-<span class="normal"><a href="#__codelineno-0-1283">1283</a></span>
-<span class="normal"><a href="#__codelineno-0-1284">1284</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1284">1284</a></span>
 <span class="normal"><a href="#__codelineno-0-1285">1285</a></span>
 <span class="normal"><a href="#__codelineno-0-1286">1286</a></span>
 <span class="normal"><a href="#__codelineno-0-1287">1287</a></span>
@@ -9790,42 +9891,54 @@ <h3 id="logos.logos.LOGos.reject_undecided_outgoing" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-1304">1304</a></span>
 <span class="normal"><a href="#__codelineno-0-1305">1305</a></span>
 <span class="normal"><a href="#__codelineno-0-1306">1306</a></span>
-<span class="normal"><a href="#__codelineno-0-1307">1307</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1272"><a id="__codelineno-0-1272" name="__codelineno-0-1272"></a><span class="k">def</span> <span class="nf">reject_undecided_outgoing</span><span class="p">(</span>
-</span><span id="__span-0-1273"><a id="__codelineno-0-1273" name="__codelineno-0-1273"></a>    <span class="bp">self</span><span class="p">,</span> <span class="n">src</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">also_ban</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span> <span class="n">interactive</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span>
-</span><span id="__span-0-1274"><a id="__codelineno-0-1274" name="__codelineno-0-1274"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
-</span><span id="__span-0-1275"><a id="__codelineno-0-1275" name="__codelineno-0-1275"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1276"><a id="__codelineno-0-1276" name="__codelineno-0-1276"></a><span class="sd">    Mark all undecided outgoing edges from a variable as rejected.</span>
-</span><span id="__span-0-1277"><a id="__codelineno-0-1277" name="__codelineno-0-1277"></a>
-</span><span id="__span-0-1278"><a id="__codelineno-0-1278" name="__codelineno-0-1278"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-1279"><a id="__codelineno-0-1279" name="__codelineno-0-1279"></a><span class="sd">        src: The name or tag of the source variable.</span>
-</span><span id="__span-0-1280"><a id="__codelineno-0-1280" name="__codelineno-0-1280"></a><span class="sd">        also_ban: Whether to also ban the edges, for ECCS.</span>
-</span><span id="__span-0-1281"><a id="__codelineno-0-1281" name="__codelineno-0-1281"></a><span class="sd">        interactive: Whether to display the graph interactively after rejecting the edges.</span>
-</span><span id="__span-0-1282"><a id="__codelineno-0-1282" name="__codelineno-0-1282"></a>
-</span><span id="__span-0-1283"><a id="__codelineno-0-1283" name="__codelineno-0-1283"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-1284"><a id="__codelineno-0-1284" name="__codelineno-0-1284"></a><span class="sd">        A tuple containing:</span>
-</span><span id="__span-0-1285"><a id="__codelineno-0-1285" name="__codelineno-0-1285"></a><span class="sd">            (1) the exploration score after the edge rejections,</span>
-</span><span id="__span-0-1286"><a id="__codelineno-0-1286" name="__codelineno-0-1286"></a><span class="sd">            (2) the max-impact variable to explore next, if any,</span>
-</span><span id="__span-0-1287"><a id="__codelineno-0-1287" name="__codelineno-0-1287"></a><span class="sd">            (3) optionally a string representation of the graph, if `interactive` is False.</span>
-</span><span id="__span-0-1288"><a id="__codelineno-0-1288" name="__codelineno-0-1288"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1289"><a id="__codelineno-0-1289" name="__codelineno-0-1289"></a>    <span class="n">src_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">src</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1290"><a id="__codelineno-0-1290" name="__codelineno-0-1290"></a>    <span class="k">for</span> <span class="n">v</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variable_names</span><span class="p">:</span>
-</span><span id="__span-0-1291"><a id="__codelineno-0-1291" name="__codelineno-0-1291"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">get_edge_state</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">v</span><span class="p">)</span> <span class="o">==</span> <span class="s2">&quot;Undecided&quot;</span><span class="p">:</span>
-</span><span id="__span-0-1292"><a id="__codelineno-0-1292" name="__codelineno-0-1292"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">mark_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">v</span><span class="p">,</span> <span class="s2">&quot;Rejected&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1293"><a id="__codelineno-0-1293" name="__codelineno-0-1293"></a>            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span> <span class="ow">and</span> <span class="n">also_ban</span><span class="p">:</span>
-</span><span id="__span-0-1294"><a id="__codelineno-0-1294" name="__codelineno-0-1294"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">ban_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">v</span><span class="p">)</span>
-</span><span id="__span-0-1295"><a id="__codelineno-0-1295" name="__codelineno-0-1295"></a>
-</span><span id="__span-0-1296"><a id="__codelineno-0-1296" name="__codelineno-0-1296"></a>    <span class="k">if</span> <span class="n">interactive</span><span class="p">:</span>
-</span><span id="__span-0-1297"><a id="__codelineno-0-1297" name="__codelineno-0-1297"></a>        <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">display_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
-</span><span id="__span-0-1298"><a id="__codelineno-0-1298" name="__codelineno-0-1298"></a>
-</span><span id="__span-0-1299"><a id="__codelineno-0-1299" name="__codelineno-0-1299"></a>    <span class="k">return</span> <span class="p">(</span>
-</span><span id="__span-0-1300"><a id="__codelineno-0-1300" name="__codelineno-0-1300"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">exploration_score</span><span class="p">,</span>
-</span><span id="__span-0-1301"><a id="__codelineno-0-1301" name="__codelineno-0-1301"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">suggest_next_exploration</span><span class="p">(),</span>
-</span><span id="__span-0-1302"><a id="__codelineno-0-1302" name="__codelineno-0-1302"></a>        <span class="p">(</span>
-</span><span id="__span-0-1303"><a id="__codelineno-0-1303" name="__codelineno-0-1303"></a>            <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">draw_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
-</span><span id="__span-0-1304"><a id="__codelineno-0-1304" name="__codelineno-0-1304"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">interactive</span>
-</span><span id="__span-0-1305"><a id="__codelineno-0-1305" name="__codelineno-0-1305"></a>            <span class="k">else</span> <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-1306"><a id="__codelineno-0-1306" name="__codelineno-0-1306"></a>        <span class="p">),</span>
-</span><span id="__span-0-1307"><a id="__codelineno-0-1307" name="__codelineno-0-1307"></a>    <span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-1307">1307</a></span>
+<span class="normal"><a href="#__codelineno-0-1308">1308</a></span>
+<span class="normal"><a href="#__codelineno-0-1309">1309</a></span>
+<span class="normal"><a href="#__codelineno-0-1310">1310</a></span>
+<span class="normal"><a href="#__codelineno-0-1311">1311</a></span>
+<span class="normal"><a href="#__codelineno-0-1312">1312</a></span>
+<span class="normal"><a href="#__codelineno-0-1313">1313</a></span>
+<span class="normal"><a href="#__codelineno-0-1314">1314</a></span>
+<span class="normal"><a href="#__codelineno-0-1315">1315</a></span>
+<span class="normal"><a href="#__codelineno-0-1316">1316</a></span>
+<span class="normal"><a href="#__codelineno-0-1317">1317</a></span>
+<span class="normal"><a href="#__codelineno-0-1318">1318</a></span>
+<span class="normal"><a href="#__codelineno-0-1319">1319</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1284"><a id="__codelineno-0-1284" name="__codelineno-0-1284"></a><span class="k">def</span> <span class="nf">reject_undecided_outgoing</span><span class="p">(</span>
+</span><span id="__span-0-1285"><a id="__codelineno-0-1285" name="__codelineno-0-1285"></a>    <span class="bp">self</span><span class="p">,</span> <span class="n">src</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">also_ban</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span> <span class="n">interactive</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span>
+</span><span id="__span-0-1286"><a id="__codelineno-0-1286" name="__codelineno-0-1286"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
+</span><span id="__span-0-1287"><a id="__codelineno-0-1287" name="__codelineno-0-1287"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1288"><a id="__codelineno-0-1288" name="__codelineno-0-1288"></a><span class="sd">    Mark all undecided outgoing edges from a variable as rejected.</span>
+</span><span id="__span-0-1289"><a id="__codelineno-0-1289" name="__codelineno-0-1289"></a>
+</span><span id="__span-0-1290"><a id="__codelineno-0-1290" name="__codelineno-0-1290"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-1291"><a id="__codelineno-0-1291" name="__codelineno-0-1291"></a><span class="sd">        src: The name or tag of the source variable.</span>
+</span><span id="__span-0-1292"><a id="__codelineno-0-1292" name="__codelineno-0-1292"></a><span class="sd">        also_ban: Whether to also ban the edges, for ECCS.</span>
+</span><span id="__span-0-1293"><a id="__codelineno-0-1293" name="__codelineno-0-1293"></a><span class="sd">        interactive: Whether to display the graph interactively after rejecting the edges.</span>
+</span><span id="__span-0-1294"><a id="__codelineno-0-1294" name="__codelineno-0-1294"></a>
+</span><span id="__span-0-1295"><a id="__codelineno-0-1295" name="__codelineno-0-1295"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-1296"><a id="__codelineno-0-1296" name="__codelineno-0-1296"></a><span class="sd">        A tuple containing:</span>
+</span><span id="__span-0-1297"><a id="__codelineno-0-1297" name="__codelineno-0-1297"></a><span class="sd">            (1) the exploration score after the edge rejections,</span>
+</span><span id="__span-0-1298"><a id="__codelineno-0-1298" name="__codelineno-0-1298"></a><span class="sd">            (2) the max-impact variable to explore next, if any,</span>
+</span><span id="__span-0-1299"><a id="__codelineno-0-1299" name="__codelineno-0-1299"></a><span class="sd">            (3) optionally a string representation of the graph, if `interactive` is False.</span>
+</span><span id="__span-0-1300"><a id="__codelineno-0-1300" name="__codelineno-0-1300"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1301"><a id="__codelineno-0-1301" name="__codelineno-0-1301"></a>    <span class="n">src_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">src</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1302"><a id="__codelineno-0-1302" name="__codelineno-0-1302"></a>    <span class="k">for</span> <span class="n">v</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variable_names</span><span class="p">:</span>
+</span><span id="__span-0-1303"><a id="__codelineno-0-1303" name="__codelineno-0-1303"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">get_edge_state</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">v</span><span class="p">)</span> <span class="o">==</span> <span class="s2">&quot;Undecided&quot;</span><span class="p">:</span>
+</span><span id="__span-0-1304"><a id="__codelineno-0-1304" name="__codelineno-0-1304"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">mark_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">v</span><span class="p">,</span> <span class="s2">&quot;Rejected&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1305"><a id="__codelineno-0-1305" name="__codelineno-0-1305"></a>            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span> <span class="ow">and</span> <span class="n">also_ban</span><span class="p">:</span>
+</span><span id="__span-0-1306"><a id="__codelineno-0-1306" name="__codelineno-0-1306"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">ban_edge</span><span class="p">(</span><span class="n">src_name</span><span class="p">,</span> <span class="n">v</span><span class="p">)</span>
+</span><span id="__span-0-1307"><a id="__codelineno-0-1307" name="__codelineno-0-1307"></a>
+</span><span id="__span-0-1308"><a id="__codelineno-0-1308" name="__codelineno-0-1308"></a>    <span class="k">if</span> <span class="n">interactive</span><span class="p">:</span>
+</span><span id="__span-0-1309"><a id="__codelineno-0-1309" name="__codelineno-0-1309"></a>        <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">display_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
+</span><span id="__span-0-1310"><a id="__codelineno-0-1310" name="__codelineno-0-1310"></a>
+</span><span id="__span-0-1311"><a id="__codelineno-0-1311" name="__codelineno-0-1311"></a>    <span class="k">return</span> <span class="p">(</span>
+</span><span id="__span-0-1312"><a id="__codelineno-0-1312" name="__codelineno-0-1312"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">exploration_score</span><span class="p">,</span>
+</span><span id="__span-0-1313"><a id="__codelineno-0-1313" name="__codelineno-0-1313"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">suggest_next_exploration</span><span class="p">(),</span>
+</span><span id="__span-0-1314"><a id="__codelineno-0-1314" name="__codelineno-0-1314"></a>        <span class="p">(</span>
+</span><span id="__span-0-1315"><a id="__codelineno-0-1315" name="__codelineno-0-1315"></a>            <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">draw_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">)</span>
+</span><span id="__span-0-1316"><a id="__codelineno-0-1316" name="__codelineno-0-1316"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">interactive</span>
+</span><span id="__span-0-1317"><a id="__codelineno-0-1317" name="__codelineno-0-1317"></a>            <span class="k">else</span> <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-1318"><a id="__codelineno-0-1318" name="__codelineno-0-1318"></a>        <span class="p">),</span>
+</span><span id="__span-0-1319"><a id="__codelineno-0-1319" name="__codelineno-0-1319"></a>    <span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -9931,19 +10044,7 @@ <h3 id="logos.logos.LOGos.reject_all_prunable_edges" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1309">1309</a></span>
-<span class="normal"><a href="#__codelineno-0-1310">1310</a></span>
-<span class="normal"><a href="#__codelineno-0-1311">1311</a></span>
-<span class="normal"><a href="#__codelineno-0-1312">1312</a></span>
-<span class="normal"><a href="#__codelineno-0-1313">1313</a></span>
-<span class="normal"><a href="#__codelineno-0-1314">1314</a></span>
-<span class="normal"><a href="#__codelineno-0-1315">1315</a></span>
-<span class="normal"><a href="#__codelineno-0-1316">1316</a></span>
-<span class="normal"><a href="#__codelineno-0-1317">1317</a></span>
-<span class="normal"><a href="#__codelineno-0-1318">1318</a></span>
-<span class="normal"><a href="#__codelineno-0-1319">1319</a></span>
-<span class="normal"><a href="#__codelineno-0-1320">1320</a></span>
-<span class="normal"><a href="#__codelineno-0-1321">1321</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1321">1321</a></span>
 <span class="normal"><a href="#__codelineno-0-1322">1322</a></span>
 <span class="normal"><a href="#__codelineno-0-1323">1323</a></span>
 <span class="normal"><a href="#__codelineno-0-1324">1324</a></span>
@@ -9981,57 +10082,69 @@ <h3 id="logos.logos.LOGos.reject_all_prunable_edges" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-1356">1356</a></span>
 <span class="normal"><a href="#__codelineno-0-1357">1357</a></span>
 <span class="normal"><a href="#__codelineno-0-1358">1358</a></span>
-<span class="normal"><a href="#__codelineno-0-1359">1359</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1309"><a id="__codelineno-0-1309" name="__codelineno-0-1309"></a><span class="k">def</span> <span class="nf">reject_all_prunable_edges</span><span class="p">(</span>
-</span><span id="__span-0-1310"><a id="__codelineno-0-1310" name="__codelineno-0-1310"></a>    <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-1311"><a id="__codelineno-0-1311" name="__codelineno-0-1311"></a>    <span class="n">also_ban</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
-</span><span id="__span-0-1312"><a id="__codelineno-0-1312" name="__codelineno-0-1312"></a>    <span class="n">lasso_alpha</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="n">Pruner</span><span class="o">.</span><span class="n">LASSO_DEFAULT_ALPHA</span><span class="p">,</span>
-</span><span id="__span-0-1313"><a id="__codelineno-0-1313" name="__codelineno-0-1313"></a>    <span class="n">lasso_max_iter</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="n">Pruner</span><span class="o">.</span><span class="n">LASSO_DEFAULT_MAX_ITER</span><span class="p">,</span>
-</span><span id="__span-0-1314"><a id="__codelineno-0-1314" name="__codelineno-0-1314"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
-</span><span id="__span-0-1315"><a id="__codelineno-0-1315" name="__codelineno-0-1315"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1316"><a id="__codelineno-0-1316" name="__codelineno-0-1316"></a><span class="sd">    For every prepared variable, reject all incoming edges that start at a variable</span>
-</span><span id="__span-0-1317"><a id="__codelineno-0-1317" name="__codelineno-0-1317"></a><span class="sd">    that is pruned by our pruning approach. This may be time-consuming depending on the number of variables.</span>
-</span><span id="__span-0-1318"><a id="__codelineno-0-1318" name="__codelineno-0-1318"></a>
-</span><span id="__span-0-1319"><a id="__codelineno-0-1319" name="__codelineno-0-1319"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-1320"><a id="__codelineno-0-1320" name="__codelineno-0-1320"></a><span class="sd">        also_ban: Whether to also ban the edges, for ECCS.</span>
-</span><span id="__span-0-1321"><a id="__codelineno-0-1321" name="__codelineno-0-1321"></a><span class="sd">        lasso_alpha: The alpha parameter to be used for Lasso regression.</span>
-</span><span id="__span-0-1322"><a id="__codelineno-0-1322" name="__codelineno-0-1322"></a><span class="sd">        lasso_max_iter: The maximum number of iterations to be used for Lasso regression.</span>
-</span><span id="__span-0-1323"><a id="__codelineno-0-1323" name="__codelineno-0-1323"></a>
-</span><span id="__span-0-1324"><a id="__codelineno-0-1324" name="__codelineno-0-1324"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-1325"><a id="__codelineno-0-1325" name="__codelineno-0-1325"></a><span class="sd">        A tuple containing:</span>
-</span><span id="__span-0-1326"><a id="__codelineno-0-1326" name="__codelineno-0-1326"></a><span class="sd">            (1) the exploration score after the edge rejections,</span>
-</span><span id="__span-0-1327"><a id="__codelineno-0-1327" name="__codelineno-0-1327"></a><span class="sd">            (2) the max-impact variable to explore next, if any,</span>
-</span><span id="__span-0-1328"><a id="__codelineno-0-1328" name="__codelineno-0-1328"></a><span class="sd">            (3) optionally a string representation of the graph, if `interactive` is False.</span>
-</span><span id="__span-0-1329"><a id="__codelineno-0-1329" name="__codelineno-0-1329"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1330"><a id="__codelineno-0-1330" name="__codelineno-0-1330"></a>    <span class="n">num_processors</span> <span class="o">=</span> <span class="n">multiprocessing</span><span class="o">.</span><span class="n">cpu_count</span><span class="p">()</span>
-</span><span id="__span-0-1331"><a id="__codelineno-0-1331" name="__codelineno-0-1331"></a>    <span class="k">with</span> <span class="n">multiprocessing</span><span class="o">.</span><span class="n">Pool</span><span class="p">(</span><span class="n">processes</span><span class="o">=</span><span class="n">num_processors</span><span class="p">)</span> <span class="k">as</span> <span class="n">pool</span><span class="p">:</span>
-</span><span id="__span-0-1332"><a id="__codelineno-0-1332" name="__codelineno-0-1332"></a>        <span class="n">all_candidates</span> <span class="o">=</span> <span class="n">pool</span><span class="o">.</span><span class="n">starmap</span><span class="p">(</span>
-</span><span id="__span-0-1333"><a id="__codelineno-0-1333" name="__codelineno-0-1333"></a>            <span class="n">Pruner</span><span class="o">.</span><span class="n">prune_with_lasso</span><span class="p">,</span>
-</span><span id="__span-0-1334"><a id="__codelineno-0-1334" name="__codelineno-0-1334"></a>            <span class="n">tqdm</span><span class="p">(</span>
-</span><span id="__span-0-1335"><a id="__codelineno-0-1335" name="__codelineno-0-1335"></a>                <span class="p">[</span>
-</span><span id="__span-0-1336"><a id="__codelineno-0-1336" name="__codelineno-0-1336"></a>                    <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span> <span class="p">[</span><span class="n">target</span><span class="p">],</span> <span class="n">lasso_alpha</span><span class="p">,</span> <span class="n">lasso_max_iter</span><span class="p">)</span>
-</span><span id="__span-0-1337"><a id="__codelineno-0-1337" name="__codelineno-0-1337"></a>                    <span class="k">for</span> <span class="n">target</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variable_names</span>
-</span><span id="__span-0-1338"><a id="__codelineno-0-1338" name="__codelineno-0-1338"></a>                <span class="p">],</span>
-</span><span id="__span-0-1339"><a id="__codelineno-0-1339" name="__codelineno-0-1339"></a>                <span class="n">total</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">num_prepared_variables</span><span class="p">,</span>
-</span><span id="__span-0-1340"><a id="__codelineno-0-1340" name="__codelineno-0-1340"></a>                <span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Finding pruned variables...&quot;</span><span class="p">,</span>
-</span><span id="__span-0-1341"><a id="__codelineno-0-1341" name="__codelineno-0-1341"></a>            <span class="p">),</span>
-</span><span id="__span-0-1342"><a id="__codelineno-0-1342" name="__codelineno-0-1342"></a>        <span class="p">)</span>
-</span><span id="__span-0-1343"><a id="__codelineno-0-1343" name="__codelineno-0-1343"></a>
-</span><span id="__span-0-1344"><a id="__codelineno-0-1344" name="__codelineno-0-1344"></a>    <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="n">all_candidates</span><span class="p">)</span>
-</span><span id="__span-0-1345"><a id="__codelineno-0-1345" name="__codelineno-0-1345"></a>
-</span><span id="__span-0-1346"><a id="__codelineno-0-1346" name="__codelineno-0-1346"></a>    <span class="k">for</span> <span class="n">candidates</span><span class="p">,</span> <span class="n">target</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">all_candidates</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variable_names</span><span class="p">):</span>
-</span><span id="__span-0-1347"><a id="__codelineno-0-1347" name="__codelineno-0-1347"></a>        <span class="n">non_candidates</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-1348"><a id="__codelineno-0-1348" name="__codelineno-0-1348"></a>            <span class="nb">set</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span><span class="p">)</span> <span class="o">-</span> <span class="nb">set</span><span class="p">(</span><span class="n">candidates</span><span class="p">)</span> <span class="o">-</span> <span class="nb">set</span><span class="p">([</span><span class="n">target</span><span class="p">])</span>
-</span><span id="__span-0-1349"><a id="__codelineno-0-1349" name="__codelineno-0-1349"></a>        <span class="p">)</span>
-</span><span id="__span-0-1350"><a id="__codelineno-0-1350" name="__codelineno-0-1350"></a>        <span class="k">for</span> <span class="n">nc</span> <span class="ow">in</span> <span class="n">non_candidates</span><span class="p">:</span>
-</span><span id="__span-0-1351"><a id="__codelineno-0-1351" name="__codelineno-0-1351"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">mark_edge</span><span class="p">(</span><span class="n">nc</span><span class="p">,</span> <span class="n">target</span><span class="p">,</span> <span class="s2">&quot;Rejected&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1352"><a id="__codelineno-0-1352" name="__codelineno-0-1352"></a>            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span> <span class="ow">and</span> <span class="n">also_ban</span><span class="p">:</span>
-</span><span id="__span-0-1353"><a id="__codelineno-0-1353" name="__codelineno-0-1353"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">ban_edge</span><span class="p">(</span><span class="n">nc</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>
-</span><span id="__span-0-1354"><a id="__codelineno-0-1354" name="__codelineno-0-1354"></a>
-</span><span id="__span-0-1355"><a id="__codelineno-0-1355" name="__codelineno-0-1355"></a>    <span class="k">return</span> <span class="p">(</span>
-</span><span id="__span-0-1356"><a id="__codelineno-0-1356" name="__codelineno-0-1356"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">exploration_score</span><span class="p">,</span>
-</span><span id="__span-0-1357"><a id="__codelineno-0-1357" name="__codelineno-0-1357"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">suggest_next_exploration</span><span class="p">(),</span>
-</span><span id="__span-0-1358"><a id="__codelineno-0-1358" name="__codelineno-0-1358"></a>        <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">draw_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">),</span>
-</span><span id="__span-0-1359"><a id="__codelineno-0-1359" name="__codelineno-0-1359"></a>    <span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-1359">1359</a></span>
+<span class="normal"><a href="#__codelineno-0-1360">1360</a></span>
+<span class="normal"><a href="#__codelineno-0-1361">1361</a></span>
+<span class="normal"><a href="#__codelineno-0-1362">1362</a></span>
+<span class="normal"><a href="#__codelineno-0-1363">1363</a></span>
+<span class="normal"><a href="#__codelineno-0-1364">1364</a></span>
+<span class="normal"><a href="#__codelineno-0-1365">1365</a></span>
+<span class="normal"><a href="#__codelineno-0-1366">1366</a></span>
+<span class="normal"><a href="#__codelineno-0-1367">1367</a></span>
+<span class="normal"><a href="#__codelineno-0-1368">1368</a></span>
+<span class="normal"><a href="#__codelineno-0-1369">1369</a></span>
+<span class="normal"><a href="#__codelineno-0-1370">1370</a></span>
+<span class="normal"><a href="#__codelineno-0-1371">1371</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1321"><a id="__codelineno-0-1321" name="__codelineno-0-1321"></a><span class="k">def</span> <span class="nf">reject_all_prunable_edges</span><span class="p">(</span>
+</span><span id="__span-0-1322"><a id="__codelineno-0-1322" name="__codelineno-0-1322"></a>    <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-1323"><a id="__codelineno-0-1323" name="__codelineno-0-1323"></a>    <span class="n">also_ban</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
+</span><span id="__span-0-1324"><a id="__codelineno-0-1324" name="__codelineno-0-1324"></a>    <span class="n">lasso_alpha</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="n">Pruner</span><span class="o">.</span><span class="n">LASSO_DEFAULT_ALPHA</span><span class="p">,</span>
+</span><span id="__span-0-1325"><a id="__codelineno-0-1325" name="__codelineno-0-1325"></a>    <span class="n">lasso_max_iter</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="n">Pruner</span><span class="o">.</span><span class="n">LASSO_DEFAULT_MAX_ITER</span><span class="p">,</span>
+</span><span id="__span-0-1326"><a id="__codelineno-0-1326" name="__codelineno-0-1326"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
+</span><span id="__span-0-1327"><a id="__codelineno-0-1327" name="__codelineno-0-1327"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1328"><a id="__codelineno-0-1328" name="__codelineno-0-1328"></a><span class="sd">    For every prepared variable, reject all incoming edges that start at a variable</span>
+</span><span id="__span-0-1329"><a id="__codelineno-0-1329" name="__codelineno-0-1329"></a><span class="sd">    that is pruned by our pruning approach. This may be time-consuming depending on the number of variables.</span>
+</span><span id="__span-0-1330"><a id="__codelineno-0-1330" name="__codelineno-0-1330"></a>
+</span><span id="__span-0-1331"><a id="__codelineno-0-1331" name="__codelineno-0-1331"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-1332"><a id="__codelineno-0-1332" name="__codelineno-0-1332"></a><span class="sd">        also_ban: Whether to also ban the edges, for ECCS.</span>
+</span><span id="__span-0-1333"><a id="__codelineno-0-1333" name="__codelineno-0-1333"></a><span class="sd">        lasso_alpha: The alpha parameter to be used for Lasso regression.</span>
+</span><span id="__span-0-1334"><a id="__codelineno-0-1334" name="__codelineno-0-1334"></a><span class="sd">        lasso_max_iter: The maximum number of iterations to be used for Lasso regression.</span>
+</span><span id="__span-0-1335"><a id="__codelineno-0-1335" name="__codelineno-0-1335"></a>
+</span><span id="__span-0-1336"><a id="__codelineno-0-1336" name="__codelineno-0-1336"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-1337"><a id="__codelineno-0-1337" name="__codelineno-0-1337"></a><span class="sd">        A tuple containing:</span>
+</span><span id="__span-0-1338"><a id="__codelineno-0-1338" name="__codelineno-0-1338"></a><span class="sd">            (1) the exploration score after the edge rejections,</span>
+</span><span id="__span-0-1339"><a id="__codelineno-0-1339" name="__codelineno-0-1339"></a><span class="sd">            (2) the max-impact variable to explore next, if any,</span>
+</span><span id="__span-0-1340"><a id="__codelineno-0-1340" name="__codelineno-0-1340"></a><span class="sd">            (3) optionally a string representation of the graph, if `interactive` is False.</span>
+</span><span id="__span-0-1341"><a id="__codelineno-0-1341" name="__codelineno-0-1341"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1342"><a id="__codelineno-0-1342" name="__codelineno-0-1342"></a>    <span class="n">num_processors</span> <span class="o">=</span> <span class="n">multiprocessing</span><span class="o">.</span><span class="n">cpu_count</span><span class="p">()</span>
+</span><span id="__span-0-1343"><a id="__codelineno-0-1343" name="__codelineno-0-1343"></a>    <span class="k">with</span> <span class="n">multiprocessing</span><span class="o">.</span><span class="n">Pool</span><span class="p">(</span><span class="n">processes</span><span class="o">=</span><span class="n">num_processors</span><span class="p">)</span> <span class="k">as</span> <span class="n">pool</span><span class="p">:</span>
+</span><span id="__span-0-1344"><a id="__codelineno-0-1344" name="__codelineno-0-1344"></a>        <span class="n">all_candidates</span> <span class="o">=</span> <span class="n">pool</span><span class="o">.</span><span class="n">starmap</span><span class="p">(</span>
+</span><span id="__span-0-1345"><a id="__codelineno-0-1345" name="__codelineno-0-1345"></a>            <span class="n">Pruner</span><span class="o">.</span><span class="n">prune_with_lasso</span><span class="p">,</span>
+</span><span id="__span-0-1346"><a id="__codelineno-0-1346" name="__codelineno-0-1346"></a>            <span class="n">tqdm</span><span class="p">(</span>
+</span><span id="__span-0-1347"><a id="__codelineno-0-1347" name="__codelineno-0-1347"></a>                <span class="p">[</span>
+</span><span id="__span-0-1348"><a id="__codelineno-0-1348" name="__codelineno-0-1348"></a>                    <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span> <span class="p">[</span><span class="n">target</span><span class="p">],</span> <span class="n">lasso_alpha</span><span class="p">,</span> <span class="n">lasso_max_iter</span><span class="p">)</span>
+</span><span id="__span-0-1349"><a id="__codelineno-0-1349" name="__codelineno-0-1349"></a>                    <span class="k">for</span> <span class="n">target</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variable_names</span>
+</span><span id="__span-0-1350"><a id="__codelineno-0-1350" name="__codelineno-0-1350"></a>                <span class="p">],</span>
+</span><span id="__span-0-1351"><a id="__codelineno-0-1351" name="__codelineno-0-1351"></a>                <span class="n">total</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">num_prepared_variables</span><span class="p">,</span>
+</span><span id="__span-0-1352"><a id="__codelineno-0-1352" name="__codelineno-0-1352"></a>                <span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Finding pruned variables...&quot;</span><span class="p">,</span>
+</span><span id="__span-0-1353"><a id="__codelineno-0-1353" name="__codelineno-0-1353"></a>            <span class="p">),</span>
+</span><span id="__span-0-1354"><a id="__codelineno-0-1354" name="__codelineno-0-1354"></a>        <span class="p">)</span>
+</span><span id="__span-0-1355"><a id="__codelineno-0-1355" name="__codelineno-0-1355"></a>
+</span><span id="__span-0-1356"><a id="__codelineno-0-1356" name="__codelineno-0-1356"></a>    <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="n">all_candidates</span><span class="p">)</span>
+</span><span id="__span-0-1357"><a id="__codelineno-0-1357" name="__codelineno-0-1357"></a>
+</span><span id="__span-0-1358"><a id="__codelineno-0-1358" name="__codelineno-0-1358"></a>    <span class="k">for</span> <span class="n">candidates</span><span class="p">,</span> <span class="n">target</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">all_candidates</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variable_names</span><span class="p">):</span>
+</span><span id="__span-0-1359"><a id="__codelineno-0-1359" name="__codelineno-0-1359"></a>        <span class="n">non_candidates</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-1360"><a id="__codelineno-0-1360" name="__codelineno-0-1360"></a>            <span class="nb">set</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="o">.</span><span class="n">columns</span><span class="p">)</span> <span class="o">-</span> <span class="nb">set</span><span class="p">(</span><span class="n">candidates</span><span class="p">)</span> <span class="o">-</span> <span class="nb">set</span><span class="p">([</span><span class="n">target</span><span class="p">])</span>
+</span><span id="__span-0-1361"><a id="__codelineno-0-1361" name="__codelineno-0-1361"></a>        <span class="p">)</span>
+</span><span id="__span-0-1362"><a id="__codelineno-0-1362" name="__codelineno-0-1362"></a>        <span class="k">for</span> <span class="n">nc</span> <span class="ow">in</span> <span class="n">non_candidates</span><span class="p">:</span>
+</span><span id="__span-0-1363"><a id="__codelineno-0-1363" name="__codelineno-0-1363"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">mark_edge</span><span class="p">(</span><span class="n">nc</span><span class="p">,</span> <span class="n">target</span><span class="p">,</span> <span class="s2">&quot;Rejected&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1364"><a id="__codelineno-0-1364" name="__codelineno-0-1364"></a>            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span> <span class="ow">and</span> <span class="n">also_ban</span><span class="p">:</span>
+</span><span id="__span-0-1365"><a id="__codelineno-0-1365" name="__codelineno-0-1365"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="o">.</span><span class="n">ban_edge</span><span class="p">(</span><span class="n">nc</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>
+</span><span id="__span-0-1366"><a id="__codelineno-0-1366" name="__codelineno-0-1366"></a>
+</span><span id="__span-0-1367"><a id="__codelineno-0-1367" name="__codelineno-0-1367"></a>    <span class="k">return</span> <span class="p">(</span>
+</span><span id="__span-0-1368"><a id="__codelineno-0-1368" name="__codelineno-0-1368"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">exploration_score</span><span class="p">,</span>
+</span><span id="__span-0-1369"><a id="__codelineno-0-1369" name="__codelineno-0-1369"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">suggest_next_exploration</span><span class="p">(),</span>
+</span><span id="__span-0-1370"><a id="__codelineno-0-1370" name="__codelineno-0-1370"></a>        <span class="n">GraphRenderer</span><span class="o">.</span><span class="n">draw_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">),</span>
+</span><span id="__span-0-1371"><a id="__codelineno-0-1371" name="__codelineno-0-1371"></a>    <span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -10191,19 +10304,7 @@ <h3 id="logos.logos.LOGos.rank_candidate_causes" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1396">1396</a></span>
-<span class="normal"><a href="#__codelineno-0-1397">1397</a></span>
-<span class="normal"><a href="#__codelineno-0-1398">1398</a></span>
-<span class="normal"><a href="#__codelineno-0-1399">1399</a></span>
-<span class="normal"><a href="#__codelineno-0-1400">1400</a></span>
-<span class="normal"><a href="#__codelineno-0-1401">1401</a></span>
-<span class="normal"><a href="#__codelineno-0-1402">1402</a></span>
-<span class="normal"><a href="#__codelineno-0-1403">1403</a></span>
-<span class="normal"><a href="#__codelineno-0-1404">1404</a></span>
-<span class="normal"><a href="#__codelineno-0-1405">1405</a></span>
-<span class="normal"><a href="#__codelineno-0-1406">1406</a></span>
-<span class="normal"><a href="#__codelineno-0-1407">1407</a></span>
-<span class="normal"><a href="#__codelineno-0-1408">1408</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1408">1408</a></span>
 <span class="normal"><a href="#__codelineno-0-1409">1409</a></span>
 <span class="normal"><a href="#__codelineno-0-1410">1410</a></span>
 <span class="normal"><a href="#__codelineno-0-1411">1411</a></span>
@@ -10278,94 +10379,106 @@ <h3 id="logos.logos.LOGos.rank_candidate_causes" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-1480">1480</a></span>
 <span class="normal"><a href="#__codelineno-0-1481">1481</a></span>
 <span class="normal"><a href="#__codelineno-0-1482">1482</a></span>
-<span class="normal"><a href="#__codelineno-0-1483">1483</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1396"><a id="__codelineno-0-1396" name="__codelineno-0-1396"></a><span class="k">def</span> <span class="nf">rank_candidate_causes</span><span class="p">(</span>
-</span><span id="__span-0-1397"><a id="__codelineno-0-1397" name="__codelineno-0-1397"></a>    <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-1398"><a id="__codelineno-0-1398" name="__codelineno-0-1398"></a>    <span class="n">target</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-1399"><a id="__codelineno-0-1399" name="__codelineno-0-1399"></a>    <span class="n">ignore</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">List</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-1400"><a id="__codelineno-0-1400" name="__codelineno-0-1400"></a>    <span class="n">method</span><span class="p">:</span> <span class="n">CandidateCauseRankerMethod</span> <span class="o">=</span> <span class="n">CandidateCauseRankerMethod</span><span class="o">.</span><span class="n">LOGOS</span><span class="p">,</span>
-</span><span id="__span-0-1401"><a id="__codelineno-0-1401" name="__codelineno-0-1401"></a>    <span class="n">prune_candidates</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="__span-0-1402"><a id="__codelineno-0-1402" name="__codelineno-0-1402"></a>    <span class="n">lasso_alpha</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="n">Pruner</span><span class="o">.</span><span class="n">LASSO_DEFAULT_ALPHA</span><span class="p">,</span>
-</span><span id="__span-0-1403"><a id="__codelineno-0-1403" name="__codelineno-0-1403"></a>    <span class="n">lasso_max_iter</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="n">Pruner</span><span class="o">.</span><span class="n">LASSO_DEFAULT_MAX_ITER</span><span class="p">,</span>
-</span><span id="__span-0-1404"><a id="__codelineno-0-1404" name="__codelineno-0-1404"></a>    <span class="n">model</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;gpt-4o-mini-2024-07-18&quot;</span><span class="p">,</span>
-</span><span id="__span-0-1405"><a id="__codelineno-0-1405" name="__codelineno-0-1405"></a>    <span class="n">gpt_log_path</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-1406"><a id="__codelineno-0-1406" name="__codelineno-0-1406"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="nb">str</span><span class="p">]:</span>
-</span><span id="__span-0-1407"><a id="__codelineno-0-1407" name="__codelineno-0-1407"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1408"><a id="__codelineno-0-1408" name="__codelineno-0-1408"></a><span class="sd">    Present the user with ranked candidate causes for `target`. If no `target`</span>
-</span><span id="__span-0-1409"><a id="__codelineno-0-1409" name="__codelineno-0-1409"></a><span class="sd">    is specified, the most recent suggestion of `suggest_next_exploration()` is used, if any.</span>
-</span><span id="__span-0-1410"><a id="__codelineno-0-1410" name="__codelineno-0-1410"></a><span class="sd">    If `ignore` is specified, the variables in `ignore` are not considered as candidate causes.</span>
-</span><span id="__span-0-1411"><a id="__codelineno-0-1411" name="__codelineno-0-1411"></a>
-</span><span id="__span-0-1412"><a id="__codelineno-0-1412" name="__codelineno-0-1412"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-1413"><a id="__codelineno-0-1413" name="__codelineno-0-1413"></a><span class="sd">        target: The name or tag of the target variable.</span>
-</span><span id="__span-0-1414"><a id="__codelineno-0-1414" name="__codelineno-0-1414"></a><span class="sd">        ignore: A list of variables to ignore.</span>
-</span><span id="__span-0-1415"><a id="__codelineno-0-1415" name="__codelineno-0-1415"></a><span class="sd">        method: The method to use for ranking candidate causes.</span>
-</span><span id="__span-0-1416"><a id="__codelineno-0-1416" name="__codelineno-0-1416"></a><span class="sd">        prune_candidates: Whether to prune the candidate causes using Lasso regression. Only</span>
-</span><span id="__span-0-1417"><a id="__codelineno-0-1417" name="__codelineno-0-1417"></a><span class="sd">            applies if `method` is `CandidateCauseRankerMethod.LOGOS`.</span>
-</span><span id="__span-0-1418"><a id="__codelineno-0-1418" name="__codelineno-0-1418"></a><span class="sd">        lasso_alpha: The alpha parameter to be used for Lasso regression. Only applies if</span>
-</span><span id="__span-0-1419"><a id="__codelineno-0-1419" name="__codelineno-0-1419"></a><span class="sd">            `method` is `CandidateCauseRankerMethod.LOGOS` and `prune_candidates` is True.</span>
-</span><span id="__span-0-1420"><a id="__codelineno-0-1420" name="__codelineno-0-1420"></a><span class="sd">        lasso_max_iter: The maximum number of iterations to be used for Lasso regression. Only</span>
-</span><span id="__span-0-1421"><a id="__codelineno-0-1421" name="__codelineno-0-1421"></a><span class="sd">            applies if `method` is `CandidateCauseRankerMethod.LOGOS` and `prune_candidates` is True.</span>
-</span><span id="__span-0-1422"><a id="__codelineno-0-1422" name="__codelineno-0-1422"></a><span class="sd">        model: The model to use for the langmodel method. Only applies if the method is</span>
-</span><span id="__span-0-1423"><a id="__codelineno-0-1423" name="__codelineno-0-1423"></a><span class="sd">            `CandidateCauseRankerMethod.LANGMODEL`.</span>
-</span><span id="__span-0-1424"><a id="__codelineno-0-1424" name="__codelineno-0-1424"></a><span class="sd">        gpt_log_path: The path to the log file to use for the langmodel method. Only applies if</span>
-</span><span id="__span-0-1425"><a id="__codelineno-0-1425" name="__codelineno-0-1425"></a><span class="sd">            the method is `CandidateCauseRankerMethod.LANGMODEL`.</span>
-</span><span id="__span-0-1426"><a id="__codelineno-0-1426" name="__codelineno-0-1426"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-1427"><a id="__codelineno-0-1427" name="__codelineno-0-1427"></a><span class="sd">        A tuple containing:</span>
-</span><span id="__span-0-1428"><a id="__codelineno-0-1428" name="__codelineno-0-1428"></a><span class="sd">        (1) A dataframe containing the candidate causes for `target` and</span>
-</span><span id="__span-0-1429"><a id="__codelineno-0-1429" name="__codelineno-0-1429"></a><span class="sd">        (2) The time elapsed for exploration, as a string.</span>
-</span><span id="__span-0-1430"><a id="__codelineno-0-1430" name="__codelineno-0-1430"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1431"><a id="__codelineno-0-1431" name="__codelineno-0-1431"></a>
-</span><span id="__span-0-1432"><a id="__codelineno-0-1432" name="__codelineno-0-1432"></a>    <span class="n">start_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
-</span><span id="__span-0-1433"><a id="__codelineno-0-1433" name="__codelineno-0-1433"></a>
-</span><span id="__span-0-1434"><a id="__codelineno-0-1434" name="__codelineno-0-1434"></a>    <span class="c1"># Handle the case where the user has not specified a target.</span>
-</span><span id="__span-0-1435"><a id="__codelineno-0-1435" name="__codelineno-0-1435"></a>    <span class="k">if</span> <span class="n">target</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-1436"><a id="__codelineno-0-1436" name="__codelineno-0-1436"></a>        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;No target specified.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1437"><a id="__codelineno-0-1437" name="__codelineno-0-1437"></a>        <span class="k">return</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">columns</span><span class="o">=</span><span class="n">CandidateCauseRanker</span><span class="o">.</span><span class="n">COLUMN_ORDER</span><span class="p">),</span> <span class="s2">&quot;&quot;</span>
-</span><span id="__span-0-1438"><a id="__codelineno-0-1438" name="__codelineno-0-1438"></a>    <span class="k">elif</span> <span class="n">target</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-1439"><a id="__codelineno-0-1439" name="__codelineno-0-1439"></a>        <span class="n">target</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span>
-</span><span id="__span-0-1440"><a id="__codelineno-0-1440" name="__codelineno-0-1440"></a>
-</span><span id="__span-0-1441"><a id="__codelineno-0-1441" name="__codelineno-0-1441"></a>    <span class="c1"># If the user provided the target as a tag, retrieve its name</span>
-</span><span id="__span-0-1442"><a id="__codelineno-0-1442" name="__codelineno-0-1442"></a>    <span class="n">target</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">target</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-1483">1483</a></span>
+<span class="normal"><a href="#__codelineno-0-1484">1484</a></span>
+<span class="normal"><a href="#__codelineno-0-1485">1485</a></span>
+<span class="normal"><a href="#__codelineno-0-1486">1486</a></span>
+<span class="normal"><a href="#__codelineno-0-1487">1487</a></span>
+<span class="normal"><a href="#__codelineno-0-1488">1488</a></span>
+<span class="normal"><a href="#__codelineno-0-1489">1489</a></span>
+<span class="normal"><a href="#__codelineno-0-1490">1490</a></span>
+<span class="normal"><a href="#__codelineno-0-1491">1491</a></span>
+<span class="normal"><a href="#__codelineno-0-1492">1492</a></span>
+<span class="normal"><a href="#__codelineno-0-1493">1493</a></span>
+<span class="normal"><a href="#__codelineno-0-1494">1494</a></span>
+<span class="normal"><a href="#__codelineno-0-1495">1495</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1408"><a id="__codelineno-0-1408" name="__codelineno-0-1408"></a><span class="k">def</span> <span class="nf">rank_candidate_causes</span><span class="p">(</span>
+</span><span id="__span-0-1409"><a id="__codelineno-0-1409" name="__codelineno-0-1409"></a>    <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-1410"><a id="__codelineno-0-1410" name="__codelineno-0-1410"></a>    <span class="n">target</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-1411"><a id="__codelineno-0-1411" name="__codelineno-0-1411"></a>    <span class="n">ignore</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">List</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-1412"><a id="__codelineno-0-1412" name="__codelineno-0-1412"></a>    <span class="n">method</span><span class="p">:</span> <span class="n">CandidateCauseRankerMethod</span> <span class="o">=</span> <span class="n">CandidateCauseRankerMethod</span><span class="o">.</span><span class="n">LOGOS</span><span class="p">,</span>
+</span><span id="__span-0-1413"><a id="__codelineno-0-1413" name="__codelineno-0-1413"></a>    <span class="n">prune_candidates</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="__span-0-1414"><a id="__codelineno-0-1414" name="__codelineno-0-1414"></a>    <span class="n">lasso_alpha</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="n">Pruner</span><span class="o">.</span><span class="n">LASSO_DEFAULT_ALPHA</span><span class="p">,</span>
+</span><span id="__span-0-1415"><a id="__codelineno-0-1415" name="__codelineno-0-1415"></a>    <span class="n">lasso_max_iter</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="n">Pruner</span><span class="o">.</span><span class="n">LASSO_DEFAULT_MAX_ITER</span><span class="p">,</span>
+</span><span id="__span-0-1416"><a id="__codelineno-0-1416" name="__codelineno-0-1416"></a>    <span class="n">model</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;gpt-4o-mini-2024-07-18&quot;</span><span class="p">,</span>
+</span><span id="__span-0-1417"><a id="__codelineno-0-1417" name="__codelineno-0-1417"></a>    <span class="n">gpt_log_path</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-1418"><a id="__codelineno-0-1418" name="__codelineno-0-1418"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="nb">str</span><span class="p">]:</span>
+</span><span id="__span-0-1419"><a id="__codelineno-0-1419" name="__codelineno-0-1419"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1420"><a id="__codelineno-0-1420" name="__codelineno-0-1420"></a><span class="sd">    Present the user with ranked candidate causes for `target`. If no `target`</span>
+</span><span id="__span-0-1421"><a id="__codelineno-0-1421" name="__codelineno-0-1421"></a><span class="sd">    is specified, the most recent suggestion of `suggest_next_exploration()` is used, if any.</span>
+</span><span id="__span-0-1422"><a id="__codelineno-0-1422" name="__codelineno-0-1422"></a><span class="sd">    If `ignore` is specified, the variables in `ignore` are not considered as candidate causes.</span>
+</span><span id="__span-0-1423"><a id="__codelineno-0-1423" name="__codelineno-0-1423"></a>
+</span><span id="__span-0-1424"><a id="__codelineno-0-1424" name="__codelineno-0-1424"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-1425"><a id="__codelineno-0-1425" name="__codelineno-0-1425"></a><span class="sd">        target: The name or tag of the target variable.</span>
+</span><span id="__span-0-1426"><a id="__codelineno-0-1426" name="__codelineno-0-1426"></a><span class="sd">        ignore: A list of variables to ignore.</span>
+</span><span id="__span-0-1427"><a id="__codelineno-0-1427" name="__codelineno-0-1427"></a><span class="sd">        method: The method to use for ranking candidate causes.</span>
+</span><span id="__span-0-1428"><a id="__codelineno-0-1428" name="__codelineno-0-1428"></a><span class="sd">        prune_candidates: Whether to prune the candidate causes using Lasso regression. Only</span>
+</span><span id="__span-0-1429"><a id="__codelineno-0-1429" name="__codelineno-0-1429"></a><span class="sd">            applies if `method` is `CandidateCauseRankerMethod.LOGOS`.</span>
+</span><span id="__span-0-1430"><a id="__codelineno-0-1430" name="__codelineno-0-1430"></a><span class="sd">        lasso_alpha: The alpha parameter to be used for Lasso regression. Only applies if</span>
+</span><span id="__span-0-1431"><a id="__codelineno-0-1431" name="__codelineno-0-1431"></a><span class="sd">            `method` is `CandidateCauseRankerMethod.LOGOS` and `prune_candidates` is True.</span>
+</span><span id="__span-0-1432"><a id="__codelineno-0-1432" name="__codelineno-0-1432"></a><span class="sd">        lasso_max_iter: The maximum number of iterations to be used for Lasso regression. Only</span>
+</span><span id="__span-0-1433"><a id="__codelineno-0-1433" name="__codelineno-0-1433"></a><span class="sd">            applies if `method` is `CandidateCauseRankerMethod.LOGOS` and `prune_candidates` is True.</span>
+</span><span id="__span-0-1434"><a id="__codelineno-0-1434" name="__codelineno-0-1434"></a><span class="sd">        model: The model to use for the langmodel method. Only applies if the method is</span>
+</span><span id="__span-0-1435"><a id="__codelineno-0-1435" name="__codelineno-0-1435"></a><span class="sd">            `CandidateCauseRankerMethod.LANGMODEL`.</span>
+</span><span id="__span-0-1436"><a id="__codelineno-0-1436" name="__codelineno-0-1436"></a><span class="sd">        gpt_log_path: The path to the log file to use for the langmodel method. Only applies if</span>
+</span><span id="__span-0-1437"><a id="__codelineno-0-1437" name="__codelineno-0-1437"></a><span class="sd">            the method is `CandidateCauseRankerMethod.LANGMODEL`.</span>
+</span><span id="__span-0-1438"><a id="__codelineno-0-1438" name="__codelineno-0-1438"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-1439"><a id="__codelineno-0-1439" name="__codelineno-0-1439"></a><span class="sd">        A tuple containing:</span>
+</span><span id="__span-0-1440"><a id="__codelineno-0-1440" name="__codelineno-0-1440"></a><span class="sd">        (1) A dataframe containing the candidate causes for `target` and</span>
+</span><span id="__span-0-1441"><a id="__codelineno-0-1441" name="__codelineno-0-1441"></a><span class="sd">        (2) The time elapsed for exploration, as a string.</span>
+</span><span id="__span-0-1442"><a id="__codelineno-0-1442" name="__codelineno-0-1442"></a><span class="sd">    &quot;&quot;&quot;</span>
 </span><span id="__span-0-1443"><a id="__codelineno-0-1443" name="__codelineno-0-1443"></a>
-</span><span id="__span-0-1444"><a id="__codelineno-0-1444" name="__codelineno-0-1444"></a>    <span class="c1"># Use the specified method to rank candidate causes</span>
-</span><span id="__span-0-1445"><a id="__codelineno-0-1445" name="__codelineno-0-1445"></a>    <span class="n">result_df</span><span class="p">,</span> <span class="n">pruned</span> <span class="o">=</span> <span class="n">CandidateCauseRanker</span><span class="o">.</span><span class="n">rank</span><span class="p">(</span>
-</span><span id="__span-0-1446"><a id="__codelineno-0-1446" name="__codelineno-0-1446"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">prepared_log</span><span class="p">,</span>
-</span><span id="__span-0-1447"><a id="__codelineno-0-1447" name="__codelineno-0-1447"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variables</span><span class="p">,</span>
-</span><span id="__span-0-1448"><a id="__codelineno-0-1448" name="__codelineno-0-1448"></a>        <span class="n">target</span><span class="p">,</span>
-</span><span id="__span-0-1449"><a id="__codelineno-0-1449" name="__codelineno-0-1449"></a>        <span class="n">ignore</span><span class="p">,</span>
-</span><span id="__span-0-1450"><a id="__codelineno-0-1450" name="__codelineno-0-1450"></a>        <span class="n">method</span><span class="p">,</span>
-</span><span id="__span-0-1451"><a id="__codelineno-0-1451" name="__codelineno-0-1451"></a>        <span class="n">prune_candidates</span><span class="p">,</span>
-</span><span id="__span-0-1452"><a id="__codelineno-0-1452" name="__codelineno-0-1452"></a>        <span class="n">lasso_alpha</span><span class="p">,</span>
-</span><span id="__span-0-1453"><a id="__codelineno-0-1453" name="__codelineno-0-1453"></a>        <span class="n">lasso_max_iter</span><span class="p">,</span>
-</span><span id="__span-0-1454"><a id="__codelineno-0-1454" name="__codelineno-0-1454"></a>        <span class="n">model</span><span class="p">,</span>
-</span><span id="__span-0-1455"><a id="__codelineno-0-1455" name="__codelineno-0-1455"></a>        <span class="p">(</span>
-</span><span id="__span-0-1456"><a id="__codelineno-0-1456" name="__codelineno-0-1456"></a>            <span class="n">gpt_log_path</span>
-</span><span id="__span-0-1457"><a id="__codelineno-0-1457" name="__codelineno-0-1457"></a>            <span class="k">if</span> <span class="p">(</span><span class="n">gpt_log_path</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">)</span>
-</span><span id="__span-0-1458"><a id="__codelineno-0-1458" name="__codelineno-0-1458"></a>            <span class="k">else</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span>
-</span><span id="__span-0-1459"><a id="__codelineno-0-1459" name="__codelineno-0-1459"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_workdir</span><span class="p">,</span>
-</span><span id="__span-0-1460"><a id="__codelineno-0-1460" name="__codelineno-0-1460"></a>                <span class="sa">f</span><span class="s2">&quot;ranker-gpt-</span><span class="si">{</span><span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span><span class="o">.</span><span class="n">strftime</span><span class="p">(</span><span class="s1">&#39;%Y-%m-</span><span class="si">%d</span><span class="s1">-%H-%M-%S&#39;</span><span class="p">)</span><span class="si">}</span><span class="s2">.log&quot;</span><span class="p">,</span>
-</span><span id="__span-0-1461"><a id="__codelineno-0-1461" name="__codelineno-0-1461"></a>            <span class="p">)</span>
-</span><span id="__span-0-1462"><a id="__codelineno-0-1462" name="__codelineno-0-1462"></a>        <span class="p">),</span>
-</span><span id="__span-0-1463"><a id="__codelineno-0-1463" name="__codelineno-0-1463"></a>    <span class="p">)</span>
-</span><span id="__span-0-1464"><a id="__codelineno-0-1464" name="__codelineno-0-1464"></a>
-</span><span id="__span-0-1465"><a id="__codelineno-0-1465" name="__codelineno-0-1465"></a>    <span class="c1"># Mark the edges rejected by the pruning step, if any.</span>
-</span><span id="__span-0-1466"><a id="__codelineno-0-1466" name="__codelineno-0-1466"></a>    <span class="k">for</span> <span class="n">var</span> <span class="ow">in</span> <span class="n">pruned</span><span class="p">:</span>
-</span><span id="__span-0-1467"><a id="__codelineno-0-1467" name="__codelineno-0-1467"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">mark_edge</span><span class="p">(</span><span class="n">var</span><span class="p">,</span> <span class="n">target</span><span class="p">,</span> <span class="s2">&quot;Rejected&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1468"><a id="__codelineno-0-1468" name="__codelineno-0-1468"></a>
-</span><span id="__span-0-1469"><a id="__codelineno-0-1469" name="__codelineno-0-1469"></a>    <span class="c1"># Add fields to the returned dataframe</span>
-</span><span id="__span-0-1470"><a id="__codelineno-0-1470" name="__codelineno-0-1470"></a>    <span class="n">result_df</span><span class="p">[</span><span class="s2">&quot;Candidate-&gt;Target Edge Status&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">result_df</span><span class="p">[</span><span class="s2">&quot;Candidate&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
-</span><span id="__span-0-1471"><a id="__codelineno-0-1471" name="__codelineno-0-1471"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">get_edge_state</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>
-</span><span id="__span-0-1472"><a id="__codelineno-0-1472" name="__codelineno-0-1472"></a>    <span class="p">)</span>
-</span><span id="__span-0-1473"><a id="__codelineno-0-1473" name="__codelineno-0-1473"></a>    <span class="n">result_df</span><span class="p">[</span><span class="s2">&quot;Target-&gt;Candidate Edge Status&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">result_df</span><span class="p">[</span><span class="s2">&quot;Candidate&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
-</span><span id="__span-0-1474"><a id="__codelineno-0-1474" name="__codelineno-0-1474"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">get_edge_state</span><span class="p">(</span><span class="n">target</span><span class="p">,</span> <span class="n">x</span><span class="p">)</span>
+</span><span id="__span-0-1444"><a id="__codelineno-0-1444" name="__codelineno-0-1444"></a>    <span class="n">start_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
+</span><span id="__span-0-1445"><a id="__codelineno-0-1445" name="__codelineno-0-1445"></a>
+</span><span id="__span-0-1446"><a id="__codelineno-0-1446" name="__codelineno-0-1446"></a>    <span class="c1"># Handle the case where the user has not specified a target.</span>
+</span><span id="__span-0-1447"><a id="__codelineno-0-1447" name="__codelineno-0-1447"></a>    <span class="k">if</span> <span class="n">target</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-1448"><a id="__codelineno-0-1448" name="__codelineno-0-1448"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="s2">&quot;No target specified.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1449"><a id="__codelineno-0-1449" name="__codelineno-0-1449"></a>        <span class="k">return</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">columns</span><span class="o">=</span><span class="n">CandidateCauseRanker</span><span class="o">.</span><span class="n">COLUMN_ORDER</span><span class="p">),</span> <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-1450"><a id="__codelineno-0-1450" name="__codelineno-0-1450"></a>    <span class="k">elif</span> <span class="n">target</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-1451"><a id="__codelineno-0-1451" name="__codelineno-0-1451"></a>        <span class="n">target</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span>
+</span><span id="__span-0-1452"><a id="__codelineno-0-1452" name="__codelineno-0-1452"></a>
+</span><span id="__span-0-1453"><a id="__codelineno-0-1453" name="__codelineno-0-1453"></a>    <span class="c1"># If the user provided the target as a tag, retrieve its name</span>
+</span><span id="__span-0-1454"><a id="__codelineno-0-1454" name="__codelineno-0-1454"></a>    <span class="n">target</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">target</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1455"><a id="__codelineno-0-1455" name="__codelineno-0-1455"></a>
+</span><span id="__span-0-1456"><a id="__codelineno-0-1456" name="__codelineno-0-1456"></a>    <span class="c1"># Use the specified method to rank candidate causes</span>
+</span><span id="__span-0-1457"><a id="__codelineno-0-1457" name="__codelineno-0-1457"></a>    <span class="n">result_df</span><span class="p">,</span> <span class="n">pruned</span> <span class="o">=</span> <span class="n">CandidateCauseRanker</span><span class="o">.</span><span class="n">rank</span><span class="p">(</span>
+</span><span id="__span-0-1458"><a id="__codelineno-0-1458" name="__codelineno-0-1458"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">prepared_log</span><span class="p">,</span>
+</span><span id="__span-0-1459"><a id="__codelineno-0-1459" name="__codelineno-0-1459"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variables</span><span class="p">,</span>
+</span><span id="__span-0-1460"><a id="__codelineno-0-1460" name="__codelineno-0-1460"></a>        <span class="n">target</span><span class="p">,</span>
+</span><span id="__span-0-1461"><a id="__codelineno-0-1461" name="__codelineno-0-1461"></a>        <span class="n">ignore</span><span class="p">,</span>
+</span><span id="__span-0-1462"><a id="__codelineno-0-1462" name="__codelineno-0-1462"></a>        <span class="n">method</span><span class="p">,</span>
+</span><span id="__span-0-1463"><a id="__codelineno-0-1463" name="__codelineno-0-1463"></a>        <span class="n">prune_candidates</span><span class="p">,</span>
+</span><span id="__span-0-1464"><a id="__codelineno-0-1464" name="__codelineno-0-1464"></a>        <span class="n">lasso_alpha</span><span class="p">,</span>
+</span><span id="__span-0-1465"><a id="__codelineno-0-1465" name="__codelineno-0-1465"></a>        <span class="n">lasso_max_iter</span><span class="p">,</span>
+</span><span id="__span-0-1466"><a id="__codelineno-0-1466" name="__codelineno-0-1466"></a>        <span class="n">model</span><span class="p">,</span>
+</span><span id="__span-0-1467"><a id="__codelineno-0-1467" name="__codelineno-0-1467"></a>        <span class="p">(</span>
+</span><span id="__span-0-1468"><a id="__codelineno-0-1468" name="__codelineno-0-1468"></a>            <span class="n">gpt_log_path</span>
+</span><span id="__span-0-1469"><a id="__codelineno-0-1469" name="__codelineno-0-1469"></a>            <span class="k">if</span> <span class="p">(</span><span class="n">gpt_log_path</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">)</span>
+</span><span id="__span-0-1470"><a id="__codelineno-0-1470" name="__codelineno-0-1470"></a>            <span class="k">else</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span>
+</span><span id="__span-0-1471"><a id="__codelineno-0-1471" name="__codelineno-0-1471"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_workdir</span><span class="p">,</span>
+</span><span id="__span-0-1472"><a id="__codelineno-0-1472" name="__codelineno-0-1472"></a>                <span class="sa">f</span><span class="s2">&quot;ranker-gpt-</span><span class="si">{</span><span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span><span class="o">.</span><span class="n">strftime</span><span class="p">(</span><span class="s1">&#39;%Y-%m-</span><span class="si">%d</span><span class="s1">-%H-%M-%S&#39;</span><span class="p">)</span><span class="si">}</span><span class="s2">.log&quot;</span><span class="p">,</span>
+</span><span id="__span-0-1473"><a id="__codelineno-0-1473" name="__codelineno-0-1473"></a>            <span class="p">)</span>
+</span><span id="__span-0-1474"><a id="__codelineno-0-1474" name="__codelineno-0-1474"></a>        <span class="p">),</span>
 </span><span id="__span-0-1475"><a id="__codelineno-0-1475" name="__codelineno-0-1475"></a>    <span class="p">)</span>
 </span><span id="__span-0-1476"><a id="__codelineno-0-1476" name="__codelineno-0-1476"></a>
-</span><span id="__span-0-1477"><a id="__codelineno-0-1477" name="__codelineno-0-1477"></a>    <span class="n">ret_val</span> <span class="o">=</span> <span class="n">result_df</span><span class="p">[</span><span class="n">CandidateCauseRanker</span><span class="o">.</span><span class="n">COLUMN_ORDER</span><span class="p">]</span>
-</span><span id="__span-0-1478"><a id="__codelineno-0-1478" name="__codelineno-0-1478"></a>
-</span><span id="__span-0-1479"><a id="__codelineno-0-1479" name="__codelineno-0-1479"></a>    <span class="n">end_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
-</span><span id="__span-0-1480"><a id="__codelineno-0-1480" name="__codelineno-0-1480"></a>    <span class="n">elapsed</span> <span class="o">=</span> <span class="s2">&quot;</span><span class="si">{:.6f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">((</span><span class="n">end_time</span> <span class="o">-</span> <span class="n">start_time</span><span class="p">)</span><span class="o">.</span><span class="n">total_seconds</span><span class="p">())</span>
-</span><span id="__span-0-1481"><a id="__codelineno-0-1481" name="__codelineno-0-1481"></a>    <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Candidate cause exploration complete in </span><span class="si">{</span><span class="n">elapsed</span><span class="si">}</span><span class="s2"> seconds!&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1482"><a id="__codelineno-0-1482" name="__codelineno-0-1482"></a>
-</span><span id="__span-0-1483"><a id="__codelineno-0-1483" name="__codelineno-0-1483"></a>    <span class="k">return</span> <span class="n">ret_val</span><span class="p">,</span> <span class="n">elapsed</span>
+</span><span id="__span-0-1477"><a id="__codelineno-0-1477" name="__codelineno-0-1477"></a>    <span class="c1"># Mark the edges rejected by the pruning step, if any.</span>
+</span><span id="__span-0-1478"><a id="__codelineno-0-1478" name="__codelineno-0-1478"></a>    <span class="k">for</span> <span class="n">var</span> <span class="ow">in</span> <span class="n">pruned</span><span class="p">:</span>
+</span><span id="__span-0-1479"><a id="__codelineno-0-1479" name="__codelineno-0-1479"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">mark_edge</span><span class="p">(</span><span class="n">var</span><span class="p">,</span> <span class="n">target</span><span class="p">,</span> <span class="s2">&quot;Rejected&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1480"><a id="__codelineno-0-1480" name="__codelineno-0-1480"></a>
+</span><span id="__span-0-1481"><a id="__codelineno-0-1481" name="__codelineno-0-1481"></a>    <span class="c1"># Add fields to the returned dataframe</span>
+</span><span id="__span-0-1482"><a id="__codelineno-0-1482" name="__codelineno-0-1482"></a>    <span class="n">result_df</span><span class="p">[</span><span class="s2">&quot;Candidate-&gt;Target Edge Status&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">result_df</span><span class="p">[</span><span class="s2">&quot;Candidate&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
+</span><span id="__span-0-1483"><a id="__codelineno-0-1483" name="__codelineno-0-1483"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">get_edge_state</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>
+</span><span id="__span-0-1484"><a id="__codelineno-0-1484" name="__codelineno-0-1484"></a>    <span class="p">)</span>
+</span><span id="__span-0-1485"><a id="__codelineno-0-1485" name="__codelineno-0-1485"></a>    <span class="n">result_df</span><span class="p">[</span><span class="s2">&quot;Target-&gt;Candidate Edge Status&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">result_df</span><span class="p">[</span><span class="s2">&quot;Candidate&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span>
+</span><span id="__span-0-1486"><a id="__codelineno-0-1486" name="__codelineno-0-1486"></a>        <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">get_edge_state</span><span class="p">(</span><span class="n">target</span><span class="p">,</span> <span class="n">x</span><span class="p">)</span>
+</span><span id="__span-0-1487"><a id="__codelineno-0-1487" name="__codelineno-0-1487"></a>    <span class="p">)</span>
+</span><span id="__span-0-1488"><a id="__codelineno-0-1488" name="__codelineno-0-1488"></a>
+</span><span id="__span-0-1489"><a id="__codelineno-0-1489" name="__codelineno-0-1489"></a>    <span class="n">ret_val</span> <span class="o">=</span> <span class="n">result_df</span><span class="p">[</span><span class="n">CandidateCauseRanker</span><span class="o">.</span><span class="n">COLUMN_ORDER</span><span class="p">]</span>
+</span><span id="__span-0-1490"><a id="__codelineno-0-1490" name="__codelineno-0-1490"></a>
+</span><span id="__span-0-1491"><a id="__codelineno-0-1491" name="__codelineno-0-1491"></a>    <span class="n">end_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
+</span><span id="__span-0-1492"><a id="__codelineno-0-1492" name="__codelineno-0-1492"></a>    <span class="n">elapsed</span> <span class="o">=</span> <span class="s2">&quot;</span><span class="si">{:.6f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">((</span><span class="n">end_time</span> <span class="o">-</span> <span class="n">start_time</span><span class="p">)</span><span class="o">.</span><span class="n">total_seconds</span><span class="p">())</span>
+</span><span id="__span-0-1493"><a id="__codelineno-0-1493" name="__codelineno-0-1493"></a>    <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Candidate cause exploration complete in </span><span class="si">{</span><span class="n">elapsed</span><span class="si">}</span><span class="s2"> seconds!&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1494"><a id="__codelineno-0-1494" name="__codelineno-0-1494"></a>
+</span><span id="__span-0-1495"><a id="__codelineno-0-1495" name="__codelineno-0-1495"></a>    <span class="k">return</span> <span class="n">ret_val</span><span class="p">,</span> <span class="n">elapsed</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -10480,19 +10593,7 @@ <h3 id="logos.logos.LOGos.get_causal_graph_refinement_suggestion" class="doc doc
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1485">1485</a></span>
-<span class="normal"><a href="#__codelineno-0-1486">1486</a></span>
-<span class="normal"><a href="#__codelineno-0-1487">1487</a></span>
-<span class="normal"><a href="#__codelineno-0-1488">1488</a></span>
-<span class="normal"><a href="#__codelineno-0-1489">1489</a></span>
-<span class="normal"><a href="#__codelineno-0-1490">1490</a></span>
-<span class="normal"><a href="#__codelineno-0-1491">1491</a></span>
-<span class="normal"><a href="#__codelineno-0-1492">1492</a></span>
-<span class="normal"><a href="#__codelineno-0-1493">1493</a></span>
-<span class="normal"><a href="#__codelineno-0-1494">1494</a></span>
-<span class="normal"><a href="#__codelineno-0-1495">1495</a></span>
-<span class="normal"><a href="#__codelineno-0-1496">1496</a></span>
-<span class="normal"><a href="#__codelineno-0-1497">1497</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1497">1497</a></span>
 <span class="normal"><a href="#__codelineno-0-1498">1498</a></span>
 <span class="normal"><a href="#__codelineno-0-1499">1499</a></span>
 <span class="normal"><a href="#__codelineno-0-1500">1500</a></span>
@@ -10543,70 +10644,82 @@ <h3 id="logos.logos.LOGos.get_causal_graph_refinement_suggestion" class="doc doc
 <span class="normal"><a href="#__codelineno-0-1545">1545</a></span>
 <span class="normal"><a href="#__codelineno-0-1546">1546</a></span>
 <span class="normal"><a href="#__codelineno-0-1547">1547</a></span>
-<span class="normal"><a href="#__codelineno-0-1548">1548</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1485"><a id="__codelineno-0-1485" name="__codelineno-0-1485"></a><span class="k">def</span> <span class="nf">get_causal_graph_refinement_suggestion</span><span class="p">(</span>
-</span><span id="__span-0-1486"><a id="__codelineno-0-1486" name="__codelineno-0-1486"></a>    <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-1487"><a id="__codelineno-0-1487" name="__codelineno-0-1487"></a>    <span class="n">method</span><span class="p">:</span> <span class="n">InteractiveCausalGraphRefinerMethod</span> <span class="o">=</span> <span class="n">InteractiveCausalGraphRefinerMethod</span><span class="o">.</span><span class="n">LOGOS</span><span class="p">,</span>
-</span><span id="__span-0-1488"><a id="__codelineno-0-1488" name="__codelineno-0-1488"></a>    <span class="n">treatment</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-1489"><a id="__codelineno-0-1489" name="__codelineno-0-1489"></a>    <span class="n">outcome</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-1490"><a id="__codelineno-0-1490" name="__codelineno-0-1490"></a>    <span class="n">model</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;gpt-4o-mini-2024-07-18&quot;</span><span class="p">,</span>
-</span><span id="__span-0-1491"><a id="__codelineno-0-1491" name="__codelineno-0-1491"></a>    <span class="n">gpt_log_path</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-1492"><a id="__codelineno-0-1492" name="__codelineno-0-1492"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="n">Edge</span><span class="p">,</span> <span class="nb">str</span><span class="p">]:</span>
-</span><span id="__span-0-1493"><a id="__codelineno-0-1493" name="__codelineno-0-1493"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1494"><a id="__codelineno-0-1494" name="__codelineno-0-1494"></a><span class="sd">    Present the user with an edge, the presence and direction of which they should assess.</span>
-</span><span id="__span-0-1495"><a id="__codelineno-0-1495" name="__codelineno-0-1495"></a>
-</span><span id="__span-0-1496"><a id="__codelineno-0-1496" name="__codelineno-0-1496"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-1497"><a id="__codelineno-0-1497" name="__codelineno-0-1497"></a><span class="sd">        method: The method to use for producing a causal graph refinement suggestion.</span>
-</span><span id="__span-0-1498"><a id="__codelineno-0-1498" name="__codelineno-0-1498"></a><span class="sd">        treatment: The name or tag of the treatment variable. Only applies if the method is</span>
-</span><span id="__span-0-1499"><a id="__codelineno-0-1499" name="__codelineno-0-1499"></a><span class="sd">            `InteractiveCausalGraphRefinerMethod.LOGOS`.</span>
-</span><span id="__span-0-1500"><a id="__codelineno-0-1500" name="__codelineno-0-1500"></a><span class="sd">        outcome: The name or tag of the outcome variable. Only applies if the method is</span>
-</span><span id="__span-0-1501"><a id="__codelineno-0-1501" name="__codelineno-0-1501"></a><span class="sd">            `InteractiveCausalGraphRefinerMethod.LOGOS`.</span>
-</span><span id="__span-0-1502"><a id="__codelineno-0-1502" name="__codelineno-0-1502"></a><span class="sd">        model: The model to use for the langmodel method. Only applies if the method is</span>
-</span><span id="__span-0-1503"><a id="__codelineno-0-1503" name="__codelineno-0-1503"></a><span class="sd">            `CandidateCauseRankerMethod.LANGMODEL`.</span>
-</span><span id="__span-0-1504"><a id="__codelineno-0-1504" name="__codelineno-0-1504"></a><span class="sd">        gpt_log_path: The path to the log file to use for the langmodel method. Only applies if</span>
-</span><span id="__span-0-1505"><a id="__codelineno-0-1505" name="__codelineno-0-1505"></a><span class="sd">            the method is `CandidateCauseRankerMethod.LANGMODEL`.</span>
-</span><span id="__span-0-1506"><a id="__codelineno-0-1506" name="__codelineno-0-1506"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-1507"><a id="__codelineno-0-1507" name="__codelineno-0-1507"></a><span class="sd">        A tuple containing:</span>
-</span><span id="__span-0-1508"><a id="__codelineno-0-1508" name="__codelineno-0-1508"></a><span class="sd">        (1) The edge to assess, as an Edge object, and</span>
-</span><span id="__span-0-1509"><a id="__codelineno-0-1509" name="__codelineno-0-1509"></a><span class="sd">        (2) The time elapsed for generating the suggestion, as a string.</span>
-</span><span id="__span-0-1510"><a id="__codelineno-0-1510" name="__codelineno-0-1510"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1511"><a id="__codelineno-0-1511" name="__codelineno-0-1511"></a>
-</span><span id="__span-0-1512"><a id="__codelineno-0-1512" name="__codelineno-0-1512"></a>    <span class="n">start_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
-</span><span id="__span-0-1513"><a id="__codelineno-0-1513" name="__codelineno-0-1513"></a>
-</span><span id="__span-0-1514"><a id="__codelineno-0-1514" name="__codelineno-0-1514"></a>    <span class="n">treatment_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span>
-</span><span id="__span-0-1515"><a id="__codelineno-0-1515" name="__codelineno-0-1515"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">treatment</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span>
-</span><span id="__span-0-1516"><a id="__codelineno-0-1516" name="__codelineno-0-1516"></a>    <span class="p">)</span>
-</span><span id="__span-0-1517"><a id="__codelineno-0-1517" name="__codelineno-0-1517"></a>    <span class="n">outcome_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">outcome</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1518"><a id="__codelineno-0-1518" name="__codelineno-0-1518"></a>
-</span><span id="__span-0-1519"><a id="__codelineno-0-1519" name="__codelineno-0-1519"></a>    <span class="n">edge</span> <span class="o">=</span> <span class="n">InteractiveCausalGraphRefiner</span><span class="o">.</span><span class="n">get_suggestion</span><span class="p">(</span>
-</span><span id="__span-0-1520"><a id="__codelineno-0-1520" name="__codelineno-0-1520"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">prepared_log</span><span class="p">,</span>
-</span><span id="__span-0-1521"><a id="__codelineno-0-1521" name="__codelineno-0-1521"></a>        <span class="n">method</span><span class="p">,</span>
-</span><span id="__span-0-1522"><a id="__codelineno-0-1522" name="__codelineno-0-1522"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="p">,</span>
-</span><span id="__span-0-1523"><a id="__codelineno-0-1523" name="__codelineno-0-1523"></a>        <span class="n">treatment_name</span><span class="p">,</span>
-</span><span id="__span-0-1524"><a id="__codelineno-0-1524" name="__codelineno-0-1524"></a>        <span class="n">outcome_name</span><span class="p">,</span>
-</span><span id="__span-0-1525"><a id="__codelineno-0-1525" name="__codelineno-0-1525"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span>
-</span><span id="__span-0-1526"><a id="__codelineno-0-1526" name="__codelineno-0-1526"></a>        <span class="n">model</span><span class="p">,</span>
-</span><span id="__span-0-1527"><a id="__codelineno-0-1527" name="__codelineno-0-1527"></a>        <span class="p">(</span>
-</span><span id="__span-0-1528"><a id="__codelineno-0-1528" name="__codelineno-0-1528"></a>            <span class="n">gpt_log_path</span>
-</span><span id="__span-0-1529"><a id="__codelineno-0-1529" name="__codelineno-0-1529"></a>            <span class="k">if</span> <span class="p">(</span><span class="n">gpt_log_path</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">)</span>
-</span><span id="__span-0-1530"><a id="__codelineno-0-1530" name="__codelineno-0-1530"></a>            <span class="k">else</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span>
-</span><span id="__span-0-1531"><a id="__codelineno-0-1531" name="__codelineno-0-1531"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_workdir</span><span class="p">,</span>
-</span><span id="__span-0-1532"><a id="__codelineno-0-1532" name="__codelineno-0-1532"></a>                <span class="sa">f</span><span class="s2">&quot;refiner-gpt-</span><span class="si">{</span><span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span><span class="o">.</span><span class="n">strftime</span><span class="p">(</span><span class="s1">&#39;%Y-%m-</span><span class="si">%d</span><span class="s1">-%H-%M-%S&#39;</span><span class="p">)</span><span class="si">}</span><span class="s2">.log&quot;</span><span class="p">,</span>
-</span><span id="__span-0-1533"><a id="__codelineno-0-1533" name="__codelineno-0-1533"></a>            <span class="p">)</span>
-</span><span id="__span-0-1534"><a id="__codelineno-0-1534" name="__codelineno-0-1534"></a>        <span class="p">),</span>
-</span><span id="__span-0-1535"><a id="__codelineno-0-1535" name="__codelineno-0-1535"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variables</span>
-</span><span id="__span-0-1536"><a id="__codelineno-0-1536" name="__codelineno-0-1536"></a>    <span class="p">)</span>
-</span><span id="__span-0-1537"><a id="__codelineno-0-1537" name="__codelineno-0-1537"></a>
-</span><span id="__span-0-1538"><a id="__codelineno-0-1538" name="__codelineno-0-1538"></a>    <span class="n">edge_tags</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-1539"><a id="__codelineno-0-1539" name="__codelineno-0-1539"></a>    <span class="k">if</span> <span class="n">edge</span><span class="p">:</span>
-</span><span id="__span-0-1540"><a id="__codelineno-0-1540" name="__codelineno-0-1540"></a>        <span class="n">edge_tags</span> <span class="o">=</span> <span class="nb">tuple</span><span class="p">(</span>
-</span><span id="__span-0-1541"><a id="__codelineno-0-1541" name="__codelineno-0-1541"></a>            <span class="n">TagUtils</span><span class="o">.</span><span class="n">tag_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">edge</span>
-</span><span id="__span-0-1542"><a id="__codelineno-0-1542" name="__codelineno-0-1542"></a>        <span class="p">)</span>
-</span><span id="__span-0-1543"><a id="__codelineno-0-1543" name="__codelineno-0-1543"></a>
-</span><span id="__span-0-1544"><a id="__codelineno-0-1544" name="__codelineno-0-1544"></a>    <span class="n">end_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
-</span><span id="__span-0-1545"><a id="__codelineno-0-1545" name="__codelineno-0-1545"></a>    <span class="n">elapsed</span> <span class="o">=</span> <span class="s2">&quot;</span><span class="si">{:.6f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">((</span><span class="n">end_time</span> <span class="o">-</span> <span class="n">start_time</span><span class="p">)</span><span class="o">.</span><span class="n">total_seconds</span><span class="p">())</span>
-</span><span id="__span-0-1546"><a id="__codelineno-0-1546" name="__codelineno-0-1546"></a>    <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Candidate cause exploration complete in </span><span class="si">{</span><span class="n">elapsed</span><span class="si">}</span><span class="s2"> seconds!&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1547"><a id="__codelineno-0-1547" name="__codelineno-0-1547"></a>
-</span><span id="__span-0-1548"><a id="__codelineno-0-1548" name="__codelineno-0-1548"></a>    <span class="k">return</span> <span class="n">edge_tags</span><span class="p">,</span> <span class="n">elapsed</span>
+<span class="normal"><a href="#__codelineno-0-1548">1548</a></span>
+<span class="normal"><a href="#__codelineno-0-1549">1549</a></span>
+<span class="normal"><a href="#__codelineno-0-1550">1550</a></span>
+<span class="normal"><a href="#__codelineno-0-1551">1551</a></span>
+<span class="normal"><a href="#__codelineno-0-1552">1552</a></span>
+<span class="normal"><a href="#__codelineno-0-1553">1553</a></span>
+<span class="normal"><a href="#__codelineno-0-1554">1554</a></span>
+<span class="normal"><a href="#__codelineno-0-1555">1555</a></span>
+<span class="normal"><a href="#__codelineno-0-1556">1556</a></span>
+<span class="normal"><a href="#__codelineno-0-1557">1557</a></span>
+<span class="normal"><a href="#__codelineno-0-1558">1558</a></span>
+<span class="normal"><a href="#__codelineno-0-1559">1559</a></span>
+<span class="normal"><a href="#__codelineno-0-1560">1560</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1497"><a id="__codelineno-0-1497" name="__codelineno-0-1497"></a><span class="k">def</span> <span class="nf">get_causal_graph_refinement_suggestion</span><span class="p">(</span>
+</span><span id="__span-0-1498"><a id="__codelineno-0-1498" name="__codelineno-0-1498"></a>    <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-1499"><a id="__codelineno-0-1499" name="__codelineno-0-1499"></a>    <span class="n">method</span><span class="p">:</span> <span class="n">InteractiveCausalGraphRefinerMethod</span> <span class="o">=</span> <span class="n">InteractiveCausalGraphRefinerMethod</span><span class="o">.</span><span class="n">LOGOS</span><span class="p">,</span>
+</span><span id="__span-0-1500"><a id="__codelineno-0-1500" name="__codelineno-0-1500"></a>    <span class="n">treatment</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-1501"><a id="__codelineno-0-1501" name="__codelineno-0-1501"></a>    <span class="n">outcome</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-1502"><a id="__codelineno-0-1502" name="__codelineno-0-1502"></a>    <span class="n">model</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;gpt-4o-mini-2024-07-18&quot;</span><span class="p">,</span>
+</span><span id="__span-0-1503"><a id="__codelineno-0-1503" name="__codelineno-0-1503"></a>    <span class="n">gpt_log_path</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-1504"><a id="__codelineno-0-1504" name="__codelineno-0-1504"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="n">Edge</span><span class="p">,</span> <span class="nb">str</span><span class="p">]:</span>
+</span><span id="__span-0-1505"><a id="__codelineno-0-1505" name="__codelineno-0-1505"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1506"><a id="__codelineno-0-1506" name="__codelineno-0-1506"></a><span class="sd">    Present the user with an edge, the presence and direction of which they should assess.</span>
+</span><span id="__span-0-1507"><a id="__codelineno-0-1507" name="__codelineno-0-1507"></a>
+</span><span id="__span-0-1508"><a id="__codelineno-0-1508" name="__codelineno-0-1508"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-1509"><a id="__codelineno-0-1509" name="__codelineno-0-1509"></a><span class="sd">        method: The method to use for producing a causal graph refinement suggestion.</span>
+</span><span id="__span-0-1510"><a id="__codelineno-0-1510" name="__codelineno-0-1510"></a><span class="sd">        treatment: The name or tag of the treatment variable. Only applies if the method is</span>
+</span><span id="__span-0-1511"><a id="__codelineno-0-1511" name="__codelineno-0-1511"></a><span class="sd">            `InteractiveCausalGraphRefinerMethod.LOGOS`.</span>
+</span><span id="__span-0-1512"><a id="__codelineno-0-1512" name="__codelineno-0-1512"></a><span class="sd">        outcome: The name or tag of the outcome variable. Only applies if the method is</span>
+</span><span id="__span-0-1513"><a id="__codelineno-0-1513" name="__codelineno-0-1513"></a><span class="sd">            `InteractiveCausalGraphRefinerMethod.LOGOS`.</span>
+</span><span id="__span-0-1514"><a id="__codelineno-0-1514" name="__codelineno-0-1514"></a><span class="sd">        model: The model to use for the langmodel method. Only applies if the method is</span>
+</span><span id="__span-0-1515"><a id="__codelineno-0-1515" name="__codelineno-0-1515"></a><span class="sd">            `CandidateCauseRankerMethod.LANGMODEL`.</span>
+</span><span id="__span-0-1516"><a id="__codelineno-0-1516" name="__codelineno-0-1516"></a><span class="sd">        gpt_log_path: The path to the log file to use for the langmodel method. Only applies if</span>
+</span><span id="__span-0-1517"><a id="__codelineno-0-1517" name="__codelineno-0-1517"></a><span class="sd">            the method is `CandidateCauseRankerMethod.LANGMODEL`.</span>
+</span><span id="__span-0-1518"><a id="__codelineno-0-1518" name="__codelineno-0-1518"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-1519"><a id="__codelineno-0-1519" name="__codelineno-0-1519"></a><span class="sd">        A tuple containing:</span>
+</span><span id="__span-0-1520"><a id="__codelineno-0-1520" name="__codelineno-0-1520"></a><span class="sd">        (1) The edge to assess, as an Edge object, and</span>
+</span><span id="__span-0-1521"><a id="__codelineno-0-1521" name="__codelineno-0-1521"></a><span class="sd">        (2) The time elapsed for generating the suggestion, as a string.</span>
+</span><span id="__span-0-1522"><a id="__codelineno-0-1522" name="__codelineno-0-1522"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1523"><a id="__codelineno-0-1523" name="__codelineno-0-1523"></a>
+</span><span id="__span-0-1524"><a id="__codelineno-0-1524" name="__codelineno-0-1524"></a>    <span class="n">start_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
+</span><span id="__span-0-1525"><a id="__codelineno-0-1525" name="__codelineno-0-1525"></a>
+</span><span id="__span-0-1526"><a id="__codelineno-0-1526" name="__codelineno-0-1526"></a>    <span class="n">treatment_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span>
+</span><span id="__span-0-1527"><a id="__codelineno-0-1527" name="__codelineno-0-1527"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">treatment</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span>
+</span><span id="__span-0-1528"><a id="__codelineno-0-1528" name="__codelineno-0-1528"></a>    <span class="p">)</span>
+</span><span id="__span-0-1529"><a id="__codelineno-0-1529" name="__codelineno-0-1529"></a>    <span class="n">outcome_name</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">name_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">outcome</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1530"><a id="__codelineno-0-1530" name="__codelineno-0-1530"></a>
+</span><span id="__span-0-1531"><a id="__codelineno-0-1531" name="__codelineno-0-1531"></a>    <span class="n">edge</span> <span class="o">=</span> <span class="n">InteractiveCausalGraphRefiner</span><span class="o">.</span><span class="n">get_suggestion</span><span class="p">(</span>
+</span><span id="__span-0-1532"><a id="__codelineno-0-1532" name="__codelineno-0-1532"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">prepared_log</span><span class="p">,</span>
+</span><span id="__span-0-1533"><a id="__codelineno-0-1533" name="__codelineno-0-1533"></a>        <span class="n">method</span><span class="p">,</span>
+</span><span id="__span-0-1534"><a id="__codelineno-0-1534" name="__codelineno-0-1534"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_eccs</span><span class="p">,</span>
+</span><span id="__span-0-1535"><a id="__codelineno-0-1535" name="__codelineno-0-1535"></a>        <span class="n">treatment_name</span><span class="p">,</span>
+</span><span id="__span-0-1536"><a id="__codelineno-0-1536" name="__codelineno-0-1536"></a>        <span class="n">outcome_name</span><span class="p">,</span>
+</span><span id="__span-0-1537"><a id="__codelineno-0-1537" name="__codelineno-0-1537"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span>
+</span><span id="__span-0-1538"><a id="__codelineno-0-1538" name="__codelineno-0-1538"></a>        <span class="n">model</span><span class="p">,</span>
+</span><span id="__span-0-1539"><a id="__codelineno-0-1539" name="__codelineno-0-1539"></a>        <span class="p">(</span>
+</span><span id="__span-0-1540"><a id="__codelineno-0-1540" name="__codelineno-0-1540"></a>            <span class="n">gpt_log_path</span>
+</span><span id="__span-0-1541"><a id="__codelineno-0-1541" name="__codelineno-0-1541"></a>            <span class="k">if</span> <span class="p">(</span><span class="n">gpt_log_path</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">)</span>
+</span><span id="__span-0-1542"><a id="__codelineno-0-1542" name="__codelineno-0-1542"></a>            <span class="k">else</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span>
+</span><span id="__span-0-1543"><a id="__codelineno-0-1543" name="__codelineno-0-1543"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_workdir</span><span class="p">,</span>
+</span><span id="__span-0-1544"><a id="__codelineno-0-1544" name="__codelineno-0-1544"></a>                <span class="sa">f</span><span class="s2">&quot;refiner-gpt-</span><span class="si">{</span><span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span><span class="o">.</span><span class="n">strftime</span><span class="p">(</span><span class="s1">&#39;%Y-%m-</span><span class="si">%d</span><span class="s1">-%H-%M-%S&#39;</span><span class="p">)</span><span class="si">}</span><span class="s2">.log&quot;</span><span class="p">,</span>
+</span><span id="__span-0-1545"><a id="__codelineno-0-1545" name="__codelineno-0-1545"></a>            <span class="p">)</span>
+</span><span id="__span-0-1546"><a id="__codelineno-0-1546" name="__codelineno-0-1546"></a>        <span class="p">),</span>
+</span><span id="__span-0-1547"><a id="__codelineno-0-1547" name="__codelineno-0-1547"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variables</span><span class="p">,</span>
+</span><span id="__span-0-1548"><a id="__codelineno-0-1548" name="__codelineno-0-1548"></a>    <span class="p">)</span>
+</span><span id="__span-0-1549"><a id="__codelineno-0-1549" name="__codelineno-0-1549"></a>
+</span><span id="__span-0-1550"><a id="__codelineno-0-1550" name="__codelineno-0-1550"></a>    <span class="n">edge_tags</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-1551"><a id="__codelineno-0-1551" name="__codelineno-0-1551"></a>    <span class="k">if</span> <span class="n">edge</span><span class="p">:</span>
+</span><span id="__span-0-1552"><a id="__codelineno-0-1552" name="__codelineno-0-1552"></a>        <span class="n">edge_tags</span> <span class="o">=</span> <span class="nb">tuple</span><span class="p">(</span>
+</span><span id="__span-0-1553"><a id="__codelineno-0-1553" name="__codelineno-0-1553"></a>            <span class="n">TagUtils</span><span class="o">.</span><span class="n">tag_of</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="s2">&quot;prepared&quot;</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">edge</span>
+</span><span id="__span-0-1554"><a id="__codelineno-0-1554" name="__codelineno-0-1554"></a>        <span class="p">)</span>
+</span><span id="__span-0-1555"><a id="__codelineno-0-1555" name="__codelineno-0-1555"></a>
+</span><span id="__span-0-1556"><a id="__codelineno-0-1556" name="__codelineno-0-1556"></a>    <span class="n">end_time</span> <span class="o">=</span> <span class="n">datetime</span><span class="o">.</span><span class="n">now</span><span class="p">()</span>
+</span><span id="__span-0-1557"><a id="__codelineno-0-1557" name="__codelineno-0-1557"></a>    <span class="n">elapsed</span> <span class="o">=</span> <span class="s2">&quot;</span><span class="si">{:.6f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">((</span><span class="n">end_time</span> <span class="o">-</span> <span class="n">start_time</span><span class="p">)</span><span class="o">.</span><span class="n">total_seconds</span><span class="p">())</span>
+</span><span id="__span-0-1558"><a id="__codelineno-0-1558" name="__codelineno-0-1558"></a>    <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Candidate cause exploration complete in </span><span class="si">{</span><span class="n">elapsed</span><span class="si">}</span><span class="s2"> seconds!&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1559"><a id="__codelineno-0-1559" name="__codelineno-0-1559"></a>
+</span><span id="__span-0-1560"><a id="__codelineno-0-1560" name="__codelineno-0-1560"></a>    <span class="k">return</span> <span class="n">edge_tags</span><span class="p">,</span> <span class="n">elapsed</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -10654,19 +10767,7 @@ <h3 id="logos.logos.LOGos.suggest_next_exploration" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1550">1550</a></span>
-<span class="normal"><a href="#__codelineno-0-1551">1551</a></span>
-<span class="normal"><a href="#__codelineno-0-1552">1552</a></span>
-<span class="normal"><a href="#__codelineno-0-1553">1553</a></span>
-<span class="normal"><a href="#__codelineno-0-1554">1554</a></span>
-<span class="normal"><a href="#__codelineno-0-1555">1555</a></span>
-<span class="normal"><a href="#__codelineno-0-1556">1556</a></span>
-<span class="normal"><a href="#__codelineno-0-1557">1557</a></span>
-<span class="normal"><a href="#__codelineno-0-1558">1558</a></span>
-<span class="normal"><a href="#__codelineno-0-1559">1559</a></span>
-<span class="normal"><a href="#__codelineno-0-1560">1560</a></span>
-<span class="normal"><a href="#__codelineno-0-1561">1561</a></span>
-<span class="normal"><a href="#__codelineno-0-1562">1562</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1562">1562</a></span>
 <span class="normal"><a href="#__codelineno-0-1563">1563</a></span>
 <span class="normal"><a href="#__codelineno-0-1564">1564</a></span>
 <span class="normal"><a href="#__codelineno-0-1565">1565</a></span>
@@ -10697,50 +10798,62 @@ <h3 id="logos.logos.LOGos.suggest_next_exploration" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-1590">1590</a></span>
 <span class="normal"><a href="#__codelineno-0-1591">1591</a></span>
 <span class="normal"><a href="#__codelineno-0-1592">1592</a></span>
-<span class="normal"><a href="#__codelineno-0-1593">1593</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1550"><a id="__codelineno-0-1550" name="__codelineno-0-1550"></a><span class="k">def</span> <span class="nf">suggest_next_exploration</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]:</span>
-</span><span id="__span-0-1551"><a id="__codelineno-0-1551" name="__codelineno-0-1551"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1552"><a id="__codelineno-0-1552" name="__codelineno-0-1552"></a><span class="sd">    Suggest the variable that should be explored next. Suggest the prepared variable in the partial causal graph</span>
-</span><span id="__span-0-1553"><a id="__codelineno-0-1553" name="__codelineno-0-1553"></a><span class="sd">    that has the most (nonzero) Unexplored incoming edges, if any; otherwise suggest the prepared variable</span>
-</span><span id="__span-0-1554"><a id="__codelineno-0-1554" name="__codelineno-0-1554"></a><span class="sd">    with the most (nonzero) Undecided incoming edges, even if it is not in the partial causal graph.</span>
-</span><span id="__span-0-1555"><a id="__codelineno-0-1555" name="__codelineno-0-1555"></a>
-</span><span id="__span-0-1556"><a id="__codelineno-0-1556" name="__codelineno-0-1556"></a><span class="sd">    If all edges are decided, return None.</span>
-</span><span id="__span-0-1557"><a id="__codelineno-0-1557" name="__codelineno-0-1557"></a>
-</span><span id="__span-0-1558"><a id="__codelineno-0-1558" name="__codelineno-0-1558"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-1559"><a id="__codelineno-0-1559" name="__codelineno-0-1559"></a><span class="sd">        The name of the variable to explore next.</span>
-</span><span id="__span-0-1560"><a id="__codelineno-0-1560" name="__codelineno-0-1560"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1561"><a id="__codelineno-0-1561" name="__codelineno-0-1561"></a>
-</span><span id="__span-0-1562"><a id="__codelineno-0-1562" name="__codelineno-0-1562"></a>    <span class="c1"># Try to find a suggestion from the partial causal graph.</span>
-</span><span id="__span-0-1563"><a id="__codelineno-0-1563" name="__codelineno-0-1563"></a>    <span class="n">node_names</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">nodes</span><span class="p">)</span>
-</span><span id="__span-0-1564"><a id="__codelineno-0-1564" name="__codelineno-0-1564"></a>    <span class="n">graph_var_indices</span> <span class="o">=</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">idx</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">node_names</span><span class="p">]</span>
-</span><span id="__span-0-1565"><a id="__codelineno-0-1565" name="__codelineno-0-1565"></a>    <span class="n">graph_var_incoming_edge_states</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">m</span><span class="p">[:,</span> <span class="n">graph_var_indices</span><span class="p">]</span>
-</span><span id="__span-0-1566"><a id="__codelineno-0-1566" name="__codelineno-0-1566"></a>    <span class="n">undecided_edges_per_col</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-1567"><a id="__codelineno-0-1567" name="__codelineno-0-1567"></a>        <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">graph_var_incoming_edge_states</span> <span class="o">==</span> <span class="mi">0</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-</span><span id="__span-0-1568"><a id="__codelineno-0-1568" name="__codelineno-0-1568"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">graph_var_incoming_edge_states</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span>
-</span><span id="__span-0-1569"><a id="__codelineno-0-1569" name="__codelineno-0-1569"></a>        <span class="k">else</span> <span class="p">[]</span>
-</span><span id="__span-0-1570"><a id="__codelineno-0-1570" name="__codelineno-0-1570"></a>    <span class="p">)</span>
-</span><span id="__span-0-1571"><a id="__codelineno-0-1571" name="__codelineno-0-1571"></a>    <span class="n">max_undecided</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-1572"><a id="__codelineno-0-1572" name="__codelineno-0-1572"></a>        <span class="n">np</span><span class="o">.</span><span class="n">max</span><span class="p">(</span><span class="n">undecided_edges_per_col</span><span class="p">)</span> <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">undecided_edges_per_col</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
-</span><span id="__span-0-1573"><a id="__codelineno-0-1573" name="__codelineno-0-1573"></a>    <span class="p">)</span>
-</span><span id="__span-0-1574"><a id="__codelineno-0-1574" name="__codelineno-0-1574"></a>
-</span><span id="__span-0-1575"><a id="__codelineno-0-1575" name="__codelineno-0-1575"></a>    <span class="k">if</span> <span class="n">max_undecided</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-1576"><a id="__codelineno-0-1576" name="__codelineno-0-1576"></a>        <span class="n">max_undecided_idx</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argmax</span><span class="p">(</span><span class="n">undecided_edges_per_col</span><span class="p">)</span>
-</span><span id="__span-0-1577"><a id="__codelineno-0-1577" name="__codelineno-0-1577"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span> <span class="o">=</span> <span class="n">node_names</span><span class="p">[</span><span class="n">max_undecided_idx</span><span class="p">]</span>
-</span><span id="__span-0-1578"><a id="__codelineno-0-1578" name="__codelineno-0-1578"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span>
-</span><span id="__span-0-1579"><a id="__codelineno-0-1579" name="__codelineno-0-1579"></a>
-</span><span id="__span-0-1580"><a id="__codelineno-0-1580" name="__codelineno-0-1580"></a>    <span class="c1"># If no suggestion was found, try to find a suggestion from the entire collection of prepared variables.</span>
-</span><span id="__span-0-1581"><a id="__codelineno-0-1581" name="__codelineno-0-1581"></a>    <span class="n">undecided_edges_per_col</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">m</span> <span class="o">==</span> <span class="mi">0</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-</span><span id="__span-0-1582"><a id="__codelineno-0-1582" name="__codelineno-0-1582"></a>    <span class="n">max_undecided</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">max</span><span class="p">(</span><span class="n">undecided_edges_per_col</span><span class="p">)</span>
-</span><span id="__span-0-1583"><a id="__codelineno-0-1583" name="__codelineno-0-1583"></a>
-</span><span id="__span-0-1584"><a id="__codelineno-0-1584" name="__codelineno-0-1584"></a>    <span class="k">if</span> <span class="n">max_undecided</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-1585"><a id="__codelineno-0-1585" name="__codelineno-0-1585"></a>        <span class="n">max_undecided_idx</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argmax</span><span class="p">(</span><span class="n">undecided_edges_per_col</span><span class="p">)</span>
-</span><span id="__span-0-1586"><a id="__codelineno-0-1586" name="__codelineno-0-1586"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
-</span><span id="__span-0-1587"><a id="__codelineno-0-1587" name="__codelineno-0-1587"></a>            <span class="n">max_undecided_idx</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span>
-</span><span id="__span-0-1588"><a id="__codelineno-0-1588" name="__codelineno-0-1588"></a>        <span class="p">]</span>
-</span><span id="__span-0-1589"><a id="__codelineno-0-1589" name="__codelineno-0-1589"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span>
-</span><span id="__span-0-1590"><a id="__codelineno-0-1590" name="__codelineno-0-1590"></a>
-</span><span id="__span-0-1591"><a id="__codelineno-0-1591" name="__codelineno-0-1591"></a>    <span class="c1"># If no suggestion was found, return None.</span>
-</span><span id="__span-0-1592"><a id="__codelineno-0-1592" name="__codelineno-0-1592"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-1593"><a id="__codelineno-0-1593" name="__codelineno-0-1593"></a>    <span class="k">return</span> <span class="kc">None</span>
+<span class="normal"><a href="#__codelineno-0-1593">1593</a></span>
+<span class="normal"><a href="#__codelineno-0-1594">1594</a></span>
+<span class="normal"><a href="#__codelineno-0-1595">1595</a></span>
+<span class="normal"><a href="#__codelineno-0-1596">1596</a></span>
+<span class="normal"><a href="#__codelineno-0-1597">1597</a></span>
+<span class="normal"><a href="#__codelineno-0-1598">1598</a></span>
+<span class="normal"><a href="#__codelineno-0-1599">1599</a></span>
+<span class="normal"><a href="#__codelineno-0-1600">1600</a></span>
+<span class="normal"><a href="#__codelineno-0-1601">1601</a></span>
+<span class="normal"><a href="#__codelineno-0-1602">1602</a></span>
+<span class="normal"><a href="#__codelineno-0-1603">1603</a></span>
+<span class="normal"><a href="#__codelineno-0-1604">1604</a></span>
+<span class="normal"><a href="#__codelineno-0-1605">1605</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1562"><a id="__codelineno-0-1562" name="__codelineno-0-1562"></a><span class="k">def</span> <span class="nf">suggest_next_exploration</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]:</span>
+</span><span id="__span-0-1563"><a id="__codelineno-0-1563" name="__codelineno-0-1563"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1564"><a id="__codelineno-0-1564" name="__codelineno-0-1564"></a><span class="sd">    Suggest the variable that should be explored next. Suggest the prepared variable in the partial causal graph</span>
+</span><span id="__span-0-1565"><a id="__codelineno-0-1565" name="__codelineno-0-1565"></a><span class="sd">    that has the most (nonzero) Unexplored incoming edges, if any; otherwise suggest the prepared variable</span>
+</span><span id="__span-0-1566"><a id="__codelineno-0-1566" name="__codelineno-0-1566"></a><span class="sd">    with the most (nonzero) Undecided incoming edges, even if it is not in the partial causal graph.</span>
+</span><span id="__span-0-1567"><a id="__codelineno-0-1567" name="__codelineno-0-1567"></a>
+</span><span id="__span-0-1568"><a id="__codelineno-0-1568" name="__codelineno-0-1568"></a><span class="sd">    If all edges are decided, return None.</span>
+</span><span id="__span-0-1569"><a id="__codelineno-0-1569" name="__codelineno-0-1569"></a>
+</span><span id="__span-0-1570"><a id="__codelineno-0-1570" name="__codelineno-0-1570"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-1571"><a id="__codelineno-0-1571" name="__codelineno-0-1571"></a><span class="sd">        The name of the variable to explore next.</span>
+</span><span id="__span-0-1572"><a id="__codelineno-0-1572" name="__codelineno-0-1572"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1573"><a id="__codelineno-0-1573" name="__codelineno-0-1573"></a>
+</span><span id="__span-0-1574"><a id="__codelineno-0-1574" name="__codelineno-0-1574"></a>    <span class="c1"># Try to find a suggestion from the partial causal graph.</span>
+</span><span id="__span-0-1575"><a id="__codelineno-0-1575" name="__codelineno-0-1575"></a>    <span class="n">node_names</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="o">.</span><span class="n">nodes</span><span class="p">)</span>
+</span><span id="__span-0-1576"><a id="__codelineno-0-1576" name="__codelineno-0-1576"></a>    <span class="n">graph_var_indices</span> <span class="o">=</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">idx</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">node_names</span><span class="p">]</span>
+</span><span id="__span-0-1577"><a id="__codelineno-0-1577" name="__codelineno-0-1577"></a>    <span class="n">graph_var_incoming_edge_states</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">m</span><span class="p">[:,</span> <span class="n">graph_var_indices</span><span class="p">]</span>
+</span><span id="__span-0-1578"><a id="__codelineno-0-1578" name="__codelineno-0-1578"></a>    <span class="n">undecided_edges_per_col</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-1579"><a id="__codelineno-0-1579" name="__codelineno-0-1579"></a>        <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">graph_var_incoming_edge_states</span> <span class="o">==</span> <span class="mi">0</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="__span-0-1580"><a id="__codelineno-0-1580" name="__codelineno-0-1580"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">graph_var_incoming_edge_states</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span>
+</span><span id="__span-0-1581"><a id="__codelineno-0-1581" name="__codelineno-0-1581"></a>        <span class="k">else</span> <span class="p">[]</span>
+</span><span id="__span-0-1582"><a id="__codelineno-0-1582" name="__codelineno-0-1582"></a>    <span class="p">)</span>
+</span><span id="__span-0-1583"><a id="__codelineno-0-1583" name="__codelineno-0-1583"></a>    <span class="n">max_undecided</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-1584"><a id="__codelineno-0-1584" name="__codelineno-0-1584"></a>        <span class="n">np</span><span class="o">.</span><span class="n">max</span><span class="p">(</span><span class="n">undecided_edges_per_col</span><span class="p">)</span> <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">undecided_edges_per_col</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
+</span><span id="__span-0-1585"><a id="__codelineno-0-1585" name="__codelineno-0-1585"></a>    <span class="p">)</span>
+</span><span id="__span-0-1586"><a id="__codelineno-0-1586" name="__codelineno-0-1586"></a>
+</span><span id="__span-0-1587"><a id="__codelineno-0-1587" name="__codelineno-0-1587"></a>    <span class="k">if</span> <span class="n">max_undecided</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-1588"><a id="__codelineno-0-1588" name="__codelineno-0-1588"></a>        <span class="n">max_undecided_idx</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argmax</span><span class="p">(</span><span class="n">undecided_edges_per_col</span><span class="p">)</span>
+</span><span id="__span-0-1589"><a id="__codelineno-0-1589" name="__codelineno-0-1589"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span> <span class="o">=</span> <span class="n">node_names</span><span class="p">[</span><span class="n">max_undecided_idx</span><span class="p">]</span>
+</span><span id="__span-0-1590"><a id="__codelineno-0-1590" name="__codelineno-0-1590"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span>
+</span><span id="__span-0-1591"><a id="__codelineno-0-1591" name="__codelineno-0-1591"></a>
+</span><span id="__span-0-1592"><a id="__codelineno-0-1592" name="__codelineno-0-1592"></a>    <span class="c1"># If no suggestion was found, try to find a suggestion from the entire collection of prepared variables.</span>
+</span><span id="__span-0-1593"><a id="__codelineno-0-1593" name="__codelineno-0-1593"></a>    <span class="n">undecided_edges_per_col</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">m</span> <span class="o">==</span> <span class="mi">0</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="__span-0-1594"><a id="__codelineno-0-1594" name="__codelineno-0-1594"></a>    <span class="n">max_undecided</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">max</span><span class="p">(</span><span class="n">undecided_edges_per_col</span><span class="p">)</span>
+</span><span id="__span-0-1595"><a id="__codelineno-0-1595" name="__codelineno-0-1595"></a>
+</span><span id="__span-0-1596"><a id="__codelineno-0-1596" name="__codelineno-0-1596"></a>    <span class="k">if</span> <span class="n">max_undecided</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-1597"><a id="__codelineno-0-1597" name="__codelineno-0-1597"></a>        <span class="n">max_undecided_idx</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argmax</span><span class="p">(</span><span class="n">undecided_edges_per_col</span><span class="p">)</span>
+</span><span id="__span-0-1598"><a id="__codelineno-0-1598" name="__codelineno-0-1598"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_variables</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span>
+</span><span id="__span-0-1599"><a id="__codelineno-0-1599" name="__codelineno-0-1599"></a>            <span class="n">max_undecided_idx</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span>
+</span><span id="__span-0-1600"><a id="__codelineno-0-1600" name="__codelineno-0-1600"></a>        <span class="p">]</span>
+</span><span id="__span-0-1601"><a id="__codelineno-0-1601" name="__codelineno-0-1601"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span>
+</span><span id="__span-0-1602"><a id="__codelineno-0-1602" name="__codelineno-0-1602"></a>
+</span><span id="__span-0-1603"><a id="__codelineno-0-1603" name="__codelineno-0-1603"></a>    <span class="c1"># If no suggestion was found, return None.</span>
+</span><span id="__span-0-1604"><a id="__codelineno-0-1604" name="__codelineno-0-1604"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_next_exploration</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-1605"><a id="__codelineno-0-1605" name="__codelineno-0-1605"></a>    <span class="k">return</span> <span class="kc">None</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -10819,19 +10932,7 @@ <h3 id="logos.logos.LOGos.discover_graph" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1595">1595</a></span>
-<span class="normal"><a href="#__codelineno-0-1596">1596</a></span>
-<span class="normal"><a href="#__codelineno-0-1597">1597</a></span>
-<span class="normal"><a href="#__codelineno-0-1598">1598</a></span>
-<span class="normal"><a href="#__codelineno-0-1599">1599</a></span>
-<span class="normal"><a href="#__codelineno-0-1600">1600</a></span>
-<span class="normal"><a href="#__codelineno-0-1601">1601</a></span>
-<span class="normal"><a href="#__codelineno-0-1602">1602</a></span>
-<span class="normal"><a href="#__codelineno-0-1603">1603</a></span>
-<span class="normal"><a href="#__codelineno-0-1604">1604</a></span>
-<span class="normal"><a href="#__codelineno-0-1605">1605</a></span>
-<span class="normal"><a href="#__codelineno-0-1606">1606</a></span>
-<span class="normal"><a href="#__codelineno-0-1607">1607</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1607">1607</a></span>
 <span class="normal"><a href="#__codelineno-0-1608">1608</a></span>
 <span class="normal"><a href="#__codelineno-0-1609">1609</a></span>
 <span class="normal"><a href="#__codelineno-0-1610">1610</a></span>
@@ -10848,36 +10949,48 @@ <h3 id="logos.logos.LOGos.discover_graph" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-1621">1621</a></span>
 <span class="normal"><a href="#__codelineno-0-1622">1622</a></span>
 <span class="normal"><a href="#__codelineno-0-1623">1623</a></span>
-<span class="normal"><a href="#__codelineno-0-1624">1624</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1595"><a id="__codelineno-0-1595" name="__codelineno-0-1595"></a><span class="k">def</span> <span class="nf">discover_graph</span><span class="p">(</span>
-</span><span id="__span-0-1596"><a id="__codelineno-0-1596" name="__codelineno-0-1596"></a>    <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-1597"><a id="__codelineno-0-1597" name="__codelineno-0-1597"></a>    <span class="n">method</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;hill_climb&quot;</span><span class="p">,</span>
-</span><span id="__span-0-1598"><a id="__codelineno-0-1598" name="__codelineno-0-1598"></a>    <span class="n">max_cond_vars</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">3</span><span class="p">,</span>
-</span><span id="__span-0-1599"><a id="__codelineno-0-1599" name="__codelineno-0-1599"></a>    <span class="n">model</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;gpt-3.5-turbo&quot;</span><span class="p">,</span>
-</span><span id="__span-0-1600"><a id="__codelineno-0-1600" name="__codelineno-0-1600"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-1601"><a id="__codelineno-0-1601" name="__codelineno-0-1601"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1602"><a id="__codelineno-0-1602" name="__codelineno-0-1602"></a><span class="sd">    Discover a causal graph based on the prepared table automatically.</span>
-</span><span id="__span-0-1603"><a id="__codelineno-0-1603" name="__codelineno-0-1603"></a>
-</span><span id="__span-0-1604"><a id="__codelineno-0-1604" name="__codelineno-0-1604"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-1605"><a id="__codelineno-0-1605" name="__codelineno-0-1605"></a><span class="sd">        method: The method to be used for graph discovery, among &quot;PC&quot;, &quot;hill_climb&quot;, &quot;exhaustive&quot; and &quot;GPT&quot;.</span>
-</span><span id="__span-0-1606"><a id="__codelineno-0-1606" name="__codelineno-0-1606"></a><span class="sd">        max_cond_vars: The maximum number of conditioning variables to be used for PC.</span>
-</span><span id="__span-0-1607"><a id="__codelineno-0-1607" name="__codelineno-0-1607"></a><span class="sd">        model: The model to be used for GPT-based graph discovery.</span>
-</span><span id="__span-0-1608"><a id="__codelineno-0-1608" name="__codelineno-0-1608"></a>
-</span><span id="__span-0-1609"><a id="__codelineno-0-1609" name="__codelineno-0-1609"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1610"><a id="__codelineno-0-1610" name="__codelineno-0-1610"></a>
-</span><span id="__span-0-1611"><a id="__codelineno-0-1611" name="__codelineno-0-1611"></a>    <span class="k">if</span> <span class="n">method</span> <span class="o">==</span> <span class="s2">&quot;PC&quot;</span><span class="p">:</span>
-</span><span id="__span-0-1612"><a id="__codelineno-0-1612" name="__codelineno-0-1612"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span> <span class="o">=</span> <span class="n">CausalDiscoverer</span><span class="o">.</span><span class="n">pc</span><span class="p">(</span>
-</span><span id="__span-0-1613"><a id="__codelineno-0-1613" name="__codelineno-0-1613"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span> <span class="n">max_cond_vars</span><span class="o">=</span><span class="n">max_cond_vars</span>
-</span><span id="__span-0-1614"><a id="__codelineno-0-1614" name="__codelineno-0-1614"></a>        <span class="p">)</span>
-</span><span id="__span-0-1615"><a id="__codelineno-0-1615" name="__codelineno-0-1615"></a>    <span class="k">elif</span> <span class="n">method</span> <span class="o">==</span> <span class="s2">&quot;hill_climb&quot;</span><span class="p">:</span>
-</span><span id="__span-0-1616"><a id="__codelineno-0-1616" name="__codelineno-0-1616"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span> <span class="o">=</span> <span class="n">CausalDiscoverer</span><span class="o">.</span><span class="n">hill_climb</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">)</span>
-</span><span id="__span-0-1617"><a id="__codelineno-0-1617" name="__codelineno-0-1617"></a>    <span class="k">elif</span> <span class="n">method</span> <span class="o">==</span> <span class="s2">&quot;exhaustive&quot;</span><span class="p">:</span>
-</span><span id="__span-0-1618"><a id="__codelineno-0-1618" name="__codelineno-0-1618"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span> <span class="o">=</span> <span class="n">CausalDiscoverer</span><span class="o">.</span><span class="n">exhaustive</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">)</span>
-</span><span id="__span-0-1619"><a id="__codelineno-0-1619" name="__codelineno-0-1619"></a>    <span class="k">elif</span> <span class="n">method</span> <span class="o">==</span> <span class="s2">&quot;GPT&quot;</span><span class="p">:</span>
-</span><span id="__span-0-1620"><a id="__codelineno-0-1620" name="__codelineno-0-1620"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span> <span class="o">=</span> <span class="n">CausalDiscoverer</span><span class="o">.</span><span class="n">gpt</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span> <span class="n">model</span><span class="o">=</span><span class="n">model</span><span class="p">)</span>
-</span><span id="__span-0-1621"><a id="__codelineno-0-1621" name="__codelineno-0-1621"></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-1622"><a id="__codelineno-0-1622" name="__codelineno-0-1622"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Invalid graph discovery method </span><span class="si">{</span><span class="n">method</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1623"><a id="__codelineno-0-1623" name="__codelineno-0-1623"></a>
-</span><span id="__span-0-1624"><a id="__codelineno-0-1624" name="__codelineno-0-1624"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">clear_and_set_from_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-1624">1624</a></span>
+<span class="normal"><a href="#__codelineno-0-1625">1625</a></span>
+<span class="normal"><a href="#__codelineno-0-1626">1626</a></span>
+<span class="normal"><a href="#__codelineno-0-1627">1627</a></span>
+<span class="normal"><a href="#__codelineno-0-1628">1628</a></span>
+<span class="normal"><a href="#__codelineno-0-1629">1629</a></span>
+<span class="normal"><a href="#__codelineno-0-1630">1630</a></span>
+<span class="normal"><a href="#__codelineno-0-1631">1631</a></span>
+<span class="normal"><a href="#__codelineno-0-1632">1632</a></span>
+<span class="normal"><a href="#__codelineno-0-1633">1633</a></span>
+<span class="normal"><a href="#__codelineno-0-1634">1634</a></span>
+<span class="normal"><a href="#__codelineno-0-1635">1635</a></span>
+<span class="normal"><a href="#__codelineno-0-1636">1636</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1607"><a id="__codelineno-0-1607" name="__codelineno-0-1607"></a><span class="k">def</span> <span class="nf">discover_graph</span><span class="p">(</span>
+</span><span id="__span-0-1608"><a id="__codelineno-0-1608" name="__codelineno-0-1608"></a>    <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-1609"><a id="__codelineno-0-1609" name="__codelineno-0-1609"></a>    <span class="n">method</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;hill_climb&quot;</span><span class="p">,</span>
+</span><span id="__span-0-1610"><a id="__codelineno-0-1610" name="__codelineno-0-1610"></a>    <span class="n">max_cond_vars</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">3</span><span class="p">,</span>
+</span><span id="__span-0-1611"><a id="__codelineno-0-1611" name="__codelineno-0-1611"></a>    <span class="n">model</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;gpt-3.5-turbo&quot;</span><span class="p">,</span>
+</span><span id="__span-0-1612"><a id="__codelineno-0-1612" name="__codelineno-0-1612"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-1613"><a id="__codelineno-0-1613" name="__codelineno-0-1613"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1614"><a id="__codelineno-0-1614" name="__codelineno-0-1614"></a><span class="sd">    Discover a causal graph based on the prepared table automatically.</span>
+</span><span id="__span-0-1615"><a id="__codelineno-0-1615" name="__codelineno-0-1615"></a>
+</span><span id="__span-0-1616"><a id="__codelineno-0-1616" name="__codelineno-0-1616"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-1617"><a id="__codelineno-0-1617" name="__codelineno-0-1617"></a><span class="sd">        method: The method to be used for graph discovery, among &quot;PC&quot;, &quot;hill_climb&quot;, &quot;exhaustive&quot; and &quot;GPT&quot;.</span>
+</span><span id="__span-0-1618"><a id="__codelineno-0-1618" name="__codelineno-0-1618"></a><span class="sd">        max_cond_vars: The maximum number of conditioning variables to be used for PC.</span>
+</span><span id="__span-0-1619"><a id="__codelineno-0-1619" name="__codelineno-0-1619"></a><span class="sd">        model: The model to be used for GPT-based graph discovery.</span>
+</span><span id="__span-0-1620"><a id="__codelineno-0-1620" name="__codelineno-0-1620"></a>
+</span><span id="__span-0-1621"><a id="__codelineno-0-1621" name="__codelineno-0-1621"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1622"><a id="__codelineno-0-1622" name="__codelineno-0-1622"></a>
+</span><span id="__span-0-1623"><a id="__codelineno-0-1623" name="__codelineno-0-1623"></a>    <span class="k">if</span> <span class="n">method</span> <span class="o">==</span> <span class="s2">&quot;PC&quot;</span><span class="p">:</span>
+</span><span id="__span-0-1624"><a id="__codelineno-0-1624" name="__codelineno-0-1624"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span> <span class="o">=</span> <span class="n">CausalDiscoverer</span><span class="o">.</span><span class="n">pc</span><span class="p">(</span>
+</span><span id="__span-0-1625"><a id="__codelineno-0-1625" name="__codelineno-0-1625"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span> <span class="n">max_cond_vars</span><span class="o">=</span><span class="n">max_cond_vars</span>
+</span><span id="__span-0-1626"><a id="__codelineno-0-1626" name="__codelineno-0-1626"></a>        <span class="p">)</span>
+</span><span id="__span-0-1627"><a id="__codelineno-0-1627" name="__codelineno-0-1627"></a>    <span class="k">elif</span> <span class="n">method</span> <span class="o">==</span> <span class="s2">&quot;hill_climb&quot;</span><span class="p">:</span>
+</span><span id="__span-0-1628"><a id="__codelineno-0-1628" name="__codelineno-0-1628"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span> <span class="o">=</span> <span class="n">CausalDiscoverer</span><span class="o">.</span><span class="n">hill_climb</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">)</span>
+</span><span id="__span-0-1629"><a id="__codelineno-0-1629" name="__codelineno-0-1629"></a>    <span class="k">elif</span> <span class="n">method</span> <span class="o">==</span> <span class="s2">&quot;exhaustive&quot;</span><span class="p">:</span>
+</span><span id="__span-0-1630"><a id="__codelineno-0-1630" name="__codelineno-0-1630"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span> <span class="o">=</span> <span class="n">CausalDiscoverer</span><span class="o">.</span><span class="n">exhaustive</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">)</span>
+</span><span id="__span-0-1631"><a id="__codelineno-0-1631" name="__codelineno-0-1631"></a>    <span class="k">elif</span> <span class="n">method</span> <span class="o">==</span> <span class="s2">&quot;GPT&quot;</span><span class="p">:</span>
+</span><span id="__span-0-1632"><a id="__codelineno-0-1632" name="__codelineno-0-1632"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_graph</span> <span class="o">=</span> <span class="n">CausalDiscoverer</span><span class="o">.</span><span class="n">gpt</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_prepared_log</span><span class="p">,</span> <span class="n">model</span><span class="o">=</span><span class="n">model</span><span class="p">)</span>
+</span><span id="__span-0-1633"><a id="__codelineno-0-1633" name="__codelineno-0-1633"></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-1634"><a id="__codelineno-0-1634" name="__codelineno-0-1634"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Invalid graph discovery method </span><span class="si">{</span><span class="n">method</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1635"><a id="__codelineno-0-1635" name="__codelineno-0-1635"></a>
+</span><span id="__span-0-1636"><a id="__codelineno-0-1636" name="__codelineno-0-1636"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_edge_states</span><span class="o">.</span><span class="n">clear_and_set_from_graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -10980,19 +11093,7 @@ <h3 id="logos.logos.LOGos.get_adjusted_ate" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1626">1626</a></span>
-<span class="normal"><a href="#__codelineno-0-1627">1627</a></span>
-<span class="normal"><a href="#__codelineno-0-1628">1628</a></span>
-<span class="normal"><a href="#__codelineno-0-1629">1629</a></span>
-<span class="normal"><a href="#__codelineno-0-1630">1630</a></span>
-<span class="normal"><a href="#__codelineno-0-1631">1631</a></span>
-<span class="normal"><a href="#__codelineno-0-1632">1632</a></span>
-<span class="normal"><a href="#__codelineno-0-1633">1633</a></span>
-<span class="normal"><a href="#__codelineno-0-1634">1634</a></span>
-<span class="normal"><a href="#__codelineno-0-1635">1635</a></span>
-<span class="normal"><a href="#__codelineno-0-1636">1636</a></span>
-<span class="normal"><a href="#__codelineno-0-1637">1637</a></span>
-<span class="normal"><a href="#__codelineno-0-1638">1638</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1638">1638</a></span>
 <span class="normal"><a href="#__codelineno-0-1639">1639</a></span>
 <span class="normal"><a href="#__codelineno-0-1640">1640</a></span>
 <span class="normal"><a href="#__codelineno-0-1641">1641</a></span>
@@ -11007,34 +11108,46 @@ <h3 id="logos.logos.LOGos.get_adjusted_ate" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-1650">1650</a></span>
 <span class="normal"><a href="#__codelineno-0-1651">1651</a></span>
 <span class="normal"><a href="#__codelineno-0-1652">1652</a></span>
-<span class="normal"><a href="#__codelineno-0-1653">1653</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1626"><a id="__codelineno-0-1626" name="__codelineno-0-1626"></a><span class="k">def</span> <span class="nf">get_adjusted_ate</span><span class="p">(</span>
-</span><span id="__span-0-1627"><a id="__codelineno-0-1627" name="__codelineno-0-1627"></a>    <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-1628"><a id="__codelineno-0-1628" name="__codelineno-0-1628"></a>    <span class="n">treatment</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="__span-0-1629"><a id="__codelineno-0-1629" name="__codelineno-0-1629"></a>    <span class="n">outcome</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="__span-0-1630"><a id="__codelineno-0-1630" name="__codelineno-0-1630"></a>    <span class="n">confounder</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-1631"><a id="__codelineno-0-1631" name="__codelineno-0-1631"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
-</span><span id="__span-0-1632"><a id="__codelineno-0-1632" name="__codelineno-0-1632"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1633"><a id="__codelineno-0-1633" name="__codelineno-0-1633"></a><span class="sd">    Calculate the adjusted ATE of `treatment` on `outcome`, given the current partial causal graph.</span>
-</span><span id="__span-0-1634"><a id="__codelineno-0-1634" name="__codelineno-0-1634"></a>
-</span><span id="__span-0-1635"><a id="__codelineno-0-1635" name="__codelineno-0-1635"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-1636"><a id="__codelineno-0-1636" name="__codelineno-0-1636"></a><span class="sd">        treatment: The name or tag of the treatment variable.</span>
-</span><span id="__span-0-1637"><a id="__codelineno-0-1637" name="__codelineno-0-1637"></a><span class="sd">        outcome: The name or tag of the outcome variable.</span>
-</span><span id="__span-0-1638"><a id="__codelineno-0-1638" name="__codelineno-0-1638"></a><span class="sd">        confounder: The name or tag of a confounder variable. If specified, overrides the current partial</span>
-</span><span id="__span-0-1639"><a id="__codelineno-0-1639" name="__codelineno-0-1639"></a><span class="sd">            causal graph in favor of a three-node graph with `treatment`, `outcome` and `confounder`.</span>
-</span><span id="__span-0-1640"><a id="__codelineno-0-1640" name="__codelineno-0-1640"></a>
-</span><span id="__span-0-1641"><a id="__codelineno-0-1641" name="__codelineno-0-1641"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-1642"><a id="__codelineno-0-1642" name="__codelineno-0-1642"></a><span class="sd">        The adjusted ATE of `treatment` on `outcome`.</span>
-</span><span id="__span-0-1643"><a id="__codelineno-0-1643" name="__codelineno-0-1643"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1644"><a id="__codelineno-0-1644" name="__codelineno-0-1644"></a>    <span class="k">return</span> <span class="n">ATECalculator</span><span class="o">.</span><span class="n">get_ate_and_confidence</span><span class="p">(</span>
-</span><span id="__span-0-1645"><a id="__codelineno-0-1645" name="__codelineno-0-1645"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">prepared_log</span><span class="p">,</span>
-</span><span id="__span-0-1646"><a id="__codelineno-0-1646" name="__codelineno-0-1646"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variables</span><span class="p">,</span>
-</span><span id="__span-0-1647"><a id="__codelineno-0-1647" name="__codelineno-0-1647"></a>        <span class="n">treatment</span><span class="p">,</span>
-</span><span id="__span-0-1648"><a id="__codelineno-0-1648" name="__codelineno-0-1648"></a>        <span class="n">outcome</span><span class="p">,</span>
-</span><span id="__span-0-1649"><a id="__codelineno-0-1649" name="__codelineno-0-1649"></a>        <span class="n">confounder</span><span class="p">,</span>
-</span><span id="__span-0-1650"><a id="__codelineno-0-1650" name="__codelineno-0-1650"></a>        <span class="n">graph</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span>
-</span><span id="__span-0-1651"><a id="__codelineno-0-1651" name="__codelineno-0-1651"></a>        <span class="n">calculate_p_value</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-</span><span id="__span-0-1652"><a id="__codelineno-0-1652" name="__codelineno-0-1652"></a>        <span class="n">calculate_std_error</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-</span><span id="__span-0-1653"><a id="__codelineno-0-1653" name="__codelineno-0-1653"></a>    <span class="p">)[</span><span class="s2">&quot;ATE&quot;</span><span class="p">]</span>
+<span class="normal"><a href="#__codelineno-0-1653">1653</a></span>
+<span class="normal"><a href="#__codelineno-0-1654">1654</a></span>
+<span class="normal"><a href="#__codelineno-0-1655">1655</a></span>
+<span class="normal"><a href="#__codelineno-0-1656">1656</a></span>
+<span class="normal"><a href="#__codelineno-0-1657">1657</a></span>
+<span class="normal"><a href="#__codelineno-0-1658">1658</a></span>
+<span class="normal"><a href="#__codelineno-0-1659">1659</a></span>
+<span class="normal"><a href="#__codelineno-0-1660">1660</a></span>
+<span class="normal"><a href="#__codelineno-0-1661">1661</a></span>
+<span class="normal"><a href="#__codelineno-0-1662">1662</a></span>
+<span class="normal"><a href="#__codelineno-0-1663">1663</a></span>
+<span class="normal"><a href="#__codelineno-0-1664">1664</a></span>
+<span class="normal"><a href="#__codelineno-0-1665">1665</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1638"><a id="__codelineno-0-1638" name="__codelineno-0-1638"></a><span class="k">def</span> <span class="nf">get_adjusted_ate</span><span class="p">(</span>
+</span><span id="__span-0-1639"><a id="__codelineno-0-1639" name="__codelineno-0-1639"></a>    <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-1640"><a id="__codelineno-0-1640" name="__codelineno-0-1640"></a>    <span class="n">treatment</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-1641"><a id="__codelineno-0-1641" name="__codelineno-0-1641"></a>    <span class="n">outcome</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-1642"><a id="__codelineno-0-1642" name="__codelineno-0-1642"></a>    <span class="n">confounder</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-1643"><a id="__codelineno-0-1643" name="__codelineno-0-1643"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
+</span><span id="__span-0-1644"><a id="__codelineno-0-1644" name="__codelineno-0-1644"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1645"><a id="__codelineno-0-1645" name="__codelineno-0-1645"></a><span class="sd">    Calculate the adjusted ATE of `treatment` on `outcome`, given the current partial causal graph.</span>
+</span><span id="__span-0-1646"><a id="__codelineno-0-1646" name="__codelineno-0-1646"></a>
+</span><span id="__span-0-1647"><a id="__codelineno-0-1647" name="__codelineno-0-1647"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-1648"><a id="__codelineno-0-1648" name="__codelineno-0-1648"></a><span class="sd">        treatment: The name or tag of the treatment variable.</span>
+</span><span id="__span-0-1649"><a id="__codelineno-0-1649" name="__codelineno-0-1649"></a><span class="sd">        outcome: The name or tag of the outcome variable.</span>
+</span><span id="__span-0-1650"><a id="__codelineno-0-1650" name="__codelineno-0-1650"></a><span class="sd">        confounder: The name or tag of a confounder variable. If specified, overrides the current partial</span>
+</span><span id="__span-0-1651"><a id="__codelineno-0-1651" name="__codelineno-0-1651"></a><span class="sd">            causal graph in favor of a three-node graph with `treatment`, `outcome` and `confounder`.</span>
+</span><span id="__span-0-1652"><a id="__codelineno-0-1652" name="__codelineno-0-1652"></a>
+</span><span id="__span-0-1653"><a id="__codelineno-0-1653" name="__codelineno-0-1653"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-1654"><a id="__codelineno-0-1654" name="__codelineno-0-1654"></a><span class="sd">        The adjusted ATE of `treatment` on `outcome`.</span>
+</span><span id="__span-0-1655"><a id="__codelineno-0-1655" name="__codelineno-0-1655"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1656"><a id="__codelineno-0-1656" name="__codelineno-0-1656"></a>    <span class="k">return</span> <span class="n">ATECalculator</span><span class="o">.</span><span class="n">get_ate_and_confidence</span><span class="p">(</span>
+</span><span id="__span-0-1657"><a id="__codelineno-0-1657" name="__codelineno-0-1657"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">prepared_log</span><span class="p">,</span>
+</span><span id="__span-0-1658"><a id="__codelineno-0-1658" name="__codelineno-0-1658"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variables</span><span class="p">,</span>
+</span><span id="__span-0-1659"><a id="__codelineno-0-1659" name="__codelineno-0-1659"></a>        <span class="n">treatment</span><span class="p">,</span>
+</span><span id="__span-0-1660"><a id="__codelineno-0-1660" name="__codelineno-0-1660"></a>        <span class="n">outcome</span><span class="p">,</span>
+</span><span id="__span-0-1661"><a id="__codelineno-0-1661" name="__codelineno-0-1661"></a>        <span class="n">confounder</span><span class="p">,</span>
+</span><span id="__span-0-1662"><a id="__codelineno-0-1662" name="__codelineno-0-1662"></a>        <span class="n">graph</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_graph</span><span class="p">,</span>
+</span><span id="__span-0-1663"><a id="__codelineno-0-1663" name="__codelineno-0-1663"></a>        <span class="n">calculate_p_value</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-1664"><a id="__codelineno-0-1664" name="__codelineno-0-1664"></a>        <span class="n">calculate_std_error</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-1665"><a id="__codelineno-0-1665" name="__codelineno-0-1665"></a>    <span class="p">)[</span><span class="s2">&quot;ATE&quot;</span><span class="p">]</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -11123,19 +11236,7 @@ <h3 id="logos.logos.LOGos.get_unadjusted_ate" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/logos.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1655">1655</a></span>
-<span class="normal"><a href="#__codelineno-0-1656">1656</a></span>
-<span class="normal"><a href="#__codelineno-0-1657">1657</a></span>
-<span class="normal"><a href="#__codelineno-0-1658">1658</a></span>
-<span class="normal"><a href="#__codelineno-0-1659">1659</a></span>
-<span class="normal"><a href="#__codelineno-0-1660">1660</a></span>
-<span class="normal"><a href="#__codelineno-0-1661">1661</a></span>
-<span class="normal"><a href="#__codelineno-0-1662">1662</a></span>
-<span class="normal"><a href="#__codelineno-0-1663">1663</a></span>
-<span class="normal"><a href="#__codelineno-0-1664">1664</a></span>
-<span class="normal"><a href="#__codelineno-0-1665">1665</a></span>
-<span class="normal"><a href="#__codelineno-0-1666">1666</a></span>
-<span class="normal"><a href="#__codelineno-0-1667">1667</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1667">1667</a></span>
 <span class="normal"><a href="#__codelineno-0-1668">1668</a></span>
 <span class="normal"><a href="#__codelineno-0-1669">1669</a></span>
 <span class="normal"><a href="#__codelineno-0-1670">1670</a></span>
@@ -11146,30 +11247,42 @@ <h3 id="logos.logos.LOGos.get_unadjusted_ate" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-1675">1675</a></span>
 <span class="normal"><a href="#__codelineno-0-1676">1676</a></span>
 <span class="normal"><a href="#__codelineno-0-1677">1677</a></span>
-<span class="normal"><a href="#__codelineno-0-1678">1678</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1655"><a id="__codelineno-0-1655" name="__codelineno-0-1655"></a><span class="k">def</span> <span class="nf">get_unadjusted_ate</span><span class="p">(</span>
-</span><span id="__span-0-1656"><a id="__codelineno-0-1656" name="__codelineno-0-1656"></a>    <span class="bp">self</span><span class="p">,</span>
-</span><span id="__span-0-1657"><a id="__codelineno-0-1657" name="__codelineno-0-1657"></a>    <span class="n">treatment</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="__span-0-1658"><a id="__codelineno-0-1658" name="__codelineno-0-1658"></a>    <span class="n">outcome</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="__span-0-1659"><a id="__codelineno-0-1659" name="__codelineno-0-1659"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
-</span><span id="__span-0-1660"><a id="__codelineno-0-1660" name="__codelineno-0-1660"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1661"><a id="__codelineno-0-1661" name="__codelineno-0-1661"></a><span class="sd">    Calculate the unadjusted ATE of `treatment` on `outcome`, ignoring the current partial causal graph</span>
-</span><span id="__span-0-1662"><a id="__codelineno-0-1662" name="__codelineno-0-1662"></a><span class="sd">    in favor of a two-node graph with just `treatment` and `outcome`.</span>
-</span><span id="__span-0-1663"><a id="__codelineno-0-1663" name="__codelineno-0-1663"></a>
-</span><span id="__span-0-1664"><a id="__codelineno-0-1664" name="__codelineno-0-1664"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-1665"><a id="__codelineno-0-1665" name="__codelineno-0-1665"></a><span class="sd">        treatment: The name or tag of the treatment variable.</span>
-</span><span id="__span-0-1666"><a id="__codelineno-0-1666" name="__codelineno-0-1666"></a><span class="sd">        outcome: The name or tag of the outcome variable.</span>
-</span><span id="__span-0-1667"><a id="__codelineno-0-1667" name="__codelineno-0-1667"></a>
-</span><span id="__span-0-1668"><a id="__codelineno-0-1668" name="__codelineno-0-1668"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-1669"><a id="__codelineno-0-1669" name="__codelineno-0-1669"></a><span class="sd">        The unadjusted ATE of `treatment` on `outcome`.</span>
-</span><span id="__span-0-1670"><a id="__codelineno-0-1670" name="__codelineno-0-1670"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1671"><a id="__codelineno-0-1671" name="__codelineno-0-1671"></a>    <span class="k">return</span> <span class="n">ATECalculator</span><span class="o">.</span><span class="n">get_ate_and_confidence</span><span class="p">(</span>
-</span><span id="__span-0-1672"><a id="__codelineno-0-1672" name="__codelineno-0-1672"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">prepared_log</span><span class="p">,</span>
-</span><span id="__span-0-1673"><a id="__codelineno-0-1673" name="__codelineno-0-1673"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variables</span><span class="p">,</span>
-</span><span id="__span-0-1674"><a id="__codelineno-0-1674" name="__codelineno-0-1674"></a>        <span class="n">treatment</span><span class="p">,</span>
-</span><span id="__span-0-1675"><a id="__codelineno-0-1675" name="__codelineno-0-1675"></a>        <span class="n">outcome</span><span class="p">,</span>
-</span><span id="__span-0-1676"><a id="__codelineno-0-1676" name="__codelineno-0-1676"></a>        <span class="n">calculate_p_value</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-</span><span id="__span-0-1677"><a id="__codelineno-0-1677" name="__codelineno-0-1677"></a>        <span class="n">calculate_std_error</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-</span><span id="__span-0-1678"><a id="__codelineno-0-1678" name="__codelineno-0-1678"></a>    <span class="p">)[</span><span class="s2">&quot;ATE&quot;</span><span class="p">]</span>
+<span class="normal"><a href="#__codelineno-0-1678">1678</a></span>
+<span class="normal"><a href="#__codelineno-0-1679">1679</a></span>
+<span class="normal"><a href="#__codelineno-0-1680">1680</a></span>
+<span class="normal"><a href="#__codelineno-0-1681">1681</a></span>
+<span class="normal"><a href="#__codelineno-0-1682">1682</a></span>
+<span class="normal"><a href="#__codelineno-0-1683">1683</a></span>
+<span class="normal"><a href="#__codelineno-0-1684">1684</a></span>
+<span class="normal"><a href="#__codelineno-0-1685">1685</a></span>
+<span class="normal"><a href="#__codelineno-0-1686">1686</a></span>
+<span class="normal"><a href="#__codelineno-0-1687">1687</a></span>
+<span class="normal"><a href="#__codelineno-0-1688">1688</a></span>
+<span class="normal"><a href="#__codelineno-0-1689">1689</a></span>
+<span class="normal"><a href="#__codelineno-0-1690">1690</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1667"><a id="__codelineno-0-1667" name="__codelineno-0-1667"></a><span class="k">def</span> <span class="nf">get_unadjusted_ate</span><span class="p">(</span>
+</span><span id="__span-0-1668"><a id="__codelineno-0-1668" name="__codelineno-0-1668"></a>    <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-1669"><a id="__codelineno-0-1669" name="__codelineno-0-1669"></a>    <span class="n">treatment</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-1670"><a id="__codelineno-0-1670" name="__codelineno-0-1670"></a>    <span class="n">outcome</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-1671"><a id="__codelineno-0-1671" name="__codelineno-0-1671"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
+</span><span id="__span-0-1672"><a id="__codelineno-0-1672" name="__codelineno-0-1672"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1673"><a id="__codelineno-0-1673" name="__codelineno-0-1673"></a><span class="sd">    Calculate the unadjusted ATE of `treatment` on `outcome`, ignoring the current partial causal graph</span>
+</span><span id="__span-0-1674"><a id="__codelineno-0-1674" name="__codelineno-0-1674"></a><span class="sd">    in favor of a two-node graph with just `treatment` and `outcome`.</span>
+</span><span id="__span-0-1675"><a id="__codelineno-0-1675" name="__codelineno-0-1675"></a>
+</span><span id="__span-0-1676"><a id="__codelineno-0-1676" name="__codelineno-0-1676"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-1677"><a id="__codelineno-0-1677" name="__codelineno-0-1677"></a><span class="sd">        treatment: The name or tag of the treatment variable.</span>
+</span><span id="__span-0-1678"><a id="__codelineno-0-1678" name="__codelineno-0-1678"></a><span class="sd">        outcome: The name or tag of the outcome variable.</span>
+</span><span id="__span-0-1679"><a id="__codelineno-0-1679" name="__codelineno-0-1679"></a>
+</span><span id="__span-0-1680"><a id="__codelineno-0-1680" name="__codelineno-0-1680"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-1681"><a id="__codelineno-0-1681" name="__codelineno-0-1681"></a><span class="sd">        The unadjusted ATE of `treatment` on `outcome`.</span>
+</span><span id="__span-0-1682"><a id="__codelineno-0-1682" name="__codelineno-0-1682"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1683"><a id="__codelineno-0-1683" name="__codelineno-0-1683"></a>    <span class="k">return</span> <span class="n">ATECalculator</span><span class="o">.</span><span class="n">get_ate_and_confidence</span><span class="p">(</span>
+</span><span id="__span-0-1684"><a id="__codelineno-0-1684" name="__codelineno-0-1684"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">prepared_log</span><span class="p">,</span>
+</span><span id="__span-0-1685"><a id="__codelineno-0-1685" name="__codelineno-0-1685"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">prepared_variables</span><span class="p">,</span>
+</span><span id="__span-0-1686"><a id="__codelineno-0-1686" name="__codelineno-0-1686"></a>        <span class="n">treatment</span><span class="p">,</span>
+</span><span id="__span-0-1687"><a id="__codelineno-0-1687" name="__codelineno-0-1687"></a>        <span class="n">outcome</span><span class="p">,</span>
+</span><span id="__span-0-1688"><a id="__codelineno-0-1688" name="__codelineno-0-1688"></a>        <span class="n">calculate_p_value</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-1689"><a id="__codelineno-0-1689" name="__codelineno-0-1689"></a>        <span class="n">calculate_std_error</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-1690"><a id="__codelineno-0-1690" name="__codelineno-0-1690"></a>    <span class="p">)[</span><span class="s2">&quot;ATE&quot;</span><span class="p">]</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
diff --git a/reference/logos/printer/index.html b/reference/logos/printer/index.html
index fae8f02..e3e6c74 100644
--- a/reference/logos/printer/index.html
+++ b/reference/logos/printer/index.html
@@ -1258,7 +1258,7 @@ <h2 id="logos.printer.Printer" class="doc doc-heading">
 </span><span id="__span-0-10"><a id="__codelineno-0-10" name="__codelineno-0-10"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
 </span><span id="__span-0-11"><a id="__codelineno-0-11" name="__codelineno-0-11"></a><span class="sd">    A flag indicating whether or not to print messages to the console.</span>
 </span><span id="__span-0-12"><a id="__codelineno-0-12" name="__codelineno-0-12"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-13"><a id="__codelineno-0-13" name="__codelineno-0-13"></a>    <span class="n">SAWMILL_VERBOSE</span> <span class="o">=</span> <span class="kc">False</span>
+</span><span id="__span-0-13"><a id="__codelineno-0-13" name="__codelineno-0-13"></a>    <span class="n">LOGOS_VERBOSE</span> <span class="o">=</span> <span class="kc">False</span>
 </span><span id="__span-0-14"><a id="__codelineno-0-14" name="__codelineno-0-14"></a>
 </span><span id="__span-0-15"><a id="__codelineno-0-15" name="__codelineno-0-15"></a>    <span class="nd">@classmethod</span>
 </span><span id="__span-0-16"><a id="__codelineno-0-16" name="__codelineno-0-16"></a>    <span class="k">def</span> <span class="nf">printv</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">msg</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
@@ -1268,7 +1268,7 @@ <h2 id="logos.printer.Printer" class="doc doc-heading">
 </span><span id="__span-0-20"><a id="__codelineno-0-20" name="__codelineno-0-20"></a><span class="sd">        Parameters:</span>
 </span><span id="__span-0-21"><a id="__codelineno-0-21" name="__codelineno-0-21"></a><span class="sd">            msg: The message to be printed.</span>
 </span><span id="__span-0-22"><a id="__codelineno-0-22" name="__codelineno-0-22"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-23"><a id="__codelineno-0-23" name="__codelineno-0-23"></a>        <span class="k">if</span> <span class="n">Printer</span><span class="o">.</span><span class="n">SAWMILL_VERBOSE</span><span class="p">:</span>
+</span><span id="__span-0-23"><a id="__codelineno-0-23" name="__codelineno-0-23"></a>        <span class="k">if</span> <span class="n">Printer</span><span class="o">.</span><span class="n">LOGOS_VERBOSE</span><span class="p">:</span>
 </span><span id="__span-0-24"><a id="__codelineno-0-24" name="__codelineno-0-24"></a>            <span class="nb">print</span><span class="p">(</span><span class="n">msg</span><span class="p">)</span>
 </span><span id="__span-0-25"><a id="__codelineno-0-25" name="__codelineno-0-25"></a>
 </span><span id="__span-0-26"><a id="__codelineno-0-26" name="__codelineno-0-26"></a>    <span class="nd">@classmethod</span>
@@ -1279,7 +1279,7 @@ <h2 id="logos.printer.Printer" class="doc doc-heading">
 </span><span id="__span-0-31"><a id="__codelineno-0-31" name="__codelineno-0-31"></a><span class="sd">        Parameters:</span>
 </span><span id="__span-0-32"><a id="__codelineno-0-32" name="__codelineno-0-32"></a><span class="sd">            val: The new verbosity value.</span>
 </span><span id="__span-0-33"><a id="__codelineno-0-33" name="__codelineno-0-33"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-34"><a id="__codelineno-0-34" name="__codelineno-0-34"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">SAWMILL_VERBOSE</span> <span class="o">=</span> <span class="n">val</span>
+</span><span id="__span-0-34"><a id="__codelineno-0-34" name="__codelineno-0-34"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">LOGOS_VERBOSE</span> <span class="o">=</span> <span class="n">val</span>
 </span><span id="__span-0-35"><a id="__codelineno-0-35" name="__codelineno-0-35"></a>
 </span><span id="__span-0-36"><a id="__codelineno-0-36" name="__codelineno-0-36"></a>    <span class="nd">@staticmethod</span>
 </span><span id="__span-0-37"><a id="__codelineno-0-37" name="__codelineno-0-37"></a>    <span class="k">def</span> <span class="nf">set_warnings_to</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">value</span><span class="p">:</span> <span class="nb">str</span><span class="p">):</span>
@@ -1377,7 +1377,7 @@ <h3 id="logos.printer.Printer.printv" class="doc doc-heading">
 </span><span id="__span-0-20"><a id="__codelineno-0-20" name="__codelineno-0-20"></a><span class="sd">    Parameters:</span>
 </span><span id="__span-0-21"><a id="__codelineno-0-21" name="__codelineno-0-21"></a><span class="sd">        msg: The message to be printed.</span>
 </span><span id="__span-0-22"><a id="__codelineno-0-22" name="__codelineno-0-22"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-23"><a id="__codelineno-0-23" name="__codelineno-0-23"></a>    <span class="k">if</span> <span class="n">Printer</span><span class="o">.</span><span class="n">SAWMILL_VERBOSE</span><span class="p">:</span>
+</span><span id="__span-0-23"><a id="__codelineno-0-23" name="__codelineno-0-23"></a>    <span class="k">if</span> <span class="n">Printer</span><span class="o">.</span><span class="n">LOGOS_VERBOSE</span><span class="p">:</span>
 </span><span id="__span-0-24"><a id="__codelineno-0-24" name="__codelineno-0-24"></a>        <span class="nb">print</span><span class="p">(</span><span class="n">msg</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
@@ -1449,7 +1449,7 @@ <h3 id="logos.printer.Printer.set_verbose" class="doc doc-heading">
 </span><span id="__span-0-31"><a id="__codelineno-0-31" name="__codelineno-0-31"></a><span class="sd">    Parameters:</span>
 </span><span id="__span-0-32"><a id="__codelineno-0-32" name="__codelineno-0-32"></a><span class="sd">        val: The new verbosity value.</span>
 </span><span id="__span-0-33"><a id="__codelineno-0-33" name="__codelineno-0-33"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-34"><a id="__codelineno-0-34" name="__codelineno-0-34"></a>    <span class="n">Printer</span><span class="o">.</span><span class="n">SAWMILL_VERBOSE</span> <span class="o">=</span> <span class="n">val</span>
+</span><span id="__span-0-34"><a id="__codelineno-0-34" name="__codelineno-0-34"></a>    <span class="n">Printer</span><span class="o">.</span><span class="n">LOGOS_VERBOSE</span> <span class="o">=</span> <span class="n">val</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
diff --git a/reference/logos/pruner/index.html b/reference/logos/pruner/index.html
index ace78de..4af52d2 100644
--- a/reference/logos/pruner/index.html
+++ b/reference/logos/pruner/index.html
@@ -1535,7 +1535,7 @@ <h2 id="logos.pruner.Pruner" class="doc doc-heading">
 </span><span id="__span-0-147"><a id="__codelineno-0-147" name="__codelineno-0-147"></a>        <span class="p">)</span>
 </span><span id="__span-0-148"><a id="__codelineno-0-148" name="__codelineno-0-148"></a>        <span class="k">if</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">isfile</span><span class="p">(</span><span class="n">filename</span><span class="p">)</span> <span class="ow">and</span> <span class="ow">not</span> <span class="n">force</span><span class="p">:</span>
 </span><span id="__span-0-149"><a id="__codelineno-0-149" name="__codelineno-0-149"></a>            <span class="n">df</span> <span class="o">=</span> <span class="n">pickle</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="nb">open</span><span class="p">(</span><span class="n">filename</span><span class="p">,</span> <span class="s2">&quot;rb&quot;</span><span class="p">))</span>
-</span><span id="__span-0-150"><a id="__codelineno-0-150" name="__codelineno-0-150"></a>            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Found pickled file&quot;</span><span class="p">)</span>
+</span><span id="__span-0-150"><a id="__codelineno-0-150" name="__codelineno-0-150"></a>            <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="s2">&quot;Found pickled file&quot;</span><span class="p">)</span>
 </span><span id="__span-0-151"><a id="__codelineno-0-151" name="__codelineno-0-151"></a>            <span class="k">return</span> <span class="nb">list</span><span class="p">(</span><span class="n">df</span><span class="o">.</span><span class="n">index</span><span class="p">[:</span><span class="n">top_n</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">)</span>
 </span><span id="__span-0-152"><a id="__codelineno-0-152" name="__codelineno-0-152"></a>
 </span><span id="__span-0-153"><a id="__codelineno-0-153" name="__codelineno-0-153"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="s2">&quot;Starting to prune using triangle method&quot;</span><span class="p">)</span>
@@ -2273,7 +2273,7 @@ <h3 id="logos.pruner.Pruner.prune_with_triangle" class="doc doc-heading">
 </span><span id="__span-0-147"><a id="__codelineno-0-147" name="__codelineno-0-147"></a>    <span class="p">)</span>
 </span><span id="__span-0-148"><a id="__codelineno-0-148" name="__codelineno-0-148"></a>    <span class="k">if</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">isfile</span><span class="p">(</span><span class="n">filename</span><span class="p">)</span> <span class="ow">and</span> <span class="ow">not</span> <span class="n">force</span><span class="p">:</span>
 </span><span id="__span-0-149"><a id="__codelineno-0-149" name="__codelineno-0-149"></a>        <span class="n">df</span> <span class="o">=</span> <span class="n">pickle</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="nb">open</span><span class="p">(</span><span class="n">filename</span><span class="p">,</span> <span class="s2">&quot;rb&quot;</span><span class="p">))</span>
-</span><span id="__span-0-150"><a id="__codelineno-0-150" name="__codelineno-0-150"></a>        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Found pickled file&quot;</span><span class="p">)</span>
+</span><span id="__span-0-150"><a id="__codelineno-0-150" name="__codelineno-0-150"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="s2">&quot;Found pickled file&quot;</span><span class="p">)</span>
 </span><span id="__span-0-151"><a id="__codelineno-0-151" name="__codelineno-0-151"></a>        <span class="k">return</span> <span class="nb">list</span><span class="p">(</span><span class="n">df</span><span class="o">.</span><span class="n">index</span><span class="p">[:</span><span class="n">top_n</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">)</span>
 </span><span id="__span-0-152"><a id="__codelineno-0-152" name="__codelineno-0-152"></a>
 </span><span id="__span-0-153"><a id="__codelineno-0-153" name="__codelineno-0-153"></a>    <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="s2">&quot;Starting to prune using triangle method&quot;</span><span class="p">)</span>
diff --git a/reference/logos/regression/index.html b/reference/logos/regression/index.html
index 587faa8..5e2abf9 100644
--- a/reference/logos/regression/index.html
+++ b/reference/logos/regression/index.html
@@ -1304,7 +1304,10 @@ <h2 id="logos.regression.Regression" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-102">102</a></span>
 <span class="normal"><a href="#__codelineno-0-103">103</a></span>
 <span class="normal"><a href="#__codelineno-0-104">104</a></span>
-<span class="normal"><a href="#__codelineno-0-105">105</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-5"><a id="__codelineno-0-5" name="__codelineno-0-5"></a><span class="k">class</span> <span class="nc">Regression</span><span class="p">:</span>
+<span class="normal"><a href="#__codelineno-0-105">105</a></span>
+<span class="normal"><a href="#__codelineno-0-106">106</a></span>
+<span class="normal"><a href="#__codelineno-0-107">107</a></span>
+<span class="normal"><a href="#__codelineno-0-108">108</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-5"><a id="__codelineno-0-5" name="__codelineno-0-5"></a><span class="k">class</span> <span class="nc">Regression</span><span class="p">:</span>
 </span><span id="__span-0-6"><a id="__codelineno-0-6" name="__codelineno-0-6"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
 </span><span id="__span-0-7"><a id="__codelineno-0-7" name="__codelineno-0-7"></a><span class="sd">    A collection of regression-related functions.</span>
 </span><span id="__span-0-8"><a id="__codelineno-0-8" name="__codelineno-0-8"></a><span class="sd">    &quot;&quot;&quot;</span>
@@ -1353,58 +1356,61 @@ <h2 id="logos.regression.Regression" class="doc doc-heading">
 </span><span id="__span-0-51"><a id="__codelineno-0-51" name="__codelineno-0-51"></a>        <span class="n">data</span> <span class="o">=</span> <span class="n">data</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span><span class="n">deep</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
 </span><span id="__span-0-52"><a id="__codelineno-0-52" name="__codelineno-0-52"></a>        <span class="n">stdevs</span> <span class="o">=</span> <span class="n">data</span><span class="o">.</span><span class="n">std</span><span class="p">()</span>
 </span><span id="__span-0-53"><a id="__codelineno-0-53" name="__codelineno-0-53"></a>
-</span><span id="__span-0-54"><a id="__codelineno-0-54" name="__codelineno-0-54"></a>        <span class="k">for</span> <span class="n">column</span> <span class="ow">in</span> <span class="n">data</span><span class="o">.</span><span class="n">columns</span><span class="p">:</span>
-</span><span id="__span-0-55"><a id="__codelineno-0-55" name="__codelineno-0-55"></a>            <span class="k">if</span> <span class="n">stdevs</span><span class="p">[</span><span class="n">column</span><span class="p">]</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-56"><a id="__codelineno-0-56" name="__codelineno-0-56"></a>                <span class="n">data</span><span class="o">.</span><span class="n">loc</span><span class="p">[:,</span> <span class="n">column</span><span class="p">]</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="__span-0-57"><a id="__codelineno-0-57" name="__codelineno-0-57"></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-58"><a id="__codelineno-0-58" name="__codelineno-0-58"></a>                <span class="n">data</span><span class="o">.</span><span class="n">loc</span><span class="p">[:,</span> <span class="n">column</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span><span class="n">data</span><span class="p">[</span><span class="n">column</span><span class="p">]</span> <span class="o">-</span> <span class="n">data</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">mean</span><span class="p">())</span> <span class="o">/</span> <span class="n">stdevs</span><span class="p">[</span>
-</span><span id="__span-0-59"><a id="__codelineno-0-59" name="__codelineno-0-59"></a>                    <span class="n">column</span>
-</span><span id="__span-0-60"><a id="__codelineno-0-60" name="__codelineno-0-60"></a>                <span class="p">]</span>
-</span><span id="__span-0-61"><a id="__codelineno-0-61" name="__codelineno-0-61"></a>        <span class="k">return</span> <span class="n">data</span><span class="p">,</span> <span class="n">stdevs</span>
-</span><span id="__span-0-62"><a id="__codelineno-0-62" name="__codelineno-0-62"></a>
-</span><span id="__span-0-63"><a id="__codelineno-0-63" name="__codelineno-0-63"></a>    <span class="nd">@staticmethod</span>
-</span><span id="__span-0-64"><a id="__codelineno-0-64" name="__codelineno-0-64"></a>    <span class="k">def</span> <span class="nf">multi_ols</span><span class="p">(</span>
-</span><span id="__span-0-65"><a id="__codelineno-0-65" name="__codelineno-0-65"></a>        <span class="n">X_names</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">X_data</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">Y_data</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span>
-</span><span id="__span-0-66"><a id="__codelineno-0-66" name="__codelineno-0-66"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
-</span><span id="__span-0-67"><a id="__codelineno-0-67" name="__codelineno-0-67"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-68"><a id="__codelineno-0-68" name="__codelineno-0-68"></a><span class="sd">        Calculate the slopes and p-values of a multivariate linear regression</span>
-</span><span id="__span-0-69"><a id="__codelineno-0-69" name="__codelineno-0-69"></a><span class="sd">        of the variables in `X` on `Y`. Normalize each column to zero mean and</span>
-</span><span id="__span-0-70"><a id="__codelineno-0-70" name="__codelineno-0-70"></a><span class="sd">        unit variance before running the regression. Return both the normalized</span>
-</span><span id="__span-0-71"><a id="__codelineno-0-71" name="__codelineno-0-71"></a><span class="sd">        and unnormalized slopes.</span>
-</span><span id="__span-0-72"><a id="__codelineno-0-72" name="__codelineno-0-72"></a>
-</span><span id="__span-0-73"><a id="__codelineno-0-73" name="__codelineno-0-73"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-74"><a id="__codelineno-0-74" name="__codelineno-0-74"></a><span class="sd">            X_names: The names of the predictor variables.</span>
-</span><span id="__span-0-75"><a id="__codelineno-0-75" name="__codelineno-0-75"></a><span class="sd">            X_data: The data for the predictor variables.</span>
-</span><span id="__span-0-76"><a id="__codelineno-0-76" name="__codelineno-0-76"></a><span class="sd">            Y_data: The data for the target variable.</span>
-</span><span id="__span-0-77"><a id="__codelineno-0-77" name="__codelineno-0-77"></a>
-</span><span id="__span-0-78"><a id="__codelineno-0-78" name="__codelineno-0-78"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-79"><a id="__codelineno-0-79" name="__codelineno-0-79"></a><span class="sd">            A dataframe with the names, slopes, and p-values of the regressions.</span>
-</span><span id="__span-0-80"><a id="__codelineno-0-80" name="__codelineno-0-80"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-81"><a id="__codelineno-0-81" name="__codelineno-0-81"></a>        <span class="n">X_data</span><span class="p">,</span> <span class="n">stdevs</span> <span class="o">=</span> <span class="n">Regression</span><span class="o">.</span><span class="n">get_normalized_copy</span><span class="p">(</span><span class="n">X_data</span><span class="p">)</span>
-</span><span id="__span-0-82"><a id="__codelineno-0-82" name="__codelineno-0-82"></a>
-</span><span id="__span-0-83"><a id="__codelineno-0-83" name="__codelineno-0-83"></a>        <span class="n">X_data</span> <span class="o">=</span> <span class="n">sm</span><span class="o">.</span><span class="n">add_constant</span><span class="p">(</span><span class="n">X_data</span><span class="p">)</span>
-</span><span id="__span-0-84"><a id="__codelineno-0-84" name="__codelineno-0-84"></a>        <span class="n">model</span> <span class="o">=</span> <span class="n">sm</span><span class="o">.</span><span class="n">OLS</span><span class="p">(</span><span class="n">Y_data</span><span class="p">,</span> <span class="n">X_data</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">()</span>
+</span><span id="__span-0-54"><a id="__codelineno-0-54" name="__codelineno-0-54"></a>        <span class="c1"># Cast all columns to float64 to avoid numpy warnings</span>
+</span><span id="__span-0-55"><a id="__codelineno-0-55" name="__codelineno-0-55"></a>        <span class="n">data</span> <span class="o">=</span> <span class="n">data</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="s2">&quot;float64&quot;</span><span class="p">)</span>
+</span><span id="__span-0-56"><a id="__codelineno-0-56" name="__codelineno-0-56"></a>
+</span><span id="__span-0-57"><a id="__codelineno-0-57" name="__codelineno-0-57"></a>        <span class="k">for</span> <span class="n">column</span> <span class="ow">in</span> <span class="n">data</span><span class="o">.</span><span class="n">columns</span><span class="p">:</span>
+</span><span id="__span-0-58"><a id="__codelineno-0-58" name="__codelineno-0-58"></a>            <span class="k">if</span> <span class="n">stdevs</span><span class="p">[</span><span class="n">column</span><span class="p">]</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-59"><a id="__codelineno-0-59" name="__codelineno-0-59"></a>                <span class="n">data</span><span class="o">.</span><span class="n">loc</span><span class="p">[:,</span> <span class="n">column</span><span class="p">]</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="__span-0-60"><a id="__codelineno-0-60" name="__codelineno-0-60"></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-61"><a id="__codelineno-0-61" name="__codelineno-0-61"></a>                <span class="n">data</span><span class="o">.</span><span class="n">loc</span><span class="p">[:,</span> <span class="n">column</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span><span class="n">data</span><span class="p">[</span><span class="n">column</span><span class="p">]</span> <span class="o">-</span> <span class="n">data</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">mean</span><span class="p">())</span> <span class="o">/</span> <span class="n">stdevs</span><span class="p">[</span>
+</span><span id="__span-0-62"><a id="__codelineno-0-62" name="__codelineno-0-62"></a>                    <span class="n">column</span>
+</span><span id="__span-0-63"><a id="__codelineno-0-63" name="__codelineno-0-63"></a>                <span class="p">]</span>
+</span><span id="__span-0-64"><a id="__codelineno-0-64" name="__codelineno-0-64"></a>        <span class="k">return</span> <span class="n">data</span><span class="p">,</span> <span class="n">stdevs</span>
+</span><span id="__span-0-65"><a id="__codelineno-0-65" name="__codelineno-0-65"></a>
+</span><span id="__span-0-66"><a id="__codelineno-0-66" name="__codelineno-0-66"></a>    <span class="nd">@staticmethod</span>
+</span><span id="__span-0-67"><a id="__codelineno-0-67" name="__codelineno-0-67"></a>    <span class="k">def</span> <span class="nf">multi_ols</span><span class="p">(</span>
+</span><span id="__span-0-68"><a id="__codelineno-0-68" name="__codelineno-0-68"></a>        <span class="n">X_names</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">X_data</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">Y_data</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span>
+</span><span id="__span-0-69"><a id="__codelineno-0-69" name="__codelineno-0-69"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
+</span><span id="__span-0-70"><a id="__codelineno-0-70" name="__codelineno-0-70"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-71"><a id="__codelineno-0-71" name="__codelineno-0-71"></a><span class="sd">        Calculate the slopes and p-values of a multivariate linear regression</span>
+</span><span id="__span-0-72"><a id="__codelineno-0-72" name="__codelineno-0-72"></a><span class="sd">        of the variables in `X` on `Y`. Normalize each column to zero mean and</span>
+</span><span id="__span-0-73"><a id="__codelineno-0-73" name="__codelineno-0-73"></a><span class="sd">        unit variance before running the regression. Return both the normalized</span>
+</span><span id="__span-0-74"><a id="__codelineno-0-74" name="__codelineno-0-74"></a><span class="sd">        and unnormalized slopes.</span>
+</span><span id="__span-0-75"><a id="__codelineno-0-75" name="__codelineno-0-75"></a>
+</span><span id="__span-0-76"><a id="__codelineno-0-76" name="__codelineno-0-76"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-77"><a id="__codelineno-0-77" name="__codelineno-0-77"></a><span class="sd">            X_names: The names of the predictor variables.</span>
+</span><span id="__span-0-78"><a id="__codelineno-0-78" name="__codelineno-0-78"></a><span class="sd">            X_data: The data for the predictor variables.</span>
+</span><span id="__span-0-79"><a id="__codelineno-0-79" name="__codelineno-0-79"></a><span class="sd">            Y_data: The data for the target variable.</span>
+</span><span id="__span-0-80"><a id="__codelineno-0-80" name="__codelineno-0-80"></a>
+</span><span id="__span-0-81"><a id="__codelineno-0-81" name="__codelineno-0-81"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-82"><a id="__codelineno-0-82" name="__codelineno-0-82"></a><span class="sd">            A dataframe with the names, slopes, and p-values of the regressions.</span>
+</span><span id="__span-0-83"><a id="__codelineno-0-83" name="__codelineno-0-83"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-84"><a id="__codelineno-0-84" name="__codelineno-0-84"></a>        <span class="n">X_data</span><span class="p">,</span> <span class="n">stdevs</span> <span class="o">=</span> <span class="n">Regression</span><span class="o">.</span><span class="n">get_normalized_copy</span><span class="p">(</span><span class="n">X_data</span><span class="p">)</span>
 </span><span id="__span-0-85"><a id="__codelineno-0-85" name="__codelineno-0-85"></a>
-</span><span id="__span-0-86"><a id="__codelineno-0-86" name="__codelineno-0-86"></a>        <span class="c1"># Get the coefficients and p-values, ignoring the constant</span>
-</span><span id="__span-0-87"><a id="__codelineno-0-87" name="__codelineno-0-87"></a>        <span class="n">coefficients</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">iloc</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
-</span><span id="__span-0-88"><a id="__codelineno-0-88" name="__codelineno-0-88"></a>        <span class="n">p_values</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">pvalues</span><span class="o">.</span><span class="n">iloc</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
-</span><span id="__span-0-89"><a id="__codelineno-0-89" name="__codelineno-0-89"></a>
-</span><span id="__span-0-90"><a id="__codelineno-0-90" name="__codelineno-0-90"></a>        <span class="c1"># Unnormalize the slopes</span>
-</span><span id="__span-0-91"><a id="__codelineno-0-91" name="__codelineno-0-91"></a>        <span class="n">coefficients_unnormalized</span> <span class="o">=</span> <span class="n">coefficients</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-</span><span id="__span-0-92"><a id="__codelineno-0-92" name="__codelineno-0-92"></a>        <span class="k">for</span> <span class="n">coeff</span> <span class="ow">in</span> <span class="n">coefficients_unnormalized</span><span class="o">.</span><span class="n">index</span><span class="p">:</span>
-</span><span id="__span-0-93"><a id="__codelineno-0-93" name="__codelineno-0-93"></a>            <span class="n">coefficients_unnormalized</span><span class="p">[</span><span class="n">coeff</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-94"><a id="__codelineno-0-94" name="__codelineno-0-94"></a>                <span class="n">coefficients</span><span class="p">[</span><span class="n">coeff</span><span class="p">]</span> <span class="o">/</span> <span class="n">stdevs</span><span class="p">[</span><span class="n">coeff</span><span class="p">]</span> <span class="k">if</span> <span class="n">stdevs</span><span class="p">[</span><span class="n">coeff</span><span class="p">]</span> <span class="o">!=</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
-</span><span id="__span-0-95"><a id="__codelineno-0-95" name="__codelineno-0-95"></a>            <span class="p">)</span>
-</span><span id="__span-0-96"><a id="__codelineno-0-96" name="__codelineno-0-96"></a>
-</span><span id="__span-0-97"><a id="__codelineno-0-97" name="__codelineno-0-97"></a>        <span class="k">return</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span>
-</span><span id="__span-0-98"><a id="__codelineno-0-98" name="__codelineno-0-98"></a>            <span class="p">{</span>
-</span><span id="__span-0-99"><a id="__codelineno-0-99" name="__codelineno-0-99"></a>                <span class="s2">&quot;Candidate&quot;</span><span class="p">:</span> <span class="n">coefficients</span><span class="o">.</span><span class="n">index</span><span class="p">,</span>
-</span><span id="__span-0-100"><a id="__codelineno-0-100" name="__codelineno-0-100"></a>                <span class="s2">&quot;Slope&quot;</span><span class="p">:</span> <span class="n">coefficients_unnormalized</span><span class="o">.</span><span class="n">values</span><span class="p">,</span>
-</span><span id="__span-0-101"><a id="__codelineno-0-101" name="__codelineno-0-101"></a>                <span class="s2">&quot;P-value&quot;</span><span class="p">:</span> <span class="n">p_values</span><span class="o">.</span><span class="n">values</span><span class="p">,</span>
-</span><span id="__span-0-102"><a id="__codelineno-0-102" name="__codelineno-0-102"></a>                <span class="s2">&quot;Normalized Slope&quot;</span><span class="p">:</span> <span class="n">coefficients</span><span class="o">.</span><span class="n">values</span><span class="p">,</span>
-</span><span id="__span-0-103"><a id="__codelineno-0-103" name="__codelineno-0-103"></a>                <span class="s2">&quot;Absolute Normalized Slope&quot;</span><span class="p">:</span> <span class="n">coefficients</span><span class="o">.</span><span class="n">abs</span><span class="p">()</span><span class="o">.</span><span class="n">values</span><span class="p">,</span>
-</span><span id="__span-0-104"><a id="__codelineno-0-104" name="__codelineno-0-104"></a>            <span class="p">}</span>
-</span><span id="__span-0-105"><a id="__codelineno-0-105" name="__codelineno-0-105"></a>        <span class="p">)</span>
+</span><span id="__span-0-86"><a id="__codelineno-0-86" name="__codelineno-0-86"></a>        <span class="n">X_data</span> <span class="o">=</span> <span class="n">sm</span><span class="o">.</span><span class="n">add_constant</span><span class="p">(</span><span class="n">X_data</span><span class="p">)</span>
+</span><span id="__span-0-87"><a id="__codelineno-0-87" name="__codelineno-0-87"></a>        <span class="n">model</span> <span class="o">=</span> <span class="n">sm</span><span class="o">.</span><span class="n">OLS</span><span class="p">(</span><span class="n">Y_data</span><span class="p">,</span> <span class="n">X_data</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">()</span>
+</span><span id="__span-0-88"><a id="__codelineno-0-88" name="__codelineno-0-88"></a>
+</span><span id="__span-0-89"><a id="__codelineno-0-89" name="__codelineno-0-89"></a>        <span class="c1"># Get the coefficients and p-values, ignoring the constant</span>
+</span><span id="__span-0-90"><a id="__codelineno-0-90" name="__codelineno-0-90"></a>        <span class="n">coefficients</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">iloc</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
+</span><span id="__span-0-91"><a id="__codelineno-0-91" name="__codelineno-0-91"></a>        <span class="n">p_values</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">pvalues</span><span class="o">.</span><span class="n">iloc</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
+</span><span id="__span-0-92"><a id="__codelineno-0-92" name="__codelineno-0-92"></a>
+</span><span id="__span-0-93"><a id="__codelineno-0-93" name="__codelineno-0-93"></a>        <span class="c1"># Unnormalize the slopes</span>
+</span><span id="__span-0-94"><a id="__codelineno-0-94" name="__codelineno-0-94"></a>        <span class="n">coefficients_unnormalized</span> <span class="o">=</span> <span class="n">coefficients</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
+</span><span id="__span-0-95"><a id="__codelineno-0-95" name="__codelineno-0-95"></a>        <span class="k">for</span> <span class="n">coeff</span> <span class="ow">in</span> <span class="n">coefficients_unnormalized</span><span class="o">.</span><span class="n">index</span><span class="p">:</span>
+</span><span id="__span-0-96"><a id="__codelineno-0-96" name="__codelineno-0-96"></a>            <span class="n">coefficients_unnormalized</span><span class="p">[</span><span class="n">coeff</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-97"><a id="__codelineno-0-97" name="__codelineno-0-97"></a>                <span class="n">coefficients</span><span class="p">[</span><span class="n">coeff</span><span class="p">]</span> <span class="o">/</span> <span class="n">stdevs</span><span class="p">[</span><span class="n">coeff</span><span class="p">]</span> <span class="k">if</span> <span class="n">stdevs</span><span class="p">[</span><span class="n">coeff</span><span class="p">]</span> <span class="o">!=</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
+</span><span id="__span-0-98"><a id="__codelineno-0-98" name="__codelineno-0-98"></a>            <span class="p">)</span>
+</span><span id="__span-0-99"><a id="__codelineno-0-99" name="__codelineno-0-99"></a>
+</span><span id="__span-0-100"><a id="__codelineno-0-100" name="__codelineno-0-100"></a>        <span class="k">return</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span>
+</span><span id="__span-0-101"><a id="__codelineno-0-101" name="__codelineno-0-101"></a>            <span class="p">{</span>
+</span><span id="__span-0-102"><a id="__codelineno-0-102" name="__codelineno-0-102"></a>                <span class="s2">&quot;Candidate&quot;</span><span class="p">:</span> <span class="n">coefficients</span><span class="o">.</span><span class="n">index</span><span class="p">,</span>
+</span><span id="__span-0-103"><a id="__codelineno-0-103" name="__codelineno-0-103"></a>                <span class="s2">&quot;Slope&quot;</span><span class="p">:</span> <span class="n">coefficients_unnormalized</span><span class="o">.</span><span class="n">values</span><span class="p">,</span>
+</span><span id="__span-0-104"><a id="__codelineno-0-104" name="__codelineno-0-104"></a>                <span class="s2">&quot;P-value&quot;</span><span class="p">:</span> <span class="n">p_values</span><span class="o">.</span><span class="n">values</span><span class="p">,</span>
+</span><span id="__span-0-105"><a id="__codelineno-0-105" name="__codelineno-0-105"></a>                <span class="s2">&quot;Normalized Slope&quot;</span><span class="p">:</span> <span class="n">coefficients</span><span class="o">.</span><span class="n">values</span><span class="p">,</span>
+</span><span id="__span-0-106"><a id="__codelineno-0-106" name="__codelineno-0-106"></a>                <span class="s2">&quot;Absolute Normalized Slope&quot;</span><span class="p">:</span> <span class="n">coefficients</span><span class="o">.</span><span class="n">abs</span><span class="p">()</span><span class="o">.</span><span class="n">values</span><span class="p">,</span>
+</span><span id="__span-0-107"><a id="__codelineno-0-107" name="__codelineno-0-107"></a>            <span class="p">}</span>
+</span><span id="__span-0-108"><a id="__codelineno-0-108" name="__codelineno-0-108"></a>        <span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
               </details>
 
@@ -1703,7 +1709,10 @@ <h3 id="logos.regression.Regression.get_normalized_copy" class="doc doc-heading"
 <span class="normal"><a href="#__codelineno-0-58">58</a></span>
 <span class="normal"><a href="#__codelineno-0-59">59</a></span>
 <span class="normal"><a href="#__codelineno-0-60">60</a></span>
-<span class="normal"><a href="#__codelineno-0-61">61</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-38"><a id="__codelineno-0-38" name="__codelineno-0-38"></a><span class="nd">@staticmethod</span>
+<span class="normal"><a href="#__codelineno-0-61">61</a></span>
+<span class="normal"><a href="#__codelineno-0-62">62</a></span>
+<span class="normal"><a href="#__codelineno-0-63">63</a></span>
+<span class="normal"><a href="#__codelineno-0-64">64</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-38"><a id="__codelineno-0-38" name="__codelineno-0-38"></a><span class="nd">@staticmethod</span>
 </span><span id="__span-0-39"><a id="__codelineno-0-39" name="__codelineno-0-39"></a><span class="k">def</span> <span class="nf">get_normalized_copy</span><span class="p">(</span><span class="n">data</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">]:</span>
 </span><span id="__span-0-40"><a id="__codelineno-0-40" name="__codelineno-0-40"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
 </span><span id="__span-0-41"><a id="__codelineno-0-41" name="__codelineno-0-41"></a><span class="sd">    Return a normalized copy of the input data, with zero mean</span>
@@ -1719,14 +1728,17 @@ <h3 id="logos.regression.Regression.get_normalized_copy" class="doc doc-heading"
 </span><span id="__span-0-51"><a id="__codelineno-0-51" name="__codelineno-0-51"></a>    <span class="n">data</span> <span class="o">=</span> <span class="n">data</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span><span class="n">deep</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
 </span><span id="__span-0-52"><a id="__codelineno-0-52" name="__codelineno-0-52"></a>    <span class="n">stdevs</span> <span class="o">=</span> <span class="n">data</span><span class="o">.</span><span class="n">std</span><span class="p">()</span>
 </span><span id="__span-0-53"><a id="__codelineno-0-53" name="__codelineno-0-53"></a>
-</span><span id="__span-0-54"><a id="__codelineno-0-54" name="__codelineno-0-54"></a>    <span class="k">for</span> <span class="n">column</span> <span class="ow">in</span> <span class="n">data</span><span class="o">.</span><span class="n">columns</span><span class="p">:</span>
-</span><span id="__span-0-55"><a id="__codelineno-0-55" name="__codelineno-0-55"></a>        <span class="k">if</span> <span class="n">stdevs</span><span class="p">[</span><span class="n">column</span><span class="p">]</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-56"><a id="__codelineno-0-56" name="__codelineno-0-56"></a>            <span class="n">data</span><span class="o">.</span><span class="n">loc</span><span class="p">[:,</span> <span class="n">column</span><span class="p">]</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="__span-0-57"><a id="__codelineno-0-57" name="__codelineno-0-57"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-58"><a id="__codelineno-0-58" name="__codelineno-0-58"></a>            <span class="n">data</span><span class="o">.</span><span class="n">loc</span><span class="p">[:,</span> <span class="n">column</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span><span class="n">data</span><span class="p">[</span><span class="n">column</span><span class="p">]</span> <span class="o">-</span> <span class="n">data</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">mean</span><span class="p">())</span> <span class="o">/</span> <span class="n">stdevs</span><span class="p">[</span>
-</span><span id="__span-0-59"><a id="__codelineno-0-59" name="__codelineno-0-59"></a>                <span class="n">column</span>
-</span><span id="__span-0-60"><a id="__codelineno-0-60" name="__codelineno-0-60"></a>            <span class="p">]</span>
-</span><span id="__span-0-61"><a id="__codelineno-0-61" name="__codelineno-0-61"></a>    <span class="k">return</span> <span class="n">data</span><span class="p">,</span> <span class="n">stdevs</span>
+</span><span id="__span-0-54"><a id="__codelineno-0-54" name="__codelineno-0-54"></a>    <span class="c1"># Cast all columns to float64 to avoid numpy warnings</span>
+</span><span id="__span-0-55"><a id="__codelineno-0-55" name="__codelineno-0-55"></a>    <span class="n">data</span> <span class="o">=</span> <span class="n">data</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="s2">&quot;float64&quot;</span><span class="p">)</span>
+</span><span id="__span-0-56"><a id="__codelineno-0-56" name="__codelineno-0-56"></a>
+</span><span id="__span-0-57"><a id="__codelineno-0-57" name="__codelineno-0-57"></a>    <span class="k">for</span> <span class="n">column</span> <span class="ow">in</span> <span class="n">data</span><span class="o">.</span><span class="n">columns</span><span class="p">:</span>
+</span><span id="__span-0-58"><a id="__codelineno-0-58" name="__codelineno-0-58"></a>        <span class="k">if</span> <span class="n">stdevs</span><span class="p">[</span><span class="n">column</span><span class="p">]</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-59"><a id="__codelineno-0-59" name="__codelineno-0-59"></a>            <span class="n">data</span><span class="o">.</span><span class="n">loc</span><span class="p">[:,</span> <span class="n">column</span><span class="p">]</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="__span-0-60"><a id="__codelineno-0-60" name="__codelineno-0-60"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-61"><a id="__codelineno-0-61" name="__codelineno-0-61"></a>            <span class="n">data</span><span class="o">.</span><span class="n">loc</span><span class="p">[:,</span> <span class="n">column</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span><span class="n">data</span><span class="p">[</span><span class="n">column</span><span class="p">]</span> <span class="o">-</span> <span class="n">data</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">mean</span><span class="p">())</span> <span class="o">/</span> <span class="n">stdevs</span><span class="p">[</span>
+</span><span id="__span-0-62"><a id="__codelineno-0-62" name="__codelineno-0-62"></a>                <span class="n">column</span>
+</span><span id="__span-0-63"><a id="__codelineno-0-63" name="__codelineno-0-63"></a>            <span class="p">]</span>
+</span><span id="__span-0-64"><a id="__codelineno-0-64" name="__codelineno-0-64"></a>    <span class="k">return</span> <span class="n">data</span><span class="p">,</span> <span class="n">stdevs</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -1835,10 +1847,7 @@ <h3 id="logos.regression.Regression.multi_ols" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/regression.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-63"> 63</a></span>
-<span class="normal"><a href="#__codelineno-0-64"> 64</a></span>
-<span class="normal"><a href="#__codelineno-0-65"> 65</a></span>
-<span class="normal"><a href="#__codelineno-0-66"> 66</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-66"> 66</a></span>
 <span class="normal"><a href="#__codelineno-0-67"> 67</a></span>
 <span class="normal"><a href="#__codelineno-0-68"> 68</a></span>
 <span class="normal"><a href="#__codelineno-0-69"> 69</a></span>
@@ -1877,49 +1886,52 @@ <h3 id="logos.regression.Regression.multi_ols" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-102">102</a></span>
 <span class="normal"><a href="#__codelineno-0-103">103</a></span>
 <span class="normal"><a href="#__codelineno-0-104">104</a></span>
-<span class="normal"><a href="#__codelineno-0-105">105</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-63"><a id="__codelineno-0-63" name="__codelineno-0-63"></a><span class="nd">@staticmethod</span>
-</span><span id="__span-0-64"><a id="__codelineno-0-64" name="__codelineno-0-64"></a><span class="k">def</span> <span class="nf">multi_ols</span><span class="p">(</span>
-</span><span id="__span-0-65"><a id="__codelineno-0-65" name="__codelineno-0-65"></a>    <span class="n">X_names</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">X_data</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">Y_data</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span>
-</span><span id="__span-0-66"><a id="__codelineno-0-66" name="__codelineno-0-66"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
-</span><span id="__span-0-67"><a id="__codelineno-0-67" name="__codelineno-0-67"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-68"><a id="__codelineno-0-68" name="__codelineno-0-68"></a><span class="sd">    Calculate the slopes and p-values of a multivariate linear regression</span>
-</span><span id="__span-0-69"><a id="__codelineno-0-69" name="__codelineno-0-69"></a><span class="sd">    of the variables in `X` on `Y`. Normalize each column to zero mean and</span>
-</span><span id="__span-0-70"><a id="__codelineno-0-70" name="__codelineno-0-70"></a><span class="sd">    unit variance before running the regression. Return both the normalized</span>
-</span><span id="__span-0-71"><a id="__codelineno-0-71" name="__codelineno-0-71"></a><span class="sd">    and unnormalized slopes.</span>
-</span><span id="__span-0-72"><a id="__codelineno-0-72" name="__codelineno-0-72"></a>
-</span><span id="__span-0-73"><a id="__codelineno-0-73" name="__codelineno-0-73"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-74"><a id="__codelineno-0-74" name="__codelineno-0-74"></a><span class="sd">        X_names: The names of the predictor variables.</span>
-</span><span id="__span-0-75"><a id="__codelineno-0-75" name="__codelineno-0-75"></a><span class="sd">        X_data: The data for the predictor variables.</span>
-</span><span id="__span-0-76"><a id="__codelineno-0-76" name="__codelineno-0-76"></a><span class="sd">        Y_data: The data for the target variable.</span>
-</span><span id="__span-0-77"><a id="__codelineno-0-77" name="__codelineno-0-77"></a>
-</span><span id="__span-0-78"><a id="__codelineno-0-78" name="__codelineno-0-78"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-79"><a id="__codelineno-0-79" name="__codelineno-0-79"></a><span class="sd">        A dataframe with the names, slopes, and p-values of the regressions.</span>
-</span><span id="__span-0-80"><a id="__codelineno-0-80" name="__codelineno-0-80"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-81"><a id="__codelineno-0-81" name="__codelineno-0-81"></a>    <span class="n">X_data</span><span class="p">,</span> <span class="n">stdevs</span> <span class="o">=</span> <span class="n">Regression</span><span class="o">.</span><span class="n">get_normalized_copy</span><span class="p">(</span><span class="n">X_data</span><span class="p">)</span>
-</span><span id="__span-0-82"><a id="__codelineno-0-82" name="__codelineno-0-82"></a>
-</span><span id="__span-0-83"><a id="__codelineno-0-83" name="__codelineno-0-83"></a>    <span class="n">X_data</span> <span class="o">=</span> <span class="n">sm</span><span class="o">.</span><span class="n">add_constant</span><span class="p">(</span><span class="n">X_data</span><span class="p">)</span>
-</span><span id="__span-0-84"><a id="__codelineno-0-84" name="__codelineno-0-84"></a>    <span class="n">model</span> <span class="o">=</span> <span class="n">sm</span><span class="o">.</span><span class="n">OLS</span><span class="p">(</span><span class="n">Y_data</span><span class="p">,</span> <span class="n">X_data</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">()</span>
+<span class="normal"><a href="#__codelineno-0-105">105</a></span>
+<span class="normal"><a href="#__codelineno-0-106">106</a></span>
+<span class="normal"><a href="#__codelineno-0-107">107</a></span>
+<span class="normal"><a href="#__codelineno-0-108">108</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-66"><a id="__codelineno-0-66" name="__codelineno-0-66"></a><span class="nd">@staticmethod</span>
+</span><span id="__span-0-67"><a id="__codelineno-0-67" name="__codelineno-0-67"></a><span class="k">def</span> <span class="nf">multi_ols</span><span class="p">(</span>
+</span><span id="__span-0-68"><a id="__codelineno-0-68" name="__codelineno-0-68"></a>    <span class="n">X_names</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">X_data</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">Y_data</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span>
+</span><span id="__span-0-69"><a id="__codelineno-0-69" name="__codelineno-0-69"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
+</span><span id="__span-0-70"><a id="__codelineno-0-70" name="__codelineno-0-70"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-71"><a id="__codelineno-0-71" name="__codelineno-0-71"></a><span class="sd">    Calculate the slopes and p-values of a multivariate linear regression</span>
+</span><span id="__span-0-72"><a id="__codelineno-0-72" name="__codelineno-0-72"></a><span class="sd">    of the variables in `X` on `Y`. Normalize each column to zero mean and</span>
+</span><span id="__span-0-73"><a id="__codelineno-0-73" name="__codelineno-0-73"></a><span class="sd">    unit variance before running the regression. Return both the normalized</span>
+</span><span id="__span-0-74"><a id="__codelineno-0-74" name="__codelineno-0-74"></a><span class="sd">    and unnormalized slopes.</span>
+</span><span id="__span-0-75"><a id="__codelineno-0-75" name="__codelineno-0-75"></a>
+</span><span id="__span-0-76"><a id="__codelineno-0-76" name="__codelineno-0-76"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-77"><a id="__codelineno-0-77" name="__codelineno-0-77"></a><span class="sd">        X_names: The names of the predictor variables.</span>
+</span><span id="__span-0-78"><a id="__codelineno-0-78" name="__codelineno-0-78"></a><span class="sd">        X_data: The data for the predictor variables.</span>
+</span><span id="__span-0-79"><a id="__codelineno-0-79" name="__codelineno-0-79"></a><span class="sd">        Y_data: The data for the target variable.</span>
+</span><span id="__span-0-80"><a id="__codelineno-0-80" name="__codelineno-0-80"></a>
+</span><span id="__span-0-81"><a id="__codelineno-0-81" name="__codelineno-0-81"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-82"><a id="__codelineno-0-82" name="__codelineno-0-82"></a><span class="sd">        A dataframe with the names, slopes, and p-values of the regressions.</span>
+</span><span id="__span-0-83"><a id="__codelineno-0-83" name="__codelineno-0-83"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-84"><a id="__codelineno-0-84" name="__codelineno-0-84"></a>    <span class="n">X_data</span><span class="p">,</span> <span class="n">stdevs</span> <span class="o">=</span> <span class="n">Regression</span><span class="o">.</span><span class="n">get_normalized_copy</span><span class="p">(</span><span class="n">X_data</span><span class="p">)</span>
 </span><span id="__span-0-85"><a id="__codelineno-0-85" name="__codelineno-0-85"></a>
-</span><span id="__span-0-86"><a id="__codelineno-0-86" name="__codelineno-0-86"></a>    <span class="c1"># Get the coefficients and p-values, ignoring the constant</span>
-</span><span id="__span-0-87"><a id="__codelineno-0-87" name="__codelineno-0-87"></a>    <span class="n">coefficients</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">iloc</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
-</span><span id="__span-0-88"><a id="__codelineno-0-88" name="__codelineno-0-88"></a>    <span class="n">p_values</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">pvalues</span><span class="o">.</span><span class="n">iloc</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
-</span><span id="__span-0-89"><a id="__codelineno-0-89" name="__codelineno-0-89"></a>
-</span><span id="__span-0-90"><a id="__codelineno-0-90" name="__codelineno-0-90"></a>    <span class="c1"># Unnormalize the slopes</span>
-</span><span id="__span-0-91"><a id="__codelineno-0-91" name="__codelineno-0-91"></a>    <span class="n">coefficients_unnormalized</span> <span class="o">=</span> <span class="n">coefficients</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-</span><span id="__span-0-92"><a id="__codelineno-0-92" name="__codelineno-0-92"></a>    <span class="k">for</span> <span class="n">coeff</span> <span class="ow">in</span> <span class="n">coefficients_unnormalized</span><span class="o">.</span><span class="n">index</span><span class="p">:</span>
-</span><span id="__span-0-93"><a id="__codelineno-0-93" name="__codelineno-0-93"></a>        <span class="n">coefficients_unnormalized</span><span class="p">[</span><span class="n">coeff</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-94"><a id="__codelineno-0-94" name="__codelineno-0-94"></a>            <span class="n">coefficients</span><span class="p">[</span><span class="n">coeff</span><span class="p">]</span> <span class="o">/</span> <span class="n">stdevs</span><span class="p">[</span><span class="n">coeff</span><span class="p">]</span> <span class="k">if</span> <span class="n">stdevs</span><span class="p">[</span><span class="n">coeff</span><span class="p">]</span> <span class="o">!=</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
-</span><span id="__span-0-95"><a id="__codelineno-0-95" name="__codelineno-0-95"></a>        <span class="p">)</span>
-</span><span id="__span-0-96"><a id="__codelineno-0-96" name="__codelineno-0-96"></a>
-</span><span id="__span-0-97"><a id="__codelineno-0-97" name="__codelineno-0-97"></a>    <span class="k">return</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span>
-</span><span id="__span-0-98"><a id="__codelineno-0-98" name="__codelineno-0-98"></a>        <span class="p">{</span>
-</span><span id="__span-0-99"><a id="__codelineno-0-99" name="__codelineno-0-99"></a>            <span class="s2">&quot;Candidate&quot;</span><span class="p">:</span> <span class="n">coefficients</span><span class="o">.</span><span class="n">index</span><span class="p">,</span>
-</span><span id="__span-0-100"><a id="__codelineno-0-100" name="__codelineno-0-100"></a>            <span class="s2">&quot;Slope&quot;</span><span class="p">:</span> <span class="n">coefficients_unnormalized</span><span class="o">.</span><span class="n">values</span><span class="p">,</span>
-</span><span id="__span-0-101"><a id="__codelineno-0-101" name="__codelineno-0-101"></a>            <span class="s2">&quot;P-value&quot;</span><span class="p">:</span> <span class="n">p_values</span><span class="o">.</span><span class="n">values</span><span class="p">,</span>
-</span><span id="__span-0-102"><a id="__codelineno-0-102" name="__codelineno-0-102"></a>            <span class="s2">&quot;Normalized Slope&quot;</span><span class="p">:</span> <span class="n">coefficients</span><span class="o">.</span><span class="n">values</span><span class="p">,</span>
-</span><span id="__span-0-103"><a id="__codelineno-0-103" name="__codelineno-0-103"></a>            <span class="s2">&quot;Absolute Normalized Slope&quot;</span><span class="p">:</span> <span class="n">coefficients</span><span class="o">.</span><span class="n">abs</span><span class="p">()</span><span class="o">.</span><span class="n">values</span><span class="p">,</span>
-</span><span id="__span-0-104"><a id="__codelineno-0-104" name="__codelineno-0-104"></a>        <span class="p">}</span>
-</span><span id="__span-0-105"><a id="__codelineno-0-105" name="__codelineno-0-105"></a>    <span class="p">)</span>
+</span><span id="__span-0-86"><a id="__codelineno-0-86" name="__codelineno-0-86"></a>    <span class="n">X_data</span> <span class="o">=</span> <span class="n">sm</span><span class="o">.</span><span class="n">add_constant</span><span class="p">(</span><span class="n">X_data</span><span class="p">)</span>
+</span><span id="__span-0-87"><a id="__codelineno-0-87" name="__codelineno-0-87"></a>    <span class="n">model</span> <span class="o">=</span> <span class="n">sm</span><span class="o">.</span><span class="n">OLS</span><span class="p">(</span><span class="n">Y_data</span><span class="p">,</span> <span class="n">X_data</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">()</span>
+</span><span id="__span-0-88"><a id="__codelineno-0-88" name="__codelineno-0-88"></a>
+</span><span id="__span-0-89"><a id="__codelineno-0-89" name="__codelineno-0-89"></a>    <span class="c1"># Get the coefficients and p-values, ignoring the constant</span>
+</span><span id="__span-0-90"><a id="__codelineno-0-90" name="__codelineno-0-90"></a>    <span class="n">coefficients</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">params</span><span class="o">.</span><span class="n">iloc</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
+</span><span id="__span-0-91"><a id="__codelineno-0-91" name="__codelineno-0-91"></a>    <span class="n">p_values</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">pvalues</span><span class="o">.</span><span class="n">iloc</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
+</span><span id="__span-0-92"><a id="__codelineno-0-92" name="__codelineno-0-92"></a>
+</span><span id="__span-0-93"><a id="__codelineno-0-93" name="__codelineno-0-93"></a>    <span class="c1"># Unnormalize the slopes</span>
+</span><span id="__span-0-94"><a id="__codelineno-0-94" name="__codelineno-0-94"></a>    <span class="n">coefficients_unnormalized</span> <span class="o">=</span> <span class="n">coefficients</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
+</span><span id="__span-0-95"><a id="__codelineno-0-95" name="__codelineno-0-95"></a>    <span class="k">for</span> <span class="n">coeff</span> <span class="ow">in</span> <span class="n">coefficients_unnormalized</span><span class="o">.</span><span class="n">index</span><span class="p">:</span>
+</span><span id="__span-0-96"><a id="__codelineno-0-96" name="__codelineno-0-96"></a>        <span class="n">coefficients_unnormalized</span><span class="p">[</span><span class="n">coeff</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-97"><a id="__codelineno-0-97" name="__codelineno-0-97"></a>            <span class="n">coefficients</span><span class="p">[</span><span class="n">coeff</span><span class="p">]</span> <span class="o">/</span> <span class="n">stdevs</span><span class="p">[</span><span class="n">coeff</span><span class="p">]</span> <span class="k">if</span> <span class="n">stdevs</span><span class="p">[</span><span class="n">coeff</span><span class="p">]</span> <span class="o">!=</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
+</span><span id="__span-0-98"><a id="__codelineno-0-98" name="__codelineno-0-98"></a>        <span class="p">)</span>
+</span><span id="__span-0-99"><a id="__codelineno-0-99" name="__codelineno-0-99"></a>
+</span><span id="__span-0-100"><a id="__codelineno-0-100" name="__codelineno-0-100"></a>    <span class="k">return</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span>
+</span><span id="__span-0-101"><a id="__codelineno-0-101" name="__codelineno-0-101"></a>        <span class="p">{</span>
+</span><span id="__span-0-102"><a id="__codelineno-0-102" name="__codelineno-0-102"></a>            <span class="s2">&quot;Candidate&quot;</span><span class="p">:</span> <span class="n">coefficients</span><span class="o">.</span><span class="n">index</span><span class="p">,</span>
+</span><span id="__span-0-103"><a id="__codelineno-0-103" name="__codelineno-0-103"></a>            <span class="s2">&quot;Slope&quot;</span><span class="p">:</span> <span class="n">coefficients_unnormalized</span><span class="o">.</span><span class="n">values</span><span class="p">,</span>
+</span><span id="__span-0-104"><a id="__codelineno-0-104" name="__codelineno-0-104"></a>            <span class="s2">&quot;P-value&quot;</span><span class="p">:</span> <span class="n">p_values</span><span class="o">.</span><span class="n">values</span><span class="p">,</span>
+</span><span id="__span-0-105"><a id="__codelineno-0-105" name="__codelineno-0-105"></a>            <span class="s2">&quot;Normalized Slope&quot;</span><span class="p">:</span> <span class="n">coefficients</span><span class="o">.</span><span class="n">values</span><span class="p">,</span>
+</span><span id="__span-0-106"><a id="__codelineno-0-106" name="__codelineno-0-106"></a>            <span class="s2">&quot;Absolute Normalized Slope&quot;</span><span class="p">:</span> <span class="n">coefficients</span><span class="o">.</span><span class="n">abs</span><span class="p">()</span><span class="o">.</span><span class="n">values</span><span class="p">,</span>
+</span><span id="__span-0-107"><a id="__codelineno-0-107" name="__codelineno-0-107"></a>        <span class="p">}</span>
+</span><span id="__span-0-108"><a id="__codelineno-0-108" name="__codelineno-0-108"></a>    <span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
diff --git a/reference/logos/tag_utils/index.html b/reference/logos/tag_utils/index.html
index 8f08638..2198f24 100644
--- a/reference/logos/tag_utils/index.html
+++ b/reference/logos/tag_utils/index.html
@@ -1468,8 +1468,7 @@ <h2 id="logos.tag_utils.TagOrigin" class="doc doc-heading">
 
               <details class="quote">
                 <summary>Source code in <code>src/logos/tag_utils.py</code></summary>
-                <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-8"> 8</a></span>
-<span class="normal"><a href="#__codelineno-0-9"> 9</a></span>
+                <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-9"> 9</a></span>
 <span class="normal"><a href="#__codelineno-0-10">10</a></span>
 <span class="normal"><a href="#__codelineno-0-11">11</a></span>
 <span class="normal"><a href="#__codelineno-0-12">12</a></span>
@@ -1482,21 +1481,22 @@ <h2 id="logos.tag_utils.TagOrigin" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-19">19</a></span>
 <span class="normal"><a href="#__codelineno-0-20">20</a></span>
 <span class="normal"><a href="#__codelineno-0-21">21</a></span>
-<span class="normal"><a href="#__codelineno-0-22">22</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-8"><a id="__codelineno-0-8" name="__codelineno-0-8"></a><span class="k">class</span> <span class="nc">TagOrigin</span><span class="p">(</span><span class="n">IntEnum</span><span class="p">):</span>
-</span><span id="__span-0-9"><a id="__codelineno-0-9" name="__codelineno-0-9"></a>    <span class="n">PRECEDING</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="__span-0-10"><a id="__codelineno-0-10" name="__codelineno-0-10"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Indicates that the tag was derived from the preceding tokens in the corresponding template.&quot;&quot;&quot;</span>
-</span><span id="__span-0-11"><a id="__codelineno-0-11" name="__codelineno-0-11"></a>
-</span><span id="__span-0-12"><a id="__codelineno-0-12" name="__codelineno-0-12"></a>    <span class="n">GPT_3POINT5_TURBO</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">1</span>
-</span><span id="__span-0-13"><a id="__codelineno-0-13" name="__codelineno-0-13"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Indicates that the tag was derived using gpt-3.5-turbo.&quot;&quot;&quot;</span>
-</span><span id="__span-0-14"><a id="__codelineno-0-14" name="__codelineno-0-14"></a>
-</span><span id="__span-0-15"><a id="__codelineno-0-15" name="__codelineno-0-15"></a>    <span class="n">GPT_4</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">2</span>
-</span><span id="__span-0-16"><a id="__codelineno-0-16" name="__codelineno-0-16"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Indicates that the tag was derived using gpt-4.&quot;&quot;&quot;</span>
-</span><span id="__span-0-17"><a id="__codelineno-0-17" name="__codelineno-0-17"></a>
-</span><span id="__span-0-18"><a id="__codelineno-0-18" name="__codelineno-0-18"></a>    <span class="n">NAME</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">3</span>
-</span><span id="__span-0-19"><a id="__codelineno-0-19" name="__codelineno-0-19"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Indicates that the tag was derived from the name of the variable.&quot;&quot;&quot;</span>
-</span><span id="__span-0-20"><a id="__codelineno-0-20" name="__codelineno-0-20"></a>
-</span><span id="__span-0-21"><a id="__codelineno-0-21" name="__codelineno-0-21"></a>    <span class="n">REGEX_VARIABLE</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">4</span>
-</span><span id="__span-0-22"><a id="__codelineno-0-22" name="__codelineno-0-22"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Indicates that the tag was derived from the name of the variable because the name was given by the user.&quot;&quot;&quot;</span>
+<span class="normal"><a href="#__codelineno-0-22">22</a></span>
+<span class="normal"><a href="#__codelineno-0-23">23</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-9"><a id="__codelineno-0-9" name="__codelineno-0-9"></a><span class="k">class</span> <span class="nc">TagOrigin</span><span class="p">(</span><span class="n">IntEnum</span><span class="p">):</span>
+</span><span id="__span-0-10"><a id="__codelineno-0-10" name="__codelineno-0-10"></a>    <span class="n">PRECEDING</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="__span-0-11"><a id="__codelineno-0-11" name="__codelineno-0-11"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Indicates that the tag was derived from the preceding tokens in the corresponding template.&quot;&quot;&quot;</span>
+</span><span id="__span-0-12"><a id="__codelineno-0-12" name="__codelineno-0-12"></a>
+</span><span id="__span-0-13"><a id="__codelineno-0-13" name="__codelineno-0-13"></a>    <span class="n">GPT_3POINT5_TURBO</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">1</span>
+</span><span id="__span-0-14"><a id="__codelineno-0-14" name="__codelineno-0-14"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Indicates that the tag was derived using gpt-3.5-turbo.&quot;&quot;&quot;</span>
+</span><span id="__span-0-15"><a id="__codelineno-0-15" name="__codelineno-0-15"></a>
+</span><span id="__span-0-16"><a id="__codelineno-0-16" name="__codelineno-0-16"></a>    <span class="n">GPT_4</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">2</span>
+</span><span id="__span-0-17"><a id="__codelineno-0-17" name="__codelineno-0-17"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Indicates that the tag was derived using gpt-4.&quot;&quot;&quot;</span>
+</span><span id="__span-0-18"><a id="__codelineno-0-18" name="__codelineno-0-18"></a>
+</span><span id="__span-0-19"><a id="__codelineno-0-19" name="__codelineno-0-19"></a>    <span class="n">NAME</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">3</span>
+</span><span id="__span-0-20"><a id="__codelineno-0-20" name="__codelineno-0-20"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Indicates that the tag was derived from the name of the variable.&quot;&quot;&quot;</span>
+</span><span id="__span-0-21"><a id="__codelineno-0-21" name="__codelineno-0-21"></a>
+</span><span id="__span-0-22"><a id="__codelineno-0-22" name="__codelineno-0-22"></a>    <span class="n">REGEX_VARIABLE</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">4</span>
+</span><span id="__span-0-23"><a id="__codelineno-0-23" name="__codelineno-0-23"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Indicates that the tag was derived from the name of the variable because the name was given by the user.&quot;&quot;&quot;</span>
 </span></code></pre></div></td></tr></table></div>
               </details>
 
@@ -1648,8 +1648,7 @@ <h2 id="logos.tag_utils.TagUtils" class="doc doc-heading">
 
               <details class="quote">
                 <summary>Source code in <code>src/logos/tag_utils.py</code></summary>
-                <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-25"> 25</a></span>
-<span class="normal"><a href="#__codelineno-0-26"> 26</a></span>
+                <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-26"> 26</a></span>
 <span class="normal"><a href="#__codelineno-0-27"> 27</a></span>
 <span class="normal"><a href="#__codelineno-0-28"> 28</a></span>
 <span class="normal"><a href="#__codelineno-0-29"> 29</a></span>
@@ -1999,358 +1998,359 @@ <h2 id="logos.tag_utils.TagUtils" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-373">373</a></span>
 <span class="normal"><a href="#__codelineno-0-374">374</a></span>
 <span class="normal"><a href="#__codelineno-0-375">375</a></span>
-<span class="normal"><a href="#__codelineno-0-376">376</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-25"><a id="__codelineno-0-25" name="__codelineno-0-25"></a><span class="k">class</span> <span class="nc">TagUtils</span><span class="p">:</span>
-</span><span id="__span-0-26"><a id="__codelineno-0-26" name="__codelineno-0-26"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-27"><a id="__codelineno-0-27" name="__codelineno-0-27"></a><span class="sd">    A class for managing tags of parsed and prepared variables.</span>
-</span><span id="__span-0-28"><a id="__codelineno-0-28" name="__codelineno-0-28"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-29"><a id="__codelineno-0-29" name="__codelineno-0-29"></a>
-</span><span id="__span-0-30"><a id="__codelineno-0-30" name="__codelineno-0-30"></a>    <span class="nd">@staticmethod</span>
-</span><span id="__span-0-31"><a id="__codelineno-0-31" name="__codelineno-0-31"></a>    <span class="k">def</span> <span class="nf">check_columns</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">columns</span><span class="p">:</span> <span class="nb">list</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-32"><a id="__codelineno-0-32" name="__codelineno-0-32"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-33"><a id="__codelineno-0-33" name="__codelineno-0-33"></a><span class="sd">        Check that the specified columns exist in the dataframe.</span>
-</span><span id="__span-0-34"><a id="__codelineno-0-34" name="__codelineno-0-34"></a>
-</span><span id="__span-0-35"><a id="__codelineno-0-35" name="__codelineno-0-35"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-36"><a id="__codelineno-0-36" name="__codelineno-0-36"></a><span class="sd">            df: The dataframe to be checked.</span>
-</span><span id="__span-0-37"><a id="__codelineno-0-37" name="__codelineno-0-37"></a><span class="sd">            columns: The columns to be checked.</span>
-</span><span id="__span-0-38"><a id="__codelineno-0-38" name="__codelineno-0-38"></a>
-</span><span id="__span-0-39"><a id="__codelineno-0-39" name="__codelineno-0-39"></a><span class="sd">        Raises:</span>
-</span><span id="__span-0-40"><a id="__codelineno-0-40" name="__codelineno-0-40"></a><span class="sd">            ValueError: If any of the columns are not present in the dataframe.</span>
-</span><span id="__span-0-41"><a id="__codelineno-0-41" name="__codelineno-0-41"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-42"><a id="__codelineno-0-42" name="__codelineno-0-42"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">set</span><span class="p">(</span><span class="n">columns</span><span class="p">)</span><span class="o">.</span><span class="n">issubset</span><span class="p">(</span><span class="nb">set</span><span class="p">(</span><span class="n">df</span><span class="o">.</span><span class="n">columns</span><span class="p">)):</span>
-</span><span id="__span-0-43"><a id="__codelineno-0-43" name="__codelineno-0-43"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Columns </span><span class="si">{</span><span class="n">columns</span><span class="si">}</span><span class="s2"> are not all present in the dataframe.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-44"><a id="__codelineno-0-44" name="__codelineno-0-44"></a>
-</span><span id="__span-0-45"><a id="__codelineno-0-45" name="__codelineno-0-45"></a>    <span class="nd">@staticmethod</span>
-</span><span id="__span-0-46"><a id="__codelineno-0-46" name="__codelineno-0-46"></a>    <span class="k">def</span> <span class="nf">check_fields</span><span class="p">(</span><span class="n">series</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">,</span> <span class="n">fields</span><span class="p">:</span> <span class="nb">list</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-47"><a id="__codelineno-0-47" name="__codelineno-0-47"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-48"><a id="__codelineno-0-48" name="__codelineno-0-48"></a><span class="sd">        Check that the specified fields exist in the specified series.</span>
-</span><span id="__span-0-49"><a id="__codelineno-0-49" name="__codelineno-0-49"></a>
-</span><span id="__span-0-50"><a id="__codelineno-0-50" name="__codelineno-0-50"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-51"><a id="__codelineno-0-51" name="__codelineno-0-51"></a><span class="sd">            series: The series to be checked.</span>
-</span><span id="__span-0-52"><a id="__codelineno-0-52" name="__codelineno-0-52"></a><span class="sd">            fields: The fields to be checked.</span>
-</span><span id="__span-0-53"><a id="__codelineno-0-53" name="__codelineno-0-53"></a>
-</span><span id="__span-0-54"><a id="__codelineno-0-54" name="__codelineno-0-54"></a><span class="sd">        Raises:</span>
-</span><span id="__span-0-55"><a id="__codelineno-0-55" name="__codelineno-0-55"></a><span class="sd">            ValueError: If any of the fields are not present in the series.</span>
-</span><span id="__span-0-56"><a id="__codelineno-0-56" name="__codelineno-0-56"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-57"><a id="__codelineno-0-57" name="__codelineno-0-57"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">set</span><span class="p">(</span><span class="n">fields</span><span class="p">)</span><span class="o">.</span><span class="n">issubset</span><span class="p">(</span><span class="nb">set</span><span class="p">(</span><span class="n">series</span><span class="o">.</span><span class="n">index</span><span class="p">)):</span>
-</span><span id="__span-0-58"><a id="__codelineno-0-58" name="__codelineno-0-58"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Fields </span><span class="si">{</span><span class="n">fields</span><span class="si">}</span><span class="s2"> are not all present in the series.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-59"><a id="__codelineno-0-59" name="__codelineno-0-59"></a>
-</span><span id="__span-0-60"><a id="__codelineno-0-60" name="__codelineno-0-60"></a>    <span class="nd">@staticmethod</span>
-</span><span id="__span-0-61"><a id="__codelineno-0-61" name="__codelineno-0-61"></a>    <span class="k">def</span> <span class="nf">best_effort_tag</span><span class="p">(</span>
-</span><span id="__span-0-62"><a id="__codelineno-0-62" name="__codelineno-0-62"></a>        <span class="n">templates_df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span>
-</span><span id="__span-0-63"><a id="__codelineno-0-63" name="__codelineno-0-63"></a>        <span class="n">variable_row</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">,</span>
-</span><span id="__span-0-64"><a id="__codelineno-0-64" name="__codelineno-0-64"></a>        <span class="n">enable_gpt_tagging</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
-</span><span id="__span-0-65"><a id="__codelineno-0-65" name="__codelineno-0-65"></a>        <span class="n">gpt_model</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="__span-0-66"><a id="__codelineno-0-66" name="__codelineno-0-66"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">bool</span><span class="p">]:</span>
-</span><span id="__span-0-67"><a id="__codelineno-0-67" name="__codelineno-0-67"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-68"><a id="__codelineno-0-68" name="__codelineno-0-68"></a><span class="sd">        Apply `gpt_tag` to `variable_row`, if possible, and return the result. If there is</span>
-</span><span id="__span-0-69"><a id="__codelineno-0-69" name="__codelineno-0-69"></a><span class="sd">        no environment variable called OPENAI_API_KEY, or if `enable_gpt_tagging` is False,</span>
-</span><span id="__span-0-70"><a id="__codelineno-0-70" name="__codelineno-0-70"></a><span class="sd">        apply `preceding_tokens_tag` instead.</span>
-</span><span id="__span-0-71"><a id="__codelineno-0-71" name="__codelineno-0-71"></a>
-</span><span id="__span-0-72"><a id="__codelineno-0-72" name="__codelineno-0-72"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-73"><a id="__codelineno-0-73" name="__codelineno-0-73"></a><span class="sd">            templates_df: The dataframe containing information about the log templates.</span>
-</span><span id="__span-0-74"><a id="__codelineno-0-74" name="__codelineno-0-74"></a><span class="sd">            variable_row: The row of the dataframe containing information about the parsed variable.</span>
-</span><span id="__span-0-75"><a id="__codelineno-0-75" name="__codelineno-0-75"></a><span class="sd">            enable_gpt_tagging: A boolean indicating whether GPT-3.5 tagging should be enabled.</span>
-</span><span id="__span-0-76"><a id="__codelineno-0-76" name="__codelineno-0-76"></a><span class="sd">            gpt_model: The GPT model to use.</span>
-</span><span id="__span-0-77"><a id="__codelineno-0-77" name="__codelineno-0-77"></a>
-</span><span id="__span-0-78"><a id="__codelineno-0-78" name="__codelineno-0-78"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-79"><a id="__codelineno-0-79" name="__codelineno-0-79"></a><span class="sd">            A tuple containing (i) the GPT-3.5 tag for the parsed variable name, if possible, or the</span>
-</span><span id="__span-0-80"><a id="__codelineno-0-80" name="__codelineno-0-80"></a><span class="sd">            best-effort tag otherwise, and (ii) a boolean indicating whether the GPT-3.5 tag was used.</span>
-</span><span id="__span-0-81"><a id="__codelineno-0-81" name="__codelineno-0-81"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-82"><a id="__codelineno-0-82" name="__codelineno-0-82"></a>        <span class="k">if</span> <span class="n">enable_gpt_tagging</span><span class="p">:</span>
-</span><span id="__span-0-83"><a id="__codelineno-0-83" name="__codelineno-0-83"></a>            <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-84"><a id="__codelineno-0-84" name="__codelineno-0-84"></a>                <span class="k">return</span> <span class="p">(</span><span class="n">TagUtils</span><span class="o">.</span><span class="n">gpt_tag</span><span class="p">(</span><span class="n">templates_df</span><span class="p">,</span> <span class="n">variable_row</span><span class="p">,</span> <span class="n">gpt_model</span><span class="p">),</span> <span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-85"><a id="__codelineno-0-85" name="__codelineno-0-85"></a>            <span class="k">except</span><span class="p">:</span>
-</span><span id="__span-0-86"><a id="__codelineno-0-86" name="__codelineno-0-86"></a>                <span class="k">return</span> <span class="p">(</span><span class="n">TagUtils</span><span class="o">.</span><span class="n">preceding_tokens_tag</span><span class="p">(</span><span class="n">variable_row</span><span class="p">),</span> <span class="kc">False</span><span class="p">)</span>
-</span><span id="__span-0-87"><a id="__codelineno-0-87" name="__codelineno-0-87"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-88"><a id="__codelineno-0-88" name="__codelineno-0-88"></a>            <span class="k">return</span> <span class="p">(</span><span class="n">TagUtils</span><span class="o">.</span><span class="n">preceding_tokens_tag</span><span class="p">(</span><span class="n">variable_row</span><span class="p">),</span> <span class="kc">False</span><span class="p">)</span>
-</span><span id="__span-0-89"><a id="__codelineno-0-89" name="__codelineno-0-89"></a>
-</span><span id="__span-0-90"><a id="__codelineno-0-90" name="__codelineno-0-90"></a>    <span class="nd">@staticmethod</span>
-</span><span id="__span-0-91"><a id="__codelineno-0-91" name="__codelineno-0-91"></a>    <span class="k">def</span> <span class="nf">waterfall_tag</span><span class="p">(</span>
-</span><span id="__span-0-92"><a id="__codelineno-0-92" name="__codelineno-0-92"></a>        <span class="n">templates_df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span>
-</span><span id="__span-0-93"><a id="__codelineno-0-93" name="__codelineno-0-93"></a>        <span class="n">variable_row</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">,</span>
-</span><span id="__span-0-94"><a id="__codelineno-0-94" name="__codelineno-0-94"></a>        <span class="n">banned_values</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-95"><a id="__codelineno-0-95" name="__codelineno-0-95"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="p">]:</span>
-</span><span id="__span-0-96"><a id="__codelineno-0-96" name="__codelineno-0-96"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-97"><a id="__codelineno-0-97" name="__codelineno-0-97"></a><span class="sd">        Apply each of the tagging methods in turn, in order of increasing cost, until a tag is found</span>
-</span><span id="__span-0-98"><a id="__codelineno-0-98" name="__codelineno-0-98"></a><span class="sd">        that is not included in the banned values. In partidular, apply `preceding_tokens_tag` first,</span>
-</span><span id="__span-0-99"><a id="__codelineno-0-99" name="__codelineno-0-99"></a><span class="sd">        then `gpt_tag` with the GPT-3.5 model, and finally `gpt_tag` with the GPT-4 model. If none of</span>
-</span><span id="__span-0-100"><a id="__codelineno-0-100" name="__codelineno-0-100"></a><span class="sd">        these methods succeeds, return the name of the variable as the tag.</span>
-</span><span id="__span-0-101"><a id="__codelineno-0-101" name="__codelineno-0-101"></a>
-</span><span id="__span-0-102"><a id="__codelineno-0-102" name="__codelineno-0-102"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-103"><a id="__codelineno-0-103" name="__codelineno-0-103"></a><span class="sd">            templates_df: The dataframe containing information about the log templates.</span>
-</span><span id="__span-0-104"><a id="__codelineno-0-104" name="__codelineno-0-104"></a><span class="sd">            variable_row: The row of the dataframe containing information about the parsed variable.</span>
-</span><span id="__span-0-105"><a id="__codelineno-0-105" name="__codelineno-0-105"></a><span class="sd">            banned_values: A list of values that should not be used as tags.</span>
-</span><span id="__span-0-106"><a id="__codelineno-0-106" name="__codelineno-0-106"></a>
-</span><span id="__span-0-107"><a id="__codelineno-0-107" name="__codelineno-0-107"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-108"><a id="__codelineno-0-108" name="__codelineno-0-108"></a><span class="sd">            A tuple containing (i) the tag for the parsed variable, and (ii) the origin of the tag.</span>
-</span><span id="__span-0-109"><a id="__codelineno-0-109" name="__codelineno-0-109"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-110"><a id="__codelineno-0-110" name="__codelineno-0-110"></a>        <span class="n">name</span> <span class="o">=</span> <span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span>
-</span><span id="__span-0-111"><a id="__codelineno-0-111" name="__codelineno-0-111"></a>        <span class="k">if</span> <span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]:</span>
-</span><span id="__span-0-112"><a id="__codelineno-0-112" name="__codelineno-0-112"></a>            <span class="k">return</span> <span class="p">(</span><span class="n">name</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">REGEX_VARIABLE</span><span class="p">)</span>
-</span><span id="__span-0-113"><a id="__codelineno-0-113" name="__codelineno-0-113"></a>
-</span><span id="__span-0-114"><a id="__codelineno-0-114" name="__codelineno-0-114"></a>        <span class="c1"># Try to derive a tag from the preceding tokens in the corresponding template</span>
-</span><span id="__span-0-115"><a id="__codelineno-0-115" name="__codelineno-0-115"></a>        <span class="n">tag</span><span class="p">,</span> <span class="n">origin</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">preceding_tokens_tag</span><span class="p">(</span><span class="n">variable_row</span><span class="p">,</span> <span class="n">banned_values</span><span class="p">)</span>
-</span><span id="__span-0-116"><a id="__codelineno-0-116" name="__codelineno-0-116"></a>        <span class="k">if</span> <span class="n">tag</span> <span class="o">!=</span> <span class="n">name</span><span class="p">:</span>
-</span><span id="__span-0-117"><a id="__codelineno-0-117" name="__codelineno-0-117"></a>            <span class="k">return</span> <span class="p">(</span><span class="n">tag</span><span class="p">,</span> <span class="n">origin</span><span class="p">)</span>
-</span><span id="__span-0-118"><a id="__codelineno-0-118" name="__codelineno-0-118"></a>
-</span><span id="__span-0-119"><a id="__codelineno-0-119" name="__codelineno-0-119"></a>        <span class="c1"># Try to derive a tag using GPT-3.5</span>
-</span><span id="__span-0-120"><a id="__codelineno-0-120" name="__codelineno-0-120"></a>        <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-121"><a id="__codelineno-0-121" name="__codelineno-0-121"></a>            <span class="n">tag</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">gpt_tag</span><span class="p">(</span>
-</span><span id="__span-0-122"><a id="__codelineno-0-122" name="__codelineno-0-122"></a>                <span class="n">templates_df</span><span class="p">,</span> <span class="n">variable_row</span><span class="p">,</span> <span class="s2">&quot;gpt-3.5-turbo&quot;</span><span class="p">,</span> <span class="n">banned_values</span>
-</span><span id="__span-0-123"><a id="__codelineno-0-123" name="__codelineno-0-123"></a>            <span class="p">)</span>
-</span><span id="__span-0-124"><a id="__codelineno-0-124" name="__codelineno-0-124"></a>            <span class="k">if</span> <span class="n">tag</span> <span class="o">!=</span> <span class="n">name</span><span class="p">:</span>
-</span><span id="__span-0-125"><a id="__codelineno-0-125" name="__codelineno-0-125"></a>                <span class="k">return</span> <span class="p">(</span><span class="n">tag</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">GPT_3POINT5_TURBO</span><span class="p">)</span>
-</span><span id="__span-0-126"><a id="__codelineno-0-126" name="__codelineno-0-126"></a>        <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
-</span><span id="__span-0-127"><a id="__codelineno-0-127" name="__codelineno-0-127"></a>            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Exception </span><span class="si">{</span><span class="n">e</span><span class="si">}</span><span class="s2"> came up while tagging </span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> with GPT-3.5.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-128"><a id="__codelineno-0-128" name="__codelineno-0-128"></a>            <span class="k">pass</span>
-</span><span id="__span-0-129"><a id="__codelineno-0-129" name="__codelineno-0-129"></a>
-</span><span id="__span-0-130"><a id="__codelineno-0-130" name="__codelineno-0-130"></a>        <span class="c1"># Try to derive a tag using GPT-4</span>
-</span><span id="__span-0-131"><a id="__codelineno-0-131" name="__codelineno-0-131"></a>        <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-132"><a id="__codelineno-0-132" name="__codelineno-0-132"></a>            <span class="n">tag</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">gpt_tag</span><span class="p">(</span><span class="n">templates_df</span><span class="p">,</span> <span class="n">variable_row</span><span class="p">,</span> <span class="s2">&quot;gpt-4&quot;</span><span class="p">,</span> <span class="n">banned_values</span><span class="p">)</span>
-</span><span id="__span-0-133"><a id="__codelineno-0-133" name="__codelineno-0-133"></a>            <span class="k">if</span> <span class="n">tag</span> <span class="o">!=</span> <span class="n">name</span><span class="p">:</span>
-</span><span id="__span-0-134"><a id="__codelineno-0-134" name="__codelineno-0-134"></a>                <span class="k">return</span> <span class="p">(</span><span class="n">tag</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">GPT_4</span><span class="p">)</span>
-</span><span id="__span-0-135"><a id="__codelineno-0-135" name="__codelineno-0-135"></a>        <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
-</span><span id="__span-0-136"><a id="__codelineno-0-136" name="__codelineno-0-136"></a>            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Exception </span><span class="si">{</span><span class="n">e</span><span class="si">}</span><span class="s2"> came up while tagging </span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> with GPT-4.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-137"><a id="__codelineno-0-137" name="__codelineno-0-137"></a>            <span class="k">pass</span>
-</span><span id="__span-0-138"><a id="__codelineno-0-138" name="__codelineno-0-138"></a>
-</span><span id="__span-0-139"><a id="__codelineno-0-139" name="__codelineno-0-139"></a>        <span class="k">return</span> <span class="p">(</span><span class="n">name</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">NAME</span><span class="p">)</span>
-</span><span id="__span-0-140"><a id="__codelineno-0-140" name="__codelineno-0-140"></a>
-</span><span id="__span-0-141"><a id="__codelineno-0-141" name="__codelineno-0-141"></a>    <span class="nd">@staticmethod</span>
-</span><span id="__span-0-142"><a id="__codelineno-0-142" name="__codelineno-0-142"></a>    <span class="k">def</span> <span class="nf">preceding_tokens_tag</span><span class="p">(</span>
-</span><span id="__span-0-143"><a id="__codelineno-0-143" name="__codelineno-0-143"></a>        <span class="n">variable_row</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">,</span> <span class="n">banned_values</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-144"><a id="__codelineno-0-144" name="__codelineno-0-144"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="p">]:</span>
-</span><span id="__span-0-145"><a id="__codelineno-0-145" name="__codelineno-0-145"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-146"><a id="__codelineno-0-146" name="__codelineno-0-146"></a><span class="sd">        Try to derive a tag for a parsed variable name based on the preceding tokens in the corresponding template.</span>
-</span><span id="__span-0-147"><a id="__codelineno-0-147" name="__codelineno-0-147"></a>
-</span><span id="__span-0-148"><a id="__codelineno-0-148" name="__codelineno-0-148"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-149"><a id="__codelineno-0-149" name="__codelineno-0-149"></a><span class="sd">            variable_row: The row of the dataframe containing information about the parsed variable.</span>
-</span><span id="__span-0-150"><a id="__codelineno-0-150" name="__codelineno-0-150"></a><span class="sd">            banned_values: A list of values that should not be used as tags.</span>
-</span><span id="__span-0-151"><a id="__codelineno-0-151" name="__codelineno-0-151"></a>
-</span><span id="__span-0-152"><a id="__codelineno-0-152" name="__codelineno-0-152"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-153"><a id="__codelineno-0-153" name="__codelineno-0-153"></a><span class="sd">            A tuple containing (i) the tag for the parsed variable, and (ii) the origin of the tag.</span>
-</span><span id="__span-0-154"><a id="__codelineno-0-154" name="__codelineno-0-154"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-155"><a id="__codelineno-0-155" name="__codelineno-0-155"></a>
-</span><span id="__span-0-156"><a id="__codelineno-0-156" name="__codelineno-0-156"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_fields</span><span class="p">(</span><span class="n">variable_row</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Preceding 3 tokens&quot;</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;From regex&quot;</span><span class="p">])</span>
-</span><span id="__span-0-157"><a id="__codelineno-0-157" name="__codelineno-0-157"></a>        <span class="n">name</span> <span class="o">=</span> <span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span>
-</span><span id="__span-0-158"><a id="__codelineno-0-158" name="__codelineno-0-158"></a>        <span class="k">if</span> <span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]:</span>
-</span><span id="__span-0-159"><a id="__codelineno-0-159" name="__codelineno-0-159"></a>            <span class="k">return</span> <span class="n">name</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">REGEX_VARIABLE</span>
-</span><span id="__span-0-160"><a id="__codelineno-0-160" name="__codelineno-0-160"></a>
-</span><span id="__span-0-161"><a id="__codelineno-0-161" name="__codelineno-0-161"></a>        <span class="n">pr</span> <span class="o">=</span> <span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;Preceding 3 tokens&quot;</span><span class="p">]</span>
-</span><span id="__span-0-162"><a id="__codelineno-0-162" name="__codelineno-0-162"></a>        <span class="n">tag</span> <span class="o">=</span> <span class="n">name</span>
-</span><span id="__span-0-163"><a id="__codelineno-0-163" name="__codelineno-0-163"></a>        <span class="n">origin</span> <span class="o">=</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">NAME</span>
-</span><span id="__span-0-164"><a id="__codelineno-0-164" name="__codelineno-0-164"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">pr</span><span class="p">)</span> <span class="o">&gt;=</span> <span class="mi">2</span> <span class="ow">and</span> <span class="p">(</span><span class="n">pr</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span> <span class="ow">in</span> <span class="s2">&quot;:=&quot;</span><span class="p">)</span> <span class="ow">and</span> <span class="p">(</span><span class="n">pr</span><span class="p">[</span><span class="o">-</span><span class="mi">2</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;&lt;&quot;</span><span class="p">):</span>
-</span><span id="__span-0-165"><a id="__codelineno-0-165" name="__codelineno-0-165"></a>            <span class="n">tag</span> <span class="o">=</span> <span class="n">pr</span><span class="p">[</span><span class="o">-</span><span class="mi">2</span><span class="p">]</span>
-</span><span id="__span-0-166"><a id="__codelineno-0-166" name="__codelineno-0-166"></a>            <span class="n">origin</span> <span class="o">=</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">PRECEDING</span>
-</span><span id="__span-0-167"><a id="__codelineno-0-167" name="__codelineno-0-167"></a>        <span class="k">elif</span> <span class="p">(</span>
-</span><span id="__span-0-168"><a id="__codelineno-0-168" name="__codelineno-0-168"></a>            <span class="nb">len</span><span class="p">(</span><span class="n">pr</span><span class="p">)</span> <span class="o">==</span> <span class="mi">3</span>
-</span><span id="__span-0-169"><a id="__codelineno-0-169" name="__codelineno-0-169"></a>            <span class="ow">and</span> <span class="p">(</span><span class="n">pr</span><span class="p">[</span><span class="mi">2</span><span class="p">]</span> <span class="ow">in</span> <span class="s2">&quot;&quot;&quot;&quot;&#39;&quot;&quot;&quot;</span><span class="p">)</span>
-</span><span id="__span-0-170"><a id="__codelineno-0-170" name="__codelineno-0-170"></a>            <span class="ow">and</span> <span class="p">(</span><span class="n">pr</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="ow">in</span> <span class="s2">&quot;:=&quot;</span><span class="p">)</span>
-</span><span id="__span-0-171"><a id="__codelineno-0-171" name="__codelineno-0-171"></a>            <span class="ow">and</span> <span class="p">(</span><span class="n">pr</span><span class="p">[</span><span class="mi">0</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;&lt;&quot;</span><span class="p">)</span>
-</span><span id="__span-0-172"><a id="__codelineno-0-172" name="__codelineno-0-172"></a>        <span class="p">):</span>
-</span><span id="__span-0-173"><a id="__codelineno-0-173" name="__codelineno-0-173"></a>            <span class="n">tag</span> <span class="o">=</span> <span class="n">pr</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-174"><a id="__codelineno-0-174" name="__codelineno-0-174"></a>            <span class="n">origin</span> <span class="o">=</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">PRECEDING</span>
-</span><span id="__span-0-175"><a id="__codelineno-0-175" name="__codelineno-0-175"></a>
-</span><span id="__span-0-176"><a id="__codelineno-0-176" name="__codelineno-0-176"></a>        <span class="c1"># Double-check that the tag is not in the banned values</span>
-</span><span id="__span-0-177"><a id="__codelineno-0-177" name="__codelineno-0-177"></a>        <span class="k">if</span> <span class="n">banned_values</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">tag</span> <span class="ow">in</span> <span class="n">banned_values</span><span class="p">:</span>
-</span><span id="__span-0-178"><a id="__codelineno-0-178" name="__codelineno-0-178"></a>            <span class="k">return</span> <span class="n">name</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">NAME</span>
-</span><span id="__span-0-179"><a id="__codelineno-0-179" name="__codelineno-0-179"></a>
-</span><span id="__span-0-180"><a id="__codelineno-0-180" name="__codelineno-0-180"></a>        <span class="k">return</span> <span class="n">tag</span><span class="p">,</span> <span class="n">origin</span>
-</span><span id="__span-0-181"><a id="__codelineno-0-181" name="__codelineno-0-181"></a>
-</span><span id="__span-0-182"><a id="__codelineno-0-182" name="__codelineno-0-182"></a>    <span class="nd">@staticmethod</span>
-</span><span id="__span-0-183"><a id="__codelineno-0-183" name="__codelineno-0-183"></a>    <span class="k">def</span> <span class="nf">gpt_tag</span><span class="p">(</span>
-</span><span id="__span-0-184"><a id="__codelineno-0-184" name="__codelineno-0-184"></a>        <span class="n">templates_df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span>
-</span><span id="__span-0-185"><a id="__codelineno-0-185" name="__codelineno-0-185"></a>        <span class="n">variable_row</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">,</span>
-</span><span id="__span-0-186"><a id="__codelineno-0-186" name="__codelineno-0-186"></a>        <span class="n">model</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;gpt-3.5-turbo&quot;</span><span class="p">,</span>
-</span><span id="__span-0-187"><a id="__codelineno-0-187" name="__codelineno-0-187"></a>        <span class="n">banned_values</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-188"><a id="__codelineno-0-188" name="__codelineno-0-188"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-</span><span id="__span-0-189"><a id="__codelineno-0-189" name="__codelineno-0-189"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-190"><a id="__codelineno-0-190" name="__codelineno-0-190"></a><span class="sd">        Use GPT to derive a tag the variable described in `variable_row`,</span>
-</span><span id="__span-0-191"><a id="__codelineno-0-191" name="__codelineno-0-191"></a><span class="sd">        using information about the corresponding log template, retrieved from `templates_df`.</span>
-</span><span id="__span-0-192"><a id="__codelineno-0-192" name="__codelineno-0-192"></a>
-</span><span id="__span-0-193"><a id="__codelineno-0-193" name="__codelineno-0-193"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-194"><a id="__codelineno-0-194" name="__codelineno-0-194"></a><span class="sd">            templates_df: The dataframe containing information about the log templates.</span>
-</span><span id="__span-0-195"><a id="__codelineno-0-195" name="__codelineno-0-195"></a><span class="sd">            variable_row: The row of the dataframe containing information about the parsed variable.</span>
-</span><span id="__span-0-196"><a id="__codelineno-0-196" name="__codelineno-0-196"></a><span class="sd">            model: The GPT model to use.</span>
-</span><span id="__span-0-197"><a id="__codelineno-0-197" name="__codelineno-0-197"></a><span class="sd">            banned_values: A list of values that should not be used as tags.</span>
-</span><span id="__span-0-198"><a id="__codelineno-0-198" name="__codelineno-0-198"></a>
-</span><span id="__span-0-199"><a id="__codelineno-0-199" name="__codelineno-0-199"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-200"><a id="__codelineno-0-200" name="__codelineno-0-200"></a><span class="sd">            The GPT-generated tag for the parsed variable name.</span>
-</span><span id="__span-0-201"><a id="__codelineno-0-201" name="__codelineno-0-201"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-202"><a id="__codelineno-0-202" name="__codelineno-0-202"></a>
-</span><span id="__span-0-203"><a id="__codelineno-0-203" name="__codelineno-0-203"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_fields</span><span class="p">(</span><span class="n">variable_row</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;Examples&quot;</span><span class="p">])</span>
-</span><span id="__span-0-204"><a id="__codelineno-0-204" name="__codelineno-0-204"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_columns</span><span class="p">(</span><span class="n">templates_df</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">,</span> <span class="s2">&quot;TemplateExample&quot;</span><span class="p">])</span>
-</span><span id="__span-0-205"><a id="__codelineno-0-205" name="__codelineno-0-205"></a>
-</span><span id="__span-0-206"><a id="__codelineno-0-206" name="__codelineno-0-206"></a>        <span class="n">template_id</span> <span class="o">=</span> <span class="n">ParsedVariableName</span><span class="p">(</span><span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">])</span><span class="o">.</span><span class="n">template_id</span><span class="p">()</span>
-</span><span id="__span-0-207"><a id="__codelineno-0-207" name="__codelineno-0-207"></a>        <span class="n">idx</span> <span class="o">=</span> <span class="n">ParsedVariableName</span><span class="p">(</span><span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">])</span><span class="o">.</span><span class="n">index</span><span class="p">()</span>
-</span><span id="__span-0-208"><a id="__codelineno-0-208" name="__codelineno-0-208"></a>
-</span><span id="__span-0-209"><a id="__codelineno-0-209" name="__codelineno-0-209"></a>        <span class="n">line</span> <span class="o">=</span> <span class="n">templates_df</span><span class="p">[</span><span class="n">templates_df</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">template_id</span><span class="p">][</span>
-</span><span id="__span-0-210"><a id="__codelineno-0-210" name="__codelineno-0-210"></a>            <span class="s2">&quot;TemplateExample&quot;</span>
-</span><span id="__span-0-211"><a id="__codelineno-0-211" name="__codelineno-0-211"></a>        <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-212"><a id="__codelineno-0-212" name="__codelineno-0-212"></a>        <span class="n">line_toks</span> <span class="o">=</span> <span class="n">line</span><span class="o">.</span><span class="n">split</span><span class="p">()</span>
-</span><span id="__span-0-213"><a id="__codelineno-0-213" name="__codelineno-0-213"></a>
-</span><span id="__span-0-214"><a id="__codelineno-0-214" name="__codelineno-0-214"></a>        <span class="c1"># Define the messages to send to the model</span>
-</span><span id="__span-0-215"><a id="__codelineno-0-215" name="__codelineno-0-215"></a>        <span class="n">messages</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="__span-0-216"><a id="__codelineno-0-216" name="__codelineno-0-216"></a>            <span class="p">{</span>
-</span><span id="__span-0-217"><a id="__codelineno-0-217" name="__codelineno-0-217"></a>                <span class="s2">&quot;role&quot;</span><span class="p">:</span> <span class="s2">&quot;system&quot;</span><span class="p">,</span>
-</span><span id="__span-0-218"><a id="__codelineno-0-218" name="__codelineno-0-218"></a>                <span class="s2">&quot;content&quot;</span><span class="p">:</span> <span class="s2">&quot;You are a backend engineer that knows all about the logging infrastructure of a distributed system.&quot;</span><span class="p">,</span>
-</span><span id="__span-0-219"><a id="__codelineno-0-219" name="__codelineno-0-219"></a>            <span class="p">},</span>
-</span><span id="__span-0-220"><a id="__codelineno-0-220" name="__codelineno-0-220"></a>            <span class="p">{</span>
-</span><span id="__span-0-221"><a id="__codelineno-0-221" name="__codelineno-0-221"></a>                <span class="s2">&quot;role&quot;</span><span class="p">:</span> <span class="s2">&quot;user&quot;</span><span class="p">,</span>
-</span><span id="__span-0-222"><a id="__codelineno-0-222" name="__codelineno-0-222"></a>                <span class="s2">&quot;content&quot;</span><span class="p">:</span> <span class="sa">f</span><span class="s2">&quot;&quot;&quot;Generate a tag for the variable that takes the value </span><span class="si">{</span><span class="n">line_toks</span><span class="p">[</span><span class="n">idx</span><span class="p">]</span><span class="si">}</span><span class="s2"> &quot;&quot;&quot;</span>
-</span><span id="__span-0-223"><a id="__codelineno-0-223" name="__codelineno-0-223"></a>                <span class="sa">f</span><span class="s2">&quot;&quot;&quot;in the following log line:</span><span class="se">\n</span><span class="s2"> </span><span class="si">{</span><span class="n">line</span><span class="si">}</span><span class="se">\n</span><span class="s2">&quot;&quot;&quot;</span>
-</span><span id="__span-0-224"><a id="__codelineno-0-224" name="__codelineno-0-224"></a>                <span class="sa">f</span><span class="s2">&quot;&quot;&quot;Here are the 3 tokens that precede the variable: [</span><span class="si">{</span><span class="s1">&#39;, &#39;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">line_toks</span><span class="p">[</span><span class="nb">max</span><span class="p">(</span><span class="n">idx</span><span class="o">-</span><span class="mi">3</span><span class="p">,</span><span class="w"> </span><span class="mi">0</span><span class="p">):</span><span class="n">idx</span><span class="p">])</span><span class="si">}</span><span class="s2"> ]</span><span class="se">\n</span><span class="s2">&quot;&quot;&quot;</span>
-</span><span id="__span-0-225"><a id="__codelineno-0-225" name="__codelineno-0-225"></a>                <span class="sa">f</span><span class="s2">&quot;&quot;&quot;Here are some more example values for this variable: [</span><span class="si">{</span><span class="s1">&#39;, &#39;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">variable_row</span><span class="p">[</span><span class="s1">&#39;Examples&#39;</span><span class="p">])</span><span class="si">}</span><span class="s2"> ]</span><span class="se">\n</span><span class="s2">&quot;&quot;&quot;</span>
-</span><span id="__span-0-226"><a id="__codelineno-0-226" name="__codelineno-0-226"></a>                <span class="c1">#f&quot;&quot;&quot;Make sure the tag matches none of the following values: [{&#39;, &#39;.join(banned_values) if banned_values is not None else &#39;&#39;} ]\n&quot;&quot;&quot;</span>
-</span><span id="__span-0-227"><a id="__codelineno-0-227" name="__codelineno-0-227"></a><span class="w">                </span><span class="sd">&quot;&quot;&quot;Return only the tag as a single word, possibly including underscores. DO NOT EVER REPLY WITH MORE THAN ONE WORD.\n&quot;&quot;&quot;</span><span class="p">,</span>
-</span><span id="__span-0-228"><a id="__codelineno-0-228" name="__codelineno-0-228"></a>            <span class="p">},</span>
-</span><span id="__span-0-229"><a id="__codelineno-0-229" name="__codelineno-0-229"></a>        <span class="p">]</span>
-</span><span id="__span-0-230"><a id="__codelineno-0-230" name="__codelineno-0-230"></a>
-</span><span id="__span-0-231"><a id="__codelineno-0-231" name="__codelineno-0-231"></a>        <span class="n">client</span> <span class="o">=</span> <span class="n">OpenAI</span><span class="p">()</span>
-</span><span id="__span-0-232"><a id="__codelineno-0-232" name="__codelineno-0-232"></a>
-</span><span id="__span-0-233"><a id="__codelineno-0-233" name="__codelineno-0-233"></a>        <span class="n">tag</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-234"><a id="__codelineno-0-234" name="__codelineno-0-234"></a>            <span class="n">client</span><span class="o">.</span><span class="n">chat</span><span class="o">.</span><span class="n">completions</span><span class="o">.</span><span class="n">create</span><span class="p">(</span><span class="n">model</span><span class="o">=</span><span class="n">model</span><span class="p">,</span> <span class="n">messages</span><span class="o">=</span><span class="n">messages</span><span class="p">)</span>
-</span><span id="__span-0-235"><a id="__codelineno-0-235" name="__codelineno-0-235"></a>            <span class="o">.</span><span class="n">choices</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-236"><a id="__codelineno-0-236" name="__codelineno-0-236"></a>            <span class="o">.</span><span class="n">message</span><span class="o">.</span><span class="n">content</span>
-</span><span id="__span-0-237"><a id="__codelineno-0-237" name="__codelineno-0-237"></a>        <span class="p">)</span>
-</span><span id="__span-0-238"><a id="__codelineno-0-238" name="__codelineno-0-238"></a>        <span class="n">tag_length</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">tag</span><span class="o">.</span><span class="n">split</span><span class="p">())</span>
-</span><span id="__span-0-239"><a id="__codelineno-0-239" name="__codelineno-0-239"></a>        <span class="k">if</span> <span class="n">tag_length</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="__span-0-240"><a id="__codelineno-0-240" name="__codelineno-0-240"></a>            <span class="c1"># GPT didn&#39;t listen to us and returned a phrase describing the tag.</span>
-</span><span id="__span-0-241"><a id="__codelineno-0-241" name="__codelineno-0-241"></a>            <span class="c1"># Extract the word between the second-last and last occurrence of double quotes.</span>
-</span><span id="__span-0-242"><a id="__codelineno-0-242" name="__codelineno-0-242"></a>            <span class="n">tag</span> <span class="o">=</span> <span class="n">tag</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;&quot;&#39;</span><span class="p">)[</span><span class="o">-</span><span class="mi">2</span><span class="p">]</span>
-</span><span id="__span-0-243"><a id="__codelineno-0-243" name="__codelineno-0-243"></a>
+<span class="normal"><a href="#__codelineno-0-376">376</a></span>
+<span class="normal"><a href="#__codelineno-0-377">377</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-26"><a id="__codelineno-0-26" name="__codelineno-0-26"></a><span class="k">class</span> <span class="nc">TagUtils</span><span class="p">:</span>
+</span><span id="__span-0-27"><a id="__codelineno-0-27" name="__codelineno-0-27"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-28"><a id="__codelineno-0-28" name="__codelineno-0-28"></a><span class="sd">    A class for managing tags of parsed and prepared variables.</span>
+</span><span id="__span-0-29"><a id="__codelineno-0-29" name="__codelineno-0-29"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-30"><a id="__codelineno-0-30" name="__codelineno-0-30"></a>
+</span><span id="__span-0-31"><a id="__codelineno-0-31" name="__codelineno-0-31"></a>    <span class="nd">@staticmethod</span>
+</span><span id="__span-0-32"><a id="__codelineno-0-32" name="__codelineno-0-32"></a>    <span class="k">def</span> <span class="nf">check_columns</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">columns</span><span class="p">:</span> <span class="nb">list</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-33"><a id="__codelineno-0-33" name="__codelineno-0-33"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-34"><a id="__codelineno-0-34" name="__codelineno-0-34"></a><span class="sd">        Check that the specified columns exist in the dataframe.</span>
+</span><span id="__span-0-35"><a id="__codelineno-0-35" name="__codelineno-0-35"></a>
+</span><span id="__span-0-36"><a id="__codelineno-0-36" name="__codelineno-0-36"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-37"><a id="__codelineno-0-37" name="__codelineno-0-37"></a><span class="sd">            df: The dataframe to be checked.</span>
+</span><span id="__span-0-38"><a id="__codelineno-0-38" name="__codelineno-0-38"></a><span class="sd">            columns: The columns to be checked.</span>
+</span><span id="__span-0-39"><a id="__codelineno-0-39" name="__codelineno-0-39"></a>
+</span><span id="__span-0-40"><a id="__codelineno-0-40" name="__codelineno-0-40"></a><span class="sd">        Raises:</span>
+</span><span id="__span-0-41"><a id="__codelineno-0-41" name="__codelineno-0-41"></a><span class="sd">            ValueError: If any of the columns are not present in the dataframe.</span>
+</span><span id="__span-0-42"><a id="__codelineno-0-42" name="__codelineno-0-42"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-43"><a id="__codelineno-0-43" name="__codelineno-0-43"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">set</span><span class="p">(</span><span class="n">columns</span><span class="p">)</span><span class="o">.</span><span class="n">issubset</span><span class="p">(</span><span class="nb">set</span><span class="p">(</span><span class="n">df</span><span class="o">.</span><span class="n">columns</span><span class="p">)):</span>
+</span><span id="__span-0-44"><a id="__codelineno-0-44" name="__codelineno-0-44"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Columns </span><span class="si">{</span><span class="n">columns</span><span class="si">}</span><span class="s2"> are not all present in the dataframe.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-45"><a id="__codelineno-0-45" name="__codelineno-0-45"></a>
+</span><span id="__span-0-46"><a id="__codelineno-0-46" name="__codelineno-0-46"></a>    <span class="nd">@staticmethod</span>
+</span><span id="__span-0-47"><a id="__codelineno-0-47" name="__codelineno-0-47"></a>    <span class="k">def</span> <span class="nf">check_fields</span><span class="p">(</span><span class="n">series</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">,</span> <span class="n">fields</span><span class="p">:</span> <span class="nb">list</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-48"><a id="__codelineno-0-48" name="__codelineno-0-48"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-49"><a id="__codelineno-0-49" name="__codelineno-0-49"></a><span class="sd">        Check that the specified fields exist in the specified series.</span>
+</span><span id="__span-0-50"><a id="__codelineno-0-50" name="__codelineno-0-50"></a>
+</span><span id="__span-0-51"><a id="__codelineno-0-51" name="__codelineno-0-51"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-52"><a id="__codelineno-0-52" name="__codelineno-0-52"></a><span class="sd">            series: The series to be checked.</span>
+</span><span id="__span-0-53"><a id="__codelineno-0-53" name="__codelineno-0-53"></a><span class="sd">            fields: The fields to be checked.</span>
+</span><span id="__span-0-54"><a id="__codelineno-0-54" name="__codelineno-0-54"></a>
+</span><span id="__span-0-55"><a id="__codelineno-0-55" name="__codelineno-0-55"></a><span class="sd">        Raises:</span>
+</span><span id="__span-0-56"><a id="__codelineno-0-56" name="__codelineno-0-56"></a><span class="sd">            ValueError: If any of the fields are not present in the series.</span>
+</span><span id="__span-0-57"><a id="__codelineno-0-57" name="__codelineno-0-57"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-58"><a id="__codelineno-0-58" name="__codelineno-0-58"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">set</span><span class="p">(</span><span class="n">fields</span><span class="p">)</span><span class="o">.</span><span class="n">issubset</span><span class="p">(</span><span class="nb">set</span><span class="p">(</span><span class="n">series</span><span class="o">.</span><span class="n">index</span><span class="p">)):</span>
+</span><span id="__span-0-59"><a id="__codelineno-0-59" name="__codelineno-0-59"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Fields </span><span class="si">{</span><span class="n">fields</span><span class="si">}</span><span class="s2"> are not all present in the series.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-60"><a id="__codelineno-0-60" name="__codelineno-0-60"></a>
+</span><span id="__span-0-61"><a id="__codelineno-0-61" name="__codelineno-0-61"></a>    <span class="nd">@staticmethod</span>
+</span><span id="__span-0-62"><a id="__codelineno-0-62" name="__codelineno-0-62"></a>    <span class="k">def</span> <span class="nf">best_effort_tag</span><span class="p">(</span>
+</span><span id="__span-0-63"><a id="__codelineno-0-63" name="__codelineno-0-63"></a>        <span class="n">templates_df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span>
+</span><span id="__span-0-64"><a id="__codelineno-0-64" name="__codelineno-0-64"></a>        <span class="n">variable_row</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">,</span>
+</span><span id="__span-0-65"><a id="__codelineno-0-65" name="__codelineno-0-65"></a>        <span class="n">enable_gpt_tagging</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
+</span><span id="__span-0-66"><a id="__codelineno-0-66" name="__codelineno-0-66"></a>        <span class="n">gpt_model</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-67"><a id="__codelineno-0-67" name="__codelineno-0-67"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">bool</span><span class="p">]:</span>
+</span><span id="__span-0-68"><a id="__codelineno-0-68" name="__codelineno-0-68"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-69"><a id="__codelineno-0-69" name="__codelineno-0-69"></a><span class="sd">        Apply `gpt_tag` to `variable_row`, if possible, and return the result. If there is</span>
+</span><span id="__span-0-70"><a id="__codelineno-0-70" name="__codelineno-0-70"></a><span class="sd">        no environment variable called OPENAI_API_KEY, or if `enable_gpt_tagging` is False,</span>
+</span><span id="__span-0-71"><a id="__codelineno-0-71" name="__codelineno-0-71"></a><span class="sd">        apply `preceding_tokens_tag` instead.</span>
+</span><span id="__span-0-72"><a id="__codelineno-0-72" name="__codelineno-0-72"></a>
+</span><span id="__span-0-73"><a id="__codelineno-0-73" name="__codelineno-0-73"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-74"><a id="__codelineno-0-74" name="__codelineno-0-74"></a><span class="sd">            templates_df: The dataframe containing information about the log templates.</span>
+</span><span id="__span-0-75"><a id="__codelineno-0-75" name="__codelineno-0-75"></a><span class="sd">            variable_row: The row of the dataframe containing information about the parsed variable.</span>
+</span><span id="__span-0-76"><a id="__codelineno-0-76" name="__codelineno-0-76"></a><span class="sd">            enable_gpt_tagging: A boolean indicating whether GPT-3.5 tagging should be enabled.</span>
+</span><span id="__span-0-77"><a id="__codelineno-0-77" name="__codelineno-0-77"></a><span class="sd">            gpt_model: The GPT model to use.</span>
+</span><span id="__span-0-78"><a id="__codelineno-0-78" name="__codelineno-0-78"></a>
+</span><span id="__span-0-79"><a id="__codelineno-0-79" name="__codelineno-0-79"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-80"><a id="__codelineno-0-80" name="__codelineno-0-80"></a><span class="sd">            A tuple containing (i) the GPT-3.5 tag for the parsed variable name, if possible, or the</span>
+</span><span id="__span-0-81"><a id="__codelineno-0-81" name="__codelineno-0-81"></a><span class="sd">            best-effort tag otherwise, and (ii) a boolean indicating whether the GPT-3.5 tag was used.</span>
+</span><span id="__span-0-82"><a id="__codelineno-0-82" name="__codelineno-0-82"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-83"><a id="__codelineno-0-83" name="__codelineno-0-83"></a>        <span class="k">if</span> <span class="n">enable_gpt_tagging</span><span class="p">:</span>
+</span><span id="__span-0-84"><a id="__codelineno-0-84" name="__codelineno-0-84"></a>            <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-85"><a id="__codelineno-0-85" name="__codelineno-0-85"></a>                <span class="k">return</span> <span class="p">(</span><span class="n">TagUtils</span><span class="o">.</span><span class="n">gpt_tag</span><span class="p">(</span><span class="n">templates_df</span><span class="p">,</span> <span class="n">variable_row</span><span class="p">,</span> <span class="n">gpt_model</span><span class="p">),</span> <span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-86"><a id="__codelineno-0-86" name="__codelineno-0-86"></a>            <span class="k">except</span><span class="p">:</span>
+</span><span id="__span-0-87"><a id="__codelineno-0-87" name="__codelineno-0-87"></a>                <span class="k">return</span> <span class="p">(</span><span class="n">TagUtils</span><span class="o">.</span><span class="n">preceding_tokens_tag</span><span class="p">(</span><span class="n">variable_row</span><span class="p">),</span> <span class="kc">False</span><span class="p">)</span>
+</span><span id="__span-0-88"><a id="__codelineno-0-88" name="__codelineno-0-88"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-89"><a id="__codelineno-0-89" name="__codelineno-0-89"></a>            <span class="k">return</span> <span class="p">(</span><span class="n">TagUtils</span><span class="o">.</span><span class="n">preceding_tokens_tag</span><span class="p">(</span><span class="n">variable_row</span><span class="p">),</span> <span class="kc">False</span><span class="p">)</span>
+</span><span id="__span-0-90"><a id="__codelineno-0-90" name="__codelineno-0-90"></a>
+</span><span id="__span-0-91"><a id="__codelineno-0-91" name="__codelineno-0-91"></a>    <span class="nd">@staticmethod</span>
+</span><span id="__span-0-92"><a id="__codelineno-0-92" name="__codelineno-0-92"></a>    <span class="k">def</span> <span class="nf">waterfall_tag</span><span class="p">(</span>
+</span><span id="__span-0-93"><a id="__codelineno-0-93" name="__codelineno-0-93"></a>        <span class="n">templates_df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span>
+</span><span id="__span-0-94"><a id="__codelineno-0-94" name="__codelineno-0-94"></a>        <span class="n">variable_row</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">,</span>
+</span><span id="__span-0-95"><a id="__codelineno-0-95" name="__codelineno-0-95"></a>        <span class="n">banned_values</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-96"><a id="__codelineno-0-96" name="__codelineno-0-96"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="p">]:</span>
+</span><span id="__span-0-97"><a id="__codelineno-0-97" name="__codelineno-0-97"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-98"><a id="__codelineno-0-98" name="__codelineno-0-98"></a><span class="sd">        Apply each of the tagging methods in turn, in order of increasing cost, until a tag is found</span>
+</span><span id="__span-0-99"><a id="__codelineno-0-99" name="__codelineno-0-99"></a><span class="sd">        that is not included in the banned values. In partidular, apply `preceding_tokens_tag` first,</span>
+</span><span id="__span-0-100"><a id="__codelineno-0-100" name="__codelineno-0-100"></a><span class="sd">        then `gpt_tag` with the GPT-3.5 model, and finally `gpt_tag` with the GPT-4 model. If none of</span>
+</span><span id="__span-0-101"><a id="__codelineno-0-101" name="__codelineno-0-101"></a><span class="sd">        these methods succeeds, return the name of the variable as the tag.</span>
+</span><span id="__span-0-102"><a id="__codelineno-0-102" name="__codelineno-0-102"></a>
+</span><span id="__span-0-103"><a id="__codelineno-0-103" name="__codelineno-0-103"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-104"><a id="__codelineno-0-104" name="__codelineno-0-104"></a><span class="sd">            templates_df: The dataframe containing information about the log templates.</span>
+</span><span id="__span-0-105"><a id="__codelineno-0-105" name="__codelineno-0-105"></a><span class="sd">            variable_row: The row of the dataframe containing information about the parsed variable.</span>
+</span><span id="__span-0-106"><a id="__codelineno-0-106" name="__codelineno-0-106"></a><span class="sd">            banned_values: A list of values that should not be used as tags.</span>
+</span><span id="__span-0-107"><a id="__codelineno-0-107" name="__codelineno-0-107"></a>
+</span><span id="__span-0-108"><a id="__codelineno-0-108" name="__codelineno-0-108"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-109"><a id="__codelineno-0-109" name="__codelineno-0-109"></a><span class="sd">            A tuple containing (i) the tag for the parsed variable, and (ii) the origin of the tag.</span>
+</span><span id="__span-0-110"><a id="__codelineno-0-110" name="__codelineno-0-110"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-111"><a id="__codelineno-0-111" name="__codelineno-0-111"></a>        <span class="n">name</span> <span class="o">=</span> <span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span>
+</span><span id="__span-0-112"><a id="__codelineno-0-112" name="__codelineno-0-112"></a>        <span class="k">if</span> <span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]:</span>
+</span><span id="__span-0-113"><a id="__codelineno-0-113" name="__codelineno-0-113"></a>            <span class="k">return</span> <span class="p">(</span><span class="n">name</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">REGEX_VARIABLE</span><span class="p">)</span>
+</span><span id="__span-0-114"><a id="__codelineno-0-114" name="__codelineno-0-114"></a>
+</span><span id="__span-0-115"><a id="__codelineno-0-115" name="__codelineno-0-115"></a>        <span class="c1"># Try to derive a tag from the preceding tokens in the corresponding template</span>
+</span><span id="__span-0-116"><a id="__codelineno-0-116" name="__codelineno-0-116"></a>        <span class="n">tag</span><span class="p">,</span> <span class="n">origin</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">preceding_tokens_tag</span><span class="p">(</span><span class="n">variable_row</span><span class="p">,</span> <span class="n">banned_values</span><span class="p">)</span>
+</span><span id="__span-0-117"><a id="__codelineno-0-117" name="__codelineno-0-117"></a>        <span class="k">if</span> <span class="n">tag</span> <span class="o">!=</span> <span class="n">name</span><span class="p">:</span>
+</span><span id="__span-0-118"><a id="__codelineno-0-118" name="__codelineno-0-118"></a>            <span class="k">return</span> <span class="p">(</span><span class="n">tag</span><span class="p">,</span> <span class="n">origin</span><span class="p">)</span>
+</span><span id="__span-0-119"><a id="__codelineno-0-119" name="__codelineno-0-119"></a>
+</span><span id="__span-0-120"><a id="__codelineno-0-120" name="__codelineno-0-120"></a>        <span class="c1"># Try to derive a tag using GPT-3.5</span>
+</span><span id="__span-0-121"><a id="__codelineno-0-121" name="__codelineno-0-121"></a>        <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-122"><a id="__codelineno-0-122" name="__codelineno-0-122"></a>            <span class="n">tag</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">gpt_tag</span><span class="p">(</span>
+</span><span id="__span-0-123"><a id="__codelineno-0-123" name="__codelineno-0-123"></a>                <span class="n">templates_df</span><span class="p">,</span> <span class="n">variable_row</span><span class="p">,</span> <span class="s2">&quot;gpt-3.5-turbo&quot;</span><span class="p">,</span> <span class="n">banned_values</span>
+</span><span id="__span-0-124"><a id="__codelineno-0-124" name="__codelineno-0-124"></a>            <span class="p">)</span>
+</span><span id="__span-0-125"><a id="__codelineno-0-125" name="__codelineno-0-125"></a>            <span class="k">if</span> <span class="n">tag</span> <span class="o">!=</span> <span class="n">name</span><span class="p">:</span>
+</span><span id="__span-0-126"><a id="__codelineno-0-126" name="__codelineno-0-126"></a>                <span class="k">return</span> <span class="p">(</span><span class="n">tag</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">GPT_3POINT5_TURBO</span><span class="p">)</span>
+</span><span id="__span-0-127"><a id="__codelineno-0-127" name="__codelineno-0-127"></a>        <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-128"><a id="__codelineno-0-128" name="__codelineno-0-128"></a>            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Exception </span><span class="si">{</span><span class="n">e</span><span class="si">}</span><span class="s2"> came up while tagging </span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> with GPT-3.5.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-129"><a id="__codelineno-0-129" name="__codelineno-0-129"></a>            <span class="k">pass</span>
+</span><span id="__span-0-130"><a id="__codelineno-0-130" name="__codelineno-0-130"></a>
+</span><span id="__span-0-131"><a id="__codelineno-0-131" name="__codelineno-0-131"></a>        <span class="c1"># Try to derive a tag using GPT-4</span>
+</span><span id="__span-0-132"><a id="__codelineno-0-132" name="__codelineno-0-132"></a>        <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-133"><a id="__codelineno-0-133" name="__codelineno-0-133"></a>            <span class="n">tag</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">gpt_tag</span><span class="p">(</span><span class="n">templates_df</span><span class="p">,</span> <span class="n">variable_row</span><span class="p">,</span> <span class="s2">&quot;gpt-4&quot;</span><span class="p">,</span> <span class="n">banned_values</span><span class="p">)</span>
+</span><span id="__span-0-134"><a id="__codelineno-0-134" name="__codelineno-0-134"></a>            <span class="k">if</span> <span class="n">tag</span> <span class="o">!=</span> <span class="n">name</span><span class="p">:</span>
+</span><span id="__span-0-135"><a id="__codelineno-0-135" name="__codelineno-0-135"></a>                <span class="k">return</span> <span class="p">(</span><span class="n">tag</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">GPT_4</span><span class="p">)</span>
+</span><span id="__span-0-136"><a id="__codelineno-0-136" name="__codelineno-0-136"></a>        <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-137"><a id="__codelineno-0-137" name="__codelineno-0-137"></a>            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Exception </span><span class="si">{</span><span class="n">e</span><span class="si">}</span><span class="s2"> came up while tagging </span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> with GPT-4.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-138"><a id="__codelineno-0-138" name="__codelineno-0-138"></a>            <span class="k">pass</span>
+</span><span id="__span-0-139"><a id="__codelineno-0-139" name="__codelineno-0-139"></a>
+</span><span id="__span-0-140"><a id="__codelineno-0-140" name="__codelineno-0-140"></a>        <span class="k">return</span> <span class="p">(</span><span class="n">name</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">NAME</span><span class="p">)</span>
+</span><span id="__span-0-141"><a id="__codelineno-0-141" name="__codelineno-0-141"></a>
+</span><span id="__span-0-142"><a id="__codelineno-0-142" name="__codelineno-0-142"></a>    <span class="nd">@staticmethod</span>
+</span><span id="__span-0-143"><a id="__codelineno-0-143" name="__codelineno-0-143"></a>    <span class="k">def</span> <span class="nf">preceding_tokens_tag</span><span class="p">(</span>
+</span><span id="__span-0-144"><a id="__codelineno-0-144" name="__codelineno-0-144"></a>        <span class="n">variable_row</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">,</span> <span class="n">banned_values</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-145"><a id="__codelineno-0-145" name="__codelineno-0-145"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="p">]:</span>
+</span><span id="__span-0-146"><a id="__codelineno-0-146" name="__codelineno-0-146"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-147"><a id="__codelineno-0-147" name="__codelineno-0-147"></a><span class="sd">        Try to derive a tag for a parsed variable name based on the preceding tokens in the corresponding template.</span>
+</span><span id="__span-0-148"><a id="__codelineno-0-148" name="__codelineno-0-148"></a>
+</span><span id="__span-0-149"><a id="__codelineno-0-149" name="__codelineno-0-149"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-150"><a id="__codelineno-0-150" name="__codelineno-0-150"></a><span class="sd">            variable_row: The row of the dataframe containing information about the parsed variable.</span>
+</span><span id="__span-0-151"><a id="__codelineno-0-151" name="__codelineno-0-151"></a><span class="sd">            banned_values: A list of values that should not be used as tags.</span>
+</span><span id="__span-0-152"><a id="__codelineno-0-152" name="__codelineno-0-152"></a>
+</span><span id="__span-0-153"><a id="__codelineno-0-153" name="__codelineno-0-153"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-154"><a id="__codelineno-0-154" name="__codelineno-0-154"></a><span class="sd">            A tuple containing (i) the tag for the parsed variable, and (ii) the origin of the tag.</span>
+</span><span id="__span-0-155"><a id="__codelineno-0-155" name="__codelineno-0-155"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-156"><a id="__codelineno-0-156" name="__codelineno-0-156"></a>
+</span><span id="__span-0-157"><a id="__codelineno-0-157" name="__codelineno-0-157"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_fields</span><span class="p">(</span><span class="n">variable_row</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Preceding 3 tokens&quot;</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;From regex&quot;</span><span class="p">])</span>
+</span><span id="__span-0-158"><a id="__codelineno-0-158" name="__codelineno-0-158"></a>        <span class="n">name</span> <span class="o">=</span> <span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span>
+</span><span id="__span-0-159"><a id="__codelineno-0-159" name="__codelineno-0-159"></a>        <span class="k">if</span> <span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]:</span>
+</span><span id="__span-0-160"><a id="__codelineno-0-160" name="__codelineno-0-160"></a>            <span class="k">return</span> <span class="n">name</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">REGEX_VARIABLE</span>
+</span><span id="__span-0-161"><a id="__codelineno-0-161" name="__codelineno-0-161"></a>
+</span><span id="__span-0-162"><a id="__codelineno-0-162" name="__codelineno-0-162"></a>        <span class="n">pr</span> <span class="o">=</span> <span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;Preceding 3 tokens&quot;</span><span class="p">]</span>
+</span><span id="__span-0-163"><a id="__codelineno-0-163" name="__codelineno-0-163"></a>        <span class="n">tag</span> <span class="o">=</span> <span class="n">name</span>
+</span><span id="__span-0-164"><a id="__codelineno-0-164" name="__codelineno-0-164"></a>        <span class="n">origin</span> <span class="o">=</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">NAME</span>
+</span><span id="__span-0-165"><a id="__codelineno-0-165" name="__codelineno-0-165"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">pr</span><span class="p">)</span> <span class="o">&gt;=</span> <span class="mi">2</span> <span class="ow">and</span> <span class="p">(</span><span class="n">pr</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span> <span class="ow">in</span> <span class="s2">&quot;:=&quot;</span><span class="p">)</span> <span class="ow">and</span> <span class="p">(</span><span class="n">pr</span><span class="p">[</span><span class="o">-</span><span class="mi">2</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;&lt;&quot;</span><span class="p">):</span>
+</span><span id="__span-0-166"><a id="__codelineno-0-166" name="__codelineno-0-166"></a>            <span class="n">tag</span> <span class="o">=</span> <span class="n">pr</span><span class="p">[</span><span class="o">-</span><span class="mi">2</span><span class="p">]</span>
+</span><span id="__span-0-167"><a id="__codelineno-0-167" name="__codelineno-0-167"></a>            <span class="n">origin</span> <span class="o">=</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">PRECEDING</span>
+</span><span id="__span-0-168"><a id="__codelineno-0-168" name="__codelineno-0-168"></a>        <span class="k">elif</span> <span class="p">(</span>
+</span><span id="__span-0-169"><a id="__codelineno-0-169" name="__codelineno-0-169"></a>            <span class="nb">len</span><span class="p">(</span><span class="n">pr</span><span class="p">)</span> <span class="o">==</span> <span class="mi">3</span>
+</span><span id="__span-0-170"><a id="__codelineno-0-170" name="__codelineno-0-170"></a>            <span class="ow">and</span> <span class="p">(</span><span class="n">pr</span><span class="p">[</span><span class="mi">2</span><span class="p">]</span> <span class="ow">in</span> <span class="s2">&quot;&quot;&quot;&quot;&#39;&quot;&quot;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-171"><a id="__codelineno-0-171" name="__codelineno-0-171"></a>            <span class="ow">and</span> <span class="p">(</span><span class="n">pr</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="ow">in</span> <span class="s2">&quot;:=&quot;</span><span class="p">)</span>
+</span><span id="__span-0-172"><a id="__codelineno-0-172" name="__codelineno-0-172"></a>            <span class="ow">and</span> <span class="p">(</span><span class="n">pr</span><span class="p">[</span><span class="mi">0</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;&lt;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-173"><a id="__codelineno-0-173" name="__codelineno-0-173"></a>        <span class="p">):</span>
+</span><span id="__span-0-174"><a id="__codelineno-0-174" name="__codelineno-0-174"></a>            <span class="n">tag</span> <span class="o">=</span> <span class="n">pr</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-175"><a id="__codelineno-0-175" name="__codelineno-0-175"></a>            <span class="n">origin</span> <span class="o">=</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">PRECEDING</span>
+</span><span id="__span-0-176"><a id="__codelineno-0-176" name="__codelineno-0-176"></a>
+</span><span id="__span-0-177"><a id="__codelineno-0-177" name="__codelineno-0-177"></a>        <span class="c1"># Double-check that the tag is not in the banned values</span>
+</span><span id="__span-0-178"><a id="__codelineno-0-178" name="__codelineno-0-178"></a>        <span class="k">if</span> <span class="n">banned_values</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">tag</span> <span class="ow">in</span> <span class="n">banned_values</span><span class="p">:</span>
+</span><span id="__span-0-179"><a id="__codelineno-0-179" name="__codelineno-0-179"></a>            <span class="k">return</span> <span class="n">name</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">NAME</span>
+</span><span id="__span-0-180"><a id="__codelineno-0-180" name="__codelineno-0-180"></a>
+</span><span id="__span-0-181"><a id="__codelineno-0-181" name="__codelineno-0-181"></a>        <span class="k">return</span> <span class="n">tag</span><span class="p">,</span> <span class="n">origin</span>
+</span><span id="__span-0-182"><a id="__codelineno-0-182" name="__codelineno-0-182"></a>
+</span><span id="__span-0-183"><a id="__codelineno-0-183" name="__codelineno-0-183"></a>    <span class="nd">@staticmethod</span>
+</span><span id="__span-0-184"><a id="__codelineno-0-184" name="__codelineno-0-184"></a>    <span class="k">def</span> <span class="nf">gpt_tag</span><span class="p">(</span>
+</span><span id="__span-0-185"><a id="__codelineno-0-185" name="__codelineno-0-185"></a>        <span class="n">templates_df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span>
+</span><span id="__span-0-186"><a id="__codelineno-0-186" name="__codelineno-0-186"></a>        <span class="n">variable_row</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">,</span>
+</span><span id="__span-0-187"><a id="__codelineno-0-187" name="__codelineno-0-187"></a>        <span class="n">model</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;gpt-3.5-turbo&quot;</span><span class="p">,</span>
+</span><span id="__span-0-188"><a id="__codelineno-0-188" name="__codelineno-0-188"></a>        <span class="n">banned_values</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-189"><a id="__codelineno-0-189" name="__codelineno-0-189"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-190"><a id="__codelineno-0-190" name="__codelineno-0-190"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-191"><a id="__codelineno-0-191" name="__codelineno-0-191"></a><span class="sd">        Use GPT to derive a tag the variable described in `variable_row`,</span>
+</span><span id="__span-0-192"><a id="__codelineno-0-192" name="__codelineno-0-192"></a><span class="sd">        using information about the corresponding log template, retrieved from `templates_df`.</span>
+</span><span id="__span-0-193"><a id="__codelineno-0-193" name="__codelineno-0-193"></a>
+</span><span id="__span-0-194"><a id="__codelineno-0-194" name="__codelineno-0-194"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-195"><a id="__codelineno-0-195" name="__codelineno-0-195"></a><span class="sd">            templates_df: The dataframe containing information about the log templates.</span>
+</span><span id="__span-0-196"><a id="__codelineno-0-196" name="__codelineno-0-196"></a><span class="sd">            variable_row: The row of the dataframe containing information about the parsed variable.</span>
+</span><span id="__span-0-197"><a id="__codelineno-0-197" name="__codelineno-0-197"></a><span class="sd">            model: The GPT model to use.</span>
+</span><span id="__span-0-198"><a id="__codelineno-0-198" name="__codelineno-0-198"></a><span class="sd">            banned_values: A list of values that should not be used as tags.</span>
+</span><span id="__span-0-199"><a id="__codelineno-0-199" name="__codelineno-0-199"></a>
+</span><span id="__span-0-200"><a id="__codelineno-0-200" name="__codelineno-0-200"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-201"><a id="__codelineno-0-201" name="__codelineno-0-201"></a><span class="sd">            The GPT-generated tag for the parsed variable name.</span>
+</span><span id="__span-0-202"><a id="__codelineno-0-202" name="__codelineno-0-202"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-203"><a id="__codelineno-0-203" name="__codelineno-0-203"></a>
+</span><span id="__span-0-204"><a id="__codelineno-0-204" name="__codelineno-0-204"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_fields</span><span class="p">(</span><span class="n">variable_row</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;Examples&quot;</span><span class="p">])</span>
+</span><span id="__span-0-205"><a id="__codelineno-0-205" name="__codelineno-0-205"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_columns</span><span class="p">(</span><span class="n">templates_df</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">,</span> <span class="s2">&quot;TemplateExample&quot;</span><span class="p">])</span>
+</span><span id="__span-0-206"><a id="__codelineno-0-206" name="__codelineno-0-206"></a>
+</span><span id="__span-0-207"><a id="__codelineno-0-207" name="__codelineno-0-207"></a>        <span class="n">template_id</span> <span class="o">=</span> <span class="n">ParsedVariableName</span><span class="p">(</span><span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">])</span><span class="o">.</span><span class="n">template_id</span><span class="p">()</span>
+</span><span id="__span-0-208"><a id="__codelineno-0-208" name="__codelineno-0-208"></a>        <span class="n">idx</span> <span class="o">=</span> <span class="n">ParsedVariableName</span><span class="p">(</span><span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">])</span><span class="o">.</span><span class="n">index</span><span class="p">()</span>
+</span><span id="__span-0-209"><a id="__codelineno-0-209" name="__codelineno-0-209"></a>
+</span><span id="__span-0-210"><a id="__codelineno-0-210" name="__codelineno-0-210"></a>        <span class="n">line</span> <span class="o">=</span> <span class="n">templates_df</span><span class="p">[</span><span class="n">templates_df</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">template_id</span><span class="p">][</span>
+</span><span id="__span-0-211"><a id="__codelineno-0-211" name="__codelineno-0-211"></a>            <span class="s2">&quot;TemplateExample&quot;</span>
+</span><span id="__span-0-212"><a id="__codelineno-0-212" name="__codelineno-0-212"></a>        <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-213"><a id="__codelineno-0-213" name="__codelineno-0-213"></a>        <span class="n">line_toks</span> <span class="o">=</span> <span class="n">line</span><span class="o">.</span><span class="n">split</span><span class="p">()</span>
+</span><span id="__span-0-214"><a id="__codelineno-0-214" name="__codelineno-0-214"></a>
+</span><span id="__span-0-215"><a id="__codelineno-0-215" name="__codelineno-0-215"></a>        <span class="c1"># Define the messages to send to the model</span>
+</span><span id="__span-0-216"><a id="__codelineno-0-216" name="__codelineno-0-216"></a>        <span class="n">messages</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="__span-0-217"><a id="__codelineno-0-217" name="__codelineno-0-217"></a>            <span class="p">{</span>
+</span><span id="__span-0-218"><a id="__codelineno-0-218" name="__codelineno-0-218"></a>                <span class="s2">&quot;role&quot;</span><span class="p">:</span> <span class="s2">&quot;system&quot;</span><span class="p">,</span>
+</span><span id="__span-0-219"><a id="__codelineno-0-219" name="__codelineno-0-219"></a>                <span class="s2">&quot;content&quot;</span><span class="p">:</span> <span class="s2">&quot;You are a backend engineer that knows all about the logging infrastructure of a distributed system.&quot;</span><span class="p">,</span>
+</span><span id="__span-0-220"><a id="__codelineno-0-220" name="__codelineno-0-220"></a>            <span class="p">},</span>
+</span><span id="__span-0-221"><a id="__codelineno-0-221" name="__codelineno-0-221"></a>            <span class="p">{</span>
+</span><span id="__span-0-222"><a id="__codelineno-0-222" name="__codelineno-0-222"></a>                <span class="s2">&quot;role&quot;</span><span class="p">:</span> <span class="s2">&quot;user&quot;</span><span class="p">,</span>
+</span><span id="__span-0-223"><a id="__codelineno-0-223" name="__codelineno-0-223"></a>                <span class="s2">&quot;content&quot;</span><span class="p">:</span> <span class="sa">f</span><span class="s2">&quot;&quot;&quot;Generate a tag for the variable that takes the value </span><span class="si">{</span><span class="n">line_toks</span><span class="p">[</span><span class="n">idx</span><span class="p">]</span><span class="si">}</span><span class="s2"> &quot;&quot;&quot;</span>
+</span><span id="__span-0-224"><a id="__codelineno-0-224" name="__codelineno-0-224"></a>                <span class="sa">f</span><span class="s2">&quot;&quot;&quot;in the following log line:</span><span class="se">\n</span><span class="s2"> </span><span class="si">{</span><span class="n">line</span><span class="si">}</span><span class="se">\n</span><span class="s2">&quot;&quot;&quot;</span>
+</span><span id="__span-0-225"><a id="__codelineno-0-225" name="__codelineno-0-225"></a>                <span class="sa">f</span><span class="s2">&quot;&quot;&quot;Here are the 3 tokens that precede the variable: [</span><span class="si">{</span><span class="s1">&#39;, &#39;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">line_toks</span><span class="p">[</span><span class="nb">max</span><span class="p">(</span><span class="n">idx</span><span class="o">-</span><span class="mi">3</span><span class="p">,</span><span class="w"> </span><span class="mi">0</span><span class="p">):</span><span class="n">idx</span><span class="p">])</span><span class="si">}</span><span class="s2"> ]</span><span class="se">\n</span><span class="s2">&quot;&quot;&quot;</span>
+</span><span id="__span-0-226"><a id="__codelineno-0-226" name="__codelineno-0-226"></a>                <span class="sa">f</span><span class="s2">&quot;&quot;&quot;Here are some more example values for this variable: [</span><span class="si">{</span><span class="s1">&#39;, &#39;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">variable_row</span><span class="p">[</span><span class="s1">&#39;Examples&#39;</span><span class="p">])</span><span class="si">}</span><span class="s2"> ]</span><span class="se">\n</span><span class="s2">&quot;&quot;&quot;</span>
+</span><span id="__span-0-227"><a id="__codelineno-0-227" name="__codelineno-0-227"></a>                <span class="c1">#f&quot;&quot;&quot;Make sure the tag matches none of the following values: [{&#39;, &#39;.join(banned_values) if banned_values is not None else &#39;&#39;} ]\n&quot;&quot;&quot;</span>
+</span><span id="__span-0-228"><a id="__codelineno-0-228" name="__codelineno-0-228"></a><span class="w">                </span><span class="sd">&quot;&quot;&quot;Return only the tag as a single word, possibly including underscores. DO NOT EVER REPLY WITH MORE THAN ONE WORD.\n&quot;&quot;&quot;</span><span class="p">,</span>
+</span><span id="__span-0-229"><a id="__codelineno-0-229" name="__codelineno-0-229"></a>            <span class="p">},</span>
+</span><span id="__span-0-230"><a id="__codelineno-0-230" name="__codelineno-0-230"></a>        <span class="p">]</span>
+</span><span id="__span-0-231"><a id="__codelineno-0-231" name="__codelineno-0-231"></a>
+</span><span id="__span-0-232"><a id="__codelineno-0-232" name="__codelineno-0-232"></a>        <span class="n">client</span> <span class="o">=</span> <span class="n">OpenAI</span><span class="p">()</span>
+</span><span id="__span-0-233"><a id="__codelineno-0-233" name="__codelineno-0-233"></a>
+</span><span id="__span-0-234"><a id="__codelineno-0-234" name="__codelineno-0-234"></a>        <span class="n">tag</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-235"><a id="__codelineno-0-235" name="__codelineno-0-235"></a>            <span class="n">client</span><span class="o">.</span><span class="n">chat</span><span class="o">.</span><span class="n">completions</span><span class="o">.</span><span class="n">create</span><span class="p">(</span><span class="n">model</span><span class="o">=</span><span class="n">model</span><span class="p">,</span> <span class="n">messages</span><span class="o">=</span><span class="n">messages</span><span class="p">)</span>
+</span><span id="__span-0-236"><a id="__codelineno-0-236" name="__codelineno-0-236"></a>            <span class="o">.</span><span class="n">choices</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-237"><a id="__codelineno-0-237" name="__codelineno-0-237"></a>            <span class="o">.</span><span class="n">message</span><span class="o">.</span><span class="n">content</span>
+</span><span id="__span-0-238"><a id="__codelineno-0-238" name="__codelineno-0-238"></a>        <span class="p">)</span>
+</span><span id="__span-0-239"><a id="__codelineno-0-239" name="__codelineno-0-239"></a>        <span class="n">tag_length</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">tag</span><span class="o">.</span><span class="n">split</span><span class="p">())</span>
+</span><span id="__span-0-240"><a id="__codelineno-0-240" name="__codelineno-0-240"></a>        <span class="k">if</span> <span class="n">tag_length</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="__span-0-241"><a id="__codelineno-0-241" name="__codelineno-0-241"></a>            <span class="c1"># GPT didn&#39;t listen to us and returned a phrase describing the tag.</span>
+</span><span id="__span-0-242"><a id="__codelineno-0-242" name="__codelineno-0-242"></a>            <span class="c1"># Extract the word between the second-last and last occurrence of double quotes.</span>
+</span><span id="__span-0-243"><a id="__codelineno-0-243" name="__codelineno-0-243"></a>            <span class="n">tag</span> <span class="o">=</span> <span class="n">tag</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;&quot;&#39;</span><span class="p">)[</span><span class="o">-</span><span class="mi">2</span><span class="p">]</span>
 </span><span id="__span-0-244"><a id="__codelineno-0-244" name="__codelineno-0-244"></a>
-</span><span id="__span-0-245"><a id="__codelineno-0-245" name="__codelineno-0-245"></a>        <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="s2">&quot;gpt_log.txt&quot;</span><span class="p">,</span> <span class="s2">&quot;a+&quot;</span><span class="p">)</span> <span class="k">as</span> <span class="n">f</span><span class="p">:</span>
-</span><span id="__span-0-246"><a id="__codelineno-0-246" name="__codelineno-0-246"></a>            <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="s1">&#39;----------------------------------</span><span class="se">\n</span><span class="s1">&#39;</span><span class="p">)</span>
-</span><span id="__span-0-247"><a id="__codelineno-0-247" name="__codelineno-0-247"></a>            <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Variable name: </span><span class="si">{</span><span class="n">variable_row</span><span class="p">[</span><span class="s1">&#39;Name&#39;</span><span class="p">]</span><span class="si">}</span><span class="se">\n\n</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="__span-0-248"><a id="__codelineno-0-248" name="__codelineno-0-248"></a>            <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Model used: </span><span class="si">{</span><span class="n">model</span><span class="si">}</span><span class="se">\n\n</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="__span-0-249"><a id="__codelineno-0-249" name="__codelineno-0-249"></a>            <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Messages sent to the model:</span><span class="se">\n</span><span class="si">{</span><span class="n">messages</span><span class="si">}</span><span class="se">\n\n</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="__span-0-250"><a id="__codelineno-0-250" name="__codelineno-0-250"></a>            <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Tag generated by the model:</span><span class="se">\n</span><span class="si">{</span><span class="n">tag</span><span class="si">}</span><span class="se">\n\n</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="__span-0-251"><a id="__codelineno-0-251" name="__codelineno-0-251"></a>            <span class="n">f</span><span class="o">.</span><span class="n">flush</span><span class="p">()</span>
-</span><span id="__span-0-252"><a id="__codelineno-0-252" name="__codelineno-0-252"></a>
-</span><span id="__span-0-253"><a id="__codelineno-0-253" name="__codelineno-0-253"></a>        <span class="c1"># Double-check that the tag is not in the banned values</span>
-</span><span id="__span-0-254"><a id="__codelineno-0-254" name="__codelineno-0-254"></a>        <span class="k">if</span> <span class="n">banned_values</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">tag</span> <span class="ow">in</span> <span class="n">banned_values</span><span class="p">:</span>
-</span><span id="__span-0-255"><a id="__codelineno-0-255" name="__codelineno-0-255"></a>            <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="s2">&quot;gpt_log.txt&quot;</span><span class="p">,</span> <span class="s2">&quot;a+&quot;</span><span class="p">)</span> <span class="k">as</span> <span class="n">f</span><span class="p">:</span>
-</span><span id="__span-0-256"><a id="__codelineno-0-256" name="__codelineno-0-256"></a>                <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="s1">&#39;That tag is banned, returning name.</span><span class="se">\n</span><span class="s1">&#39;</span><span class="p">)</span>
-</span><span id="__span-0-257"><a id="__codelineno-0-257" name="__codelineno-0-257"></a>            <span class="k">return</span> <span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span>
-</span><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a>
-</span><span id="__span-0-259"><a id="__codelineno-0-259" name="__codelineno-0-259"></a>        <span class="k">return</span> <span class="n">tag</span>
-</span><span id="__span-0-260"><a id="__codelineno-0-260" name="__codelineno-0-260"></a>
-</span><span id="__span-0-261"><a id="__codelineno-0-261" name="__codelineno-0-261"></a>    <span class="nd">@staticmethod</span>
-</span><span id="__span-0-262"><a id="__codelineno-0-262" name="__codelineno-0-262"></a>    <span class="k">def</span> <span class="nf">deduplicate_tags</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
-</span><span id="__span-0-263"><a id="__codelineno-0-263" name="__codelineno-0-263"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-264"><a id="__codelineno-0-264" name="__codelineno-0-264"></a><span class="sd">        Ensure that the tags in df are unique, by making the tag column of any row</span>
-</span><span id="__span-0-265"><a id="__codelineno-0-265" name="__codelineno-0-265"></a><span class="sd">        with a seen-before tag equal to the name column of that row.</span>
-</span><span id="__span-0-266"><a id="__codelineno-0-266" name="__codelineno-0-266"></a>
-</span><span id="__span-0-267"><a id="__codelineno-0-267" name="__codelineno-0-267"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-268"><a id="__codelineno-0-268" name="__codelineno-0-268"></a><span class="sd">            df: The dataframe to be deduplicated.</span>
-</span><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a>
-</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a><span class="sd">            The deduplicated dataframe.</span>
-</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a>
-</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_columns</span><span class="p">(</span><span class="n">df</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">,</span> <span class="s2">&quot;TagOrigin&quot;</span><span class="p">])</span>
-</span><span id="__span-0-275"><a id="__codelineno-0-275" name="__codelineno-0-275"></a>        <span class="n">seen_tags</span> <span class="o">=</span> <span class="nb">set</span><span class="p">()</span>
-</span><span id="__span-0-276"><a id="__codelineno-0-276" name="__codelineno-0-276"></a>        <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">row</span> <span class="ow">in</span> <span class="n">df</span><span class="o">.</span><span class="n">iterrows</span><span class="p">():</span>
-</span><span id="__span-0-277"><a id="__codelineno-0-277" name="__codelineno-0-277"></a>            <span class="k">if</span> <span class="n">row</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span> <span class="ow">in</span> <span class="n">seen_tags</span><span class="p">:</span>
-</span><span id="__span-0-278"><a id="__codelineno-0-278" name="__codelineno-0-278"></a>                <span class="n">df</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">i</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span>
-</span><span id="__span-0-279"><a id="__codelineno-0-279" name="__codelineno-0-279"></a>                <span class="n">df</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">i</span><span class="p">,</span> <span class="s2">&quot;TagOrigin&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">NAME</span>
-</span><span id="__span-0-280"><a id="__codelineno-0-280" name="__codelineno-0-280"></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-281"><a id="__codelineno-0-281" name="__codelineno-0-281"></a>                <span class="n">seen_tags</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">row</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">])</span>
-</span><span id="__span-0-282"><a id="__codelineno-0-282" name="__codelineno-0-282"></a>
-</span><span id="__span-0-283"><a id="__codelineno-0-283" name="__codelineno-0-283"></a>    <span class="nd">@staticmethod</span>
-</span><span id="__span-0-284"><a id="__codelineno-0-284" name="__codelineno-0-284"></a>    <span class="k">def</span> <span class="nf">set_tag</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">tag</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">info</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-285"><a id="__codelineno-0-285" name="__codelineno-0-285"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-286"><a id="__codelineno-0-286" name="__codelineno-0-286"></a><span class="sd">        Tag a parsed or prepared variable for easier access.</span>
-</span><span id="__span-0-287"><a id="__codelineno-0-287" name="__codelineno-0-287"></a>
-</span><span id="__span-0-288"><a id="__codelineno-0-288" name="__codelineno-0-288"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-289"><a id="__codelineno-0-289" name="__codelineno-0-289"></a><span class="sd">            df: The dataframe containing the parsed or prepared variables.</span>
-</span><span id="__span-0-290"><a id="__codelineno-0-290" name="__codelineno-0-290"></a><span class="sd">            name: The name of the parsed or prepared variable.</span>
-</span><span id="__span-0-291"><a id="__codelineno-0-291" name="__codelineno-0-291"></a><span class="sd">            tag: The tag to be set.</span>
-</span><span id="__span-0-292"><a id="__codelineno-0-292" name="__codelineno-0-292"></a><span class="sd">            info: A string describing the type of variable being tagged (parsed or prepared).</span>
-</span><span id="__span-0-293"><a id="__codelineno-0-293" name="__codelineno-0-293"></a>
-</span><span id="__span-0-294"><a id="__codelineno-0-294" name="__codelineno-0-294"></a><span class="sd">        Raises:</span>
-</span><span id="__span-0-295"><a id="__codelineno-0-295" name="__codelineno-0-295"></a><span class="sd">            ValueError: If the name is not the name of a parsed or prepared variable.</span>
-</span><span id="__span-0-296"><a id="__codelineno-0-296" name="__codelineno-0-296"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-297"><a id="__codelineno-0-297" name="__codelineno-0-297"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_columns</span><span class="p">(</span><span class="n">df</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">])</span>
-</span><span id="__span-0-298"><a id="__codelineno-0-298" name="__codelineno-0-298"></a>        <span class="k">if</span> <span class="n">name</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">:</span>
-</span><span id="__span-0-299"><a id="__codelineno-0-299" name="__codelineno-0-299"></a>            <span class="n">df</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">name</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">tag</span>
-</span><span id="__span-0-300"><a id="__codelineno-0-300" name="__codelineno-0-300"></a>            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Variable </span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> tagged as </span><span class="si">{</span><span class="n">tag</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="__span-0-301"><a id="__codelineno-0-301" name="__codelineno-0-301"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-302"><a id="__codelineno-0-302" name="__codelineno-0-302"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> is not the name of a </span><span class="si">{</span><span class="n">info</span><span class="si">}</span><span class="s2"> variable.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-303"><a id="__codelineno-0-303" name="__codelineno-0-303"></a>
-</span><span id="__span-0-304"><a id="__codelineno-0-304" name="__codelineno-0-304"></a>    <span class="nd">@staticmethod</span>
-</span><span id="__span-0-305"><a id="__codelineno-0-305" name="__codelineno-0-305"></a>    <span class="k">def</span> <span class="nf">get_tag</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">info</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-</span><span id="__span-0-306"><a id="__codelineno-0-306" name="__codelineno-0-306"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-307"><a id="__codelineno-0-307" name="__codelineno-0-307"></a><span class="sd">        Retrieve the tag of a parsed or prepared variable.</span>
-</span><span id="__span-0-308"><a id="__codelineno-0-308" name="__codelineno-0-308"></a>
-</span><span id="__span-0-309"><a id="__codelineno-0-309" name="__codelineno-0-309"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-310"><a id="__codelineno-0-310" name="__codelineno-0-310"></a><span class="sd">            df: The dataframe containing the parsed or prepared variables.</span>
-</span><span id="__span-0-311"><a id="__codelineno-0-311" name="__codelineno-0-311"></a><span class="sd">            name: The name of the parsed or prepared variable.</span>
-</span><span id="__span-0-312"><a id="__codelineno-0-312" name="__codelineno-0-312"></a><span class="sd">            info: A string describing the type of variable being tagged (parsed or prepared).</span>
-</span><span id="__span-0-313"><a id="__codelineno-0-313" name="__codelineno-0-313"></a>
-</span><span id="__span-0-314"><a id="__codelineno-0-314" name="__codelineno-0-314"></a><span class="sd">        Raises:</span>
-</span><span id="__span-0-315"><a id="__codelineno-0-315" name="__codelineno-0-315"></a><span class="sd">            ValueError: If the name is not the name of a parsed or prepared variable.</span>
-</span><span id="__span-0-316"><a id="__codelineno-0-316" name="__codelineno-0-316"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-317"><a id="__codelineno-0-317" name="__codelineno-0-317"></a>
-</span><span id="__span-0-318"><a id="__codelineno-0-318" name="__codelineno-0-318"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_columns</span><span class="p">(</span><span class="n">df</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">])</span>
-</span><span id="__span-0-319"><a id="__codelineno-0-319" name="__codelineno-0-319"></a>        <span class="k">if</span> <span class="n">name</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">:</span>
-</span><span id="__span-0-320"><a id="__codelineno-0-320" name="__codelineno-0-320"></a>            <span class="k">return</span> <span class="n">df</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">name</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-321"><a id="__codelineno-0-321" name="__codelineno-0-321"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-322"><a id="__codelineno-0-322" name="__codelineno-0-322"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> is not the name of a </span><span class="si">{</span><span class="n">info</span><span class="si">}</span><span class="s2"> variable.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-323"><a id="__codelineno-0-323" name="__codelineno-0-323"></a>
-</span><span id="__span-0-324"><a id="__codelineno-0-324" name="__codelineno-0-324"></a>    <span class="nd">@staticmethod</span>
-</span><span id="__span-0-325"><a id="__codelineno-0-325" name="__codelineno-0-325"></a>    <span class="k">def</span> <span class="nf">name_of</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">name_or_tag</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">info</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-</span><span id="__span-0-326"><a id="__codelineno-0-326" name="__codelineno-0-326"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-327"><a id="__codelineno-0-327" name="__codelineno-0-327"></a><span class="sd">        Determine the name of a parsed or prepared variable, given either itself or its tag.</span>
-</span><span id="__span-0-328"><a id="__codelineno-0-328" name="__codelineno-0-328"></a>
-</span><span id="__span-0-329"><a id="__codelineno-0-329" name="__codelineno-0-329"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-330"><a id="__codelineno-0-330" name="__codelineno-0-330"></a><span class="sd">            df: The dataframe containing the parsed or prepared variables.</span>
-</span><span id="__span-0-331"><a id="__codelineno-0-331" name="__codelineno-0-331"></a><span class="sd">            name_or_tag: The name or tag of the parsed or prepared variable.</span>
-</span><span id="__span-0-332"><a id="__codelineno-0-332" name="__codelineno-0-332"></a><span class="sd">            info: A string describing the type of variable in question (parsed or prepared).</span>
-</span><span id="__span-0-333"><a id="__codelineno-0-333" name="__codelineno-0-333"></a>
-</span><span id="__span-0-334"><a id="__codelineno-0-334" name="__codelineno-0-334"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-335"><a id="__codelineno-0-335" name="__codelineno-0-335"></a><span class="sd">            The name of the parsed or prepared variable.</span>
-</span><span id="__span-0-336"><a id="__codelineno-0-336" name="__codelineno-0-336"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-337"><a id="__codelineno-0-337" name="__codelineno-0-337"></a>
-</span><span id="__span-0-338"><a id="__codelineno-0-338" name="__codelineno-0-338"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_columns</span><span class="p">(</span><span class="n">df</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">])</span>
-</span><span id="__span-0-339"><a id="__codelineno-0-339" name="__codelineno-0-339"></a>        <span class="n">name_or_tag</span> <span class="o">=</span> <span class="n">name_or_tag</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
-</span><span id="__span-0-340"><a id="__codelineno-0-340" name="__codelineno-0-340"></a>        <span class="k">if</span> <span class="n">name_or_tag</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">:</span>
-</span><span id="__span-0-341"><a id="__codelineno-0-341" name="__codelineno-0-341"></a>            <span class="k">return</span> <span class="n">name_or_tag</span>
-</span><span id="__span-0-342"><a id="__codelineno-0-342" name="__codelineno-0-342"></a>        <span class="k">elif</span> <span class="n">name_or_tag</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">:</span>
-</span><span id="__span-0-343"><a id="__codelineno-0-343" name="__codelineno-0-343"></a>            <span class="k">return</span> <span class="n">df</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">df</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">name_or_tag</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-344"><a id="__codelineno-0-344" name="__codelineno-0-344"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-345"><a id="__codelineno-0-345" name="__codelineno-0-345"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
-</span><span id="__span-0-346"><a id="__codelineno-0-346" name="__codelineno-0-346"></a>                <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name_or_tag</span><span class="si">}</span><span class="s2"> is not the name or tag of a </span><span class="si">{</span><span class="n">info</span><span class="si">}</span><span class="s2"> variable.&quot;</span>
-</span><span id="__span-0-347"><a id="__codelineno-0-347" name="__codelineno-0-347"></a>            <span class="p">)</span>
-</span><span id="__span-0-348"><a id="__codelineno-0-348" name="__codelineno-0-348"></a>
-</span><span id="__span-0-349"><a id="__codelineno-0-349" name="__codelineno-0-349"></a>    <span class="nd">@staticmethod</span>
-</span><span id="__span-0-350"><a id="__codelineno-0-350" name="__codelineno-0-350"></a>    <span class="k">def</span> <span class="nf">tag_of</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">name_or_tag</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">info</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]:</span>
-</span><span id="__span-0-351"><a id="__codelineno-0-351" name="__codelineno-0-351"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-352"><a id="__codelineno-0-352" name="__codelineno-0-352"></a><span class="sd">        Determine the tag of a parsed or prepared variable, given either itself or its name.</span>
-</span><span id="__span-0-353"><a id="__codelineno-0-353" name="__codelineno-0-353"></a><span class="sd">        Retuirn None if the variable is None.</span>
-</span><span id="__span-0-354"><a id="__codelineno-0-354" name="__codelineno-0-354"></a>
-</span><span id="__span-0-355"><a id="__codelineno-0-355" name="__codelineno-0-355"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-356"><a id="__codelineno-0-356" name="__codelineno-0-356"></a><span class="sd">            df: The dataframe containing the parsed or prepared variables.</span>
-</span><span id="__span-0-357"><a id="__codelineno-0-357" name="__codelineno-0-357"></a><span class="sd">            name_or_tag: The name or tag of the parsed or prepared variable.</span>
-</span><span id="__span-0-358"><a id="__codelineno-0-358" name="__codelineno-0-358"></a><span class="sd">            info: A string describing the type of variable in question (parsed or prepared).</span>
-</span><span id="__span-0-359"><a id="__codelineno-0-359" name="__codelineno-0-359"></a>
-</span><span id="__span-0-360"><a id="__codelineno-0-360" name="__codelineno-0-360"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-361"><a id="__codelineno-0-361" name="__codelineno-0-361"></a><span class="sd">            The tag of the parsed or prepared variable.</span>
-</span><span id="__span-0-362"><a id="__codelineno-0-362" name="__codelineno-0-362"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-363"><a id="__codelineno-0-363" name="__codelineno-0-363"></a>
-</span><span id="__span-0-364"><a id="__codelineno-0-364" name="__codelineno-0-364"></a>        <span class="k">if</span> <span class="n">name_or_tag</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-365"><a id="__codelineno-0-365" name="__codelineno-0-365"></a>            <span class="k">return</span> <span class="kc">None</span>
-</span><span id="__span-0-366"><a id="__codelineno-0-366" name="__codelineno-0-366"></a>
-</span><span id="__span-0-367"><a id="__codelineno-0-367" name="__codelineno-0-367"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_columns</span><span class="p">(</span><span class="n">df</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">])</span>
-</span><span id="__span-0-368"><a id="__codelineno-0-368" name="__codelineno-0-368"></a>        <span class="n">name_or_tag</span> <span class="o">=</span> <span class="n">name_or_tag</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
-</span><span id="__span-0-369"><a id="__codelineno-0-369" name="__codelineno-0-369"></a>        <span class="k">if</span> <span class="n">name_or_tag</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">:</span>
-</span><span id="__span-0-370"><a id="__codelineno-0-370" name="__codelineno-0-370"></a>            <span class="k">return</span> <span class="n">name_or_tag</span>
-</span><span id="__span-0-371"><a id="__codelineno-0-371" name="__codelineno-0-371"></a>        <span class="k">elif</span> <span class="n">name_or_tag</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">:</span>
-</span><span id="__span-0-372"><a id="__codelineno-0-372" name="__codelineno-0-372"></a>            <span class="k">return</span> <span class="n">df</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">name_or_tag</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-373"><a id="__codelineno-0-373" name="__codelineno-0-373"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-374"><a id="__codelineno-0-374" name="__codelineno-0-374"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
-</span><span id="__span-0-375"><a id="__codelineno-0-375" name="__codelineno-0-375"></a>                <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name_or_tag</span><span class="si">}</span><span class="s2"> is not the name or tag of a </span><span class="si">{</span><span class="n">info</span><span class="si">}</span><span class="s2"> variable.&quot;</span>
-</span><span id="__span-0-376"><a id="__codelineno-0-376" name="__codelineno-0-376"></a>            <span class="p">)</span>
+</span><span id="__span-0-245"><a id="__codelineno-0-245" name="__codelineno-0-245"></a>
+</span><span id="__span-0-246"><a id="__codelineno-0-246" name="__codelineno-0-246"></a>        <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="s2">&quot;gpt_log.txt&quot;</span><span class="p">,</span> <span class="s2">&quot;a+&quot;</span><span class="p">)</span> <span class="k">as</span> <span class="n">f</span><span class="p">:</span>
+</span><span id="__span-0-247"><a id="__codelineno-0-247" name="__codelineno-0-247"></a>            <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="s1">&#39;----------------------------------</span><span class="se">\n</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="__span-0-248"><a id="__codelineno-0-248" name="__codelineno-0-248"></a>            <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Variable name: </span><span class="si">{</span><span class="n">variable_row</span><span class="p">[</span><span class="s1">&#39;Name&#39;</span><span class="p">]</span><span class="si">}</span><span class="se">\n\n</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-249"><a id="__codelineno-0-249" name="__codelineno-0-249"></a>            <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Model used: </span><span class="si">{</span><span class="n">model</span><span class="si">}</span><span class="se">\n\n</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-250"><a id="__codelineno-0-250" name="__codelineno-0-250"></a>            <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Messages sent to the model:</span><span class="se">\n</span><span class="si">{</span><span class="n">messages</span><span class="si">}</span><span class="se">\n\n</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-251"><a id="__codelineno-0-251" name="__codelineno-0-251"></a>            <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Tag generated by the model:</span><span class="se">\n</span><span class="si">{</span><span class="n">tag</span><span class="si">}</span><span class="se">\n\n</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-252"><a id="__codelineno-0-252" name="__codelineno-0-252"></a>            <span class="n">f</span><span class="o">.</span><span class="n">flush</span><span class="p">()</span>
+</span><span id="__span-0-253"><a id="__codelineno-0-253" name="__codelineno-0-253"></a>
+</span><span id="__span-0-254"><a id="__codelineno-0-254" name="__codelineno-0-254"></a>        <span class="c1"># Double-check that the tag is not in the banned values</span>
+</span><span id="__span-0-255"><a id="__codelineno-0-255" name="__codelineno-0-255"></a>        <span class="k">if</span> <span class="n">banned_values</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">tag</span> <span class="ow">in</span> <span class="n">banned_values</span><span class="p">:</span>
+</span><span id="__span-0-256"><a id="__codelineno-0-256" name="__codelineno-0-256"></a>            <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="s2">&quot;gpt_log.txt&quot;</span><span class="p">,</span> <span class="s2">&quot;a+&quot;</span><span class="p">)</span> <span class="k">as</span> <span class="n">f</span><span class="p">:</span>
+</span><span id="__span-0-257"><a id="__codelineno-0-257" name="__codelineno-0-257"></a>                <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="s1">&#39;That tag is banned, returning name.</span><span class="se">\n</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a>            <span class="k">return</span> <span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span>
+</span><span id="__span-0-259"><a id="__codelineno-0-259" name="__codelineno-0-259"></a>
+</span><span id="__span-0-260"><a id="__codelineno-0-260" name="__codelineno-0-260"></a>        <span class="k">return</span> <span class="n">tag</span>
+</span><span id="__span-0-261"><a id="__codelineno-0-261" name="__codelineno-0-261"></a>
+</span><span id="__span-0-262"><a id="__codelineno-0-262" name="__codelineno-0-262"></a>    <span class="nd">@staticmethod</span>
+</span><span id="__span-0-263"><a id="__codelineno-0-263" name="__codelineno-0-263"></a>    <span class="k">def</span> <span class="nf">deduplicate_tags</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
+</span><span id="__span-0-264"><a id="__codelineno-0-264" name="__codelineno-0-264"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-265"><a id="__codelineno-0-265" name="__codelineno-0-265"></a><span class="sd">        Ensure that the tags in df are unique, by making the tag column of any row</span>
+</span><span id="__span-0-266"><a id="__codelineno-0-266" name="__codelineno-0-266"></a><span class="sd">        with a seen-before tag equal to the name column of that row.</span>
+</span><span id="__span-0-267"><a id="__codelineno-0-267" name="__codelineno-0-267"></a>
+</span><span id="__span-0-268"><a id="__codelineno-0-268" name="__codelineno-0-268"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a><span class="sd">            df: The dataframe to be deduplicated.</span>
+</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a>
+</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a><span class="sd">            The deduplicated dataframe.</span>
+</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a>
+</span><span id="__span-0-275"><a id="__codelineno-0-275" name="__codelineno-0-275"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_columns</span><span class="p">(</span><span class="n">df</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">,</span> <span class="s2">&quot;TagOrigin&quot;</span><span class="p">])</span>
+</span><span id="__span-0-276"><a id="__codelineno-0-276" name="__codelineno-0-276"></a>        <span class="n">seen_tags</span> <span class="o">=</span> <span class="nb">set</span><span class="p">()</span>
+</span><span id="__span-0-277"><a id="__codelineno-0-277" name="__codelineno-0-277"></a>        <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">row</span> <span class="ow">in</span> <span class="n">df</span><span class="o">.</span><span class="n">iterrows</span><span class="p">():</span>
+</span><span id="__span-0-278"><a id="__codelineno-0-278" name="__codelineno-0-278"></a>            <span class="k">if</span> <span class="n">row</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span> <span class="ow">in</span> <span class="n">seen_tags</span><span class="p">:</span>
+</span><span id="__span-0-279"><a id="__codelineno-0-279" name="__codelineno-0-279"></a>                <span class="n">df</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">i</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span>
+</span><span id="__span-0-280"><a id="__codelineno-0-280" name="__codelineno-0-280"></a>                <span class="n">df</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">i</span><span class="p">,</span> <span class="s2">&quot;TagOrigin&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">NAME</span>
+</span><span id="__span-0-281"><a id="__codelineno-0-281" name="__codelineno-0-281"></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-282"><a id="__codelineno-0-282" name="__codelineno-0-282"></a>                <span class="n">seen_tags</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">row</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">])</span>
+</span><span id="__span-0-283"><a id="__codelineno-0-283" name="__codelineno-0-283"></a>
+</span><span id="__span-0-284"><a id="__codelineno-0-284" name="__codelineno-0-284"></a>    <span class="nd">@staticmethod</span>
+</span><span id="__span-0-285"><a id="__codelineno-0-285" name="__codelineno-0-285"></a>    <span class="k">def</span> <span class="nf">set_tag</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">tag</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">info</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-286"><a id="__codelineno-0-286" name="__codelineno-0-286"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-287"><a id="__codelineno-0-287" name="__codelineno-0-287"></a><span class="sd">        Tag a parsed or prepared variable for easier access.</span>
+</span><span id="__span-0-288"><a id="__codelineno-0-288" name="__codelineno-0-288"></a>
+</span><span id="__span-0-289"><a id="__codelineno-0-289" name="__codelineno-0-289"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-290"><a id="__codelineno-0-290" name="__codelineno-0-290"></a><span class="sd">            df: The dataframe containing the parsed or prepared variables.</span>
+</span><span id="__span-0-291"><a id="__codelineno-0-291" name="__codelineno-0-291"></a><span class="sd">            name: The name of the parsed or prepared variable.</span>
+</span><span id="__span-0-292"><a id="__codelineno-0-292" name="__codelineno-0-292"></a><span class="sd">            tag: The tag to be set.</span>
+</span><span id="__span-0-293"><a id="__codelineno-0-293" name="__codelineno-0-293"></a><span class="sd">            info: A string describing the type of variable being tagged (parsed or prepared).</span>
+</span><span id="__span-0-294"><a id="__codelineno-0-294" name="__codelineno-0-294"></a>
+</span><span id="__span-0-295"><a id="__codelineno-0-295" name="__codelineno-0-295"></a><span class="sd">        Raises:</span>
+</span><span id="__span-0-296"><a id="__codelineno-0-296" name="__codelineno-0-296"></a><span class="sd">            ValueError: If the name is not the name of a parsed or prepared variable.</span>
+</span><span id="__span-0-297"><a id="__codelineno-0-297" name="__codelineno-0-297"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-298"><a id="__codelineno-0-298" name="__codelineno-0-298"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_columns</span><span class="p">(</span><span class="n">df</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">])</span>
+</span><span id="__span-0-299"><a id="__codelineno-0-299" name="__codelineno-0-299"></a>        <span class="k">if</span> <span class="n">name</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">:</span>
+</span><span id="__span-0-300"><a id="__codelineno-0-300" name="__codelineno-0-300"></a>            <span class="n">df</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">name</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">tag</span>
+</span><span id="__span-0-301"><a id="__codelineno-0-301" name="__codelineno-0-301"></a>            <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Variable </span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> tagged as </span><span class="si">{</span><span class="n">tag</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-302"><a id="__codelineno-0-302" name="__codelineno-0-302"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-303"><a id="__codelineno-0-303" name="__codelineno-0-303"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> is not the name of a </span><span class="si">{</span><span class="n">info</span><span class="si">}</span><span class="s2"> variable.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-304"><a id="__codelineno-0-304" name="__codelineno-0-304"></a>
+</span><span id="__span-0-305"><a id="__codelineno-0-305" name="__codelineno-0-305"></a>    <span class="nd">@staticmethod</span>
+</span><span id="__span-0-306"><a id="__codelineno-0-306" name="__codelineno-0-306"></a>    <span class="k">def</span> <span class="nf">get_tag</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">info</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-307"><a id="__codelineno-0-307" name="__codelineno-0-307"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-308"><a id="__codelineno-0-308" name="__codelineno-0-308"></a><span class="sd">        Retrieve the tag of a parsed or prepared variable.</span>
+</span><span id="__span-0-309"><a id="__codelineno-0-309" name="__codelineno-0-309"></a>
+</span><span id="__span-0-310"><a id="__codelineno-0-310" name="__codelineno-0-310"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-311"><a id="__codelineno-0-311" name="__codelineno-0-311"></a><span class="sd">            df: The dataframe containing the parsed or prepared variables.</span>
+</span><span id="__span-0-312"><a id="__codelineno-0-312" name="__codelineno-0-312"></a><span class="sd">            name: The name of the parsed or prepared variable.</span>
+</span><span id="__span-0-313"><a id="__codelineno-0-313" name="__codelineno-0-313"></a><span class="sd">            info: A string describing the type of variable being tagged (parsed or prepared).</span>
+</span><span id="__span-0-314"><a id="__codelineno-0-314" name="__codelineno-0-314"></a>
+</span><span id="__span-0-315"><a id="__codelineno-0-315" name="__codelineno-0-315"></a><span class="sd">        Raises:</span>
+</span><span id="__span-0-316"><a id="__codelineno-0-316" name="__codelineno-0-316"></a><span class="sd">            ValueError: If the name is not the name of a parsed or prepared variable.</span>
+</span><span id="__span-0-317"><a id="__codelineno-0-317" name="__codelineno-0-317"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-318"><a id="__codelineno-0-318" name="__codelineno-0-318"></a>
+</span><span id="__span-0-319"><a id="__codelineno-0-319" name="__codelineno-0-319"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_columns</span><span class="p">(</span><span class="n">df</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">])</span>
+</span><span id="__span-0-320"><a id="__codelineno-0-320" name="__codelineno-0-320"></a>        <span class="k">if</span> <span class="n">name</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">:</span>
+</span><span id="__span-0-321"><a id="__codelineno-0-321" name="__codelineno-0-321"></a>            <span class="k">return</span> <span class="n">df</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">name</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-322"><a id="__codelineno-0-322" name="__codelineno-0-322"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-323"><a id="__codelineno-0-323" name="__codelineno-0-323"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> is not the name of a </span><span class="si">{</span><span class="n">info</span><span class="si">}</span><span class="s2"> variable.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-324"><a id="__codelineno-0-324" name="__codelineno-0-324"></a>
+</span><span id="__span-0-325"><a id="__codelineno-0-325" name="__codelineno-0-325"></a>    <span class="nd">@staticmethod</span>
+</span><span id="__span-0-326"><a id="__codelineno-0-326" name="__codelineno-0-326"></a>    <span class="k">def</span> <span class="nf">name_of</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">name_or_tag</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">info</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-327"><a id="__codelineno-0-327" name="__codelineno-0-327"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-328"><a id="__codelineno-0-328" name="__codelineno-0-328"></a><span class="sd">        Determine the name of a parsed or prepared variable, given either itself or its tag.</span>
+</span><span id="__span-0-329"><a id="__codelineno-0-329" name="__codelineno-0-329"></a>
+</span><span id="__span-0-330"><a id="__codelineno-0-330" name="__codelineno-0-330"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-331"><a id="__codelineno-0-331" name="__codelineno-0-331"></a><span class="sd">            df: The dataframe containing the parsed or prepared variables.</span>
+</span><span id="__span-0-332"><a id="__codelineno-0-332" name="__codelineno-0-332"></a><span class="sd">            name_or_tag: The name or tag of the parsed or prepared variable.</span>
+</span><span id="__span-0-333"><a id="__codelineno-0-333" name="__codelineno-0-333"></a><span class="sd">            info: A string describing the type of variable in question (parsed or prepared).</span>
+</span><span id="__span-0-334"><a id="__codelineno-0-334" name="__codelineno-0-334"></a>
+</span><span id="__span-0-335"><a id="__codelineno-0-335" name="__codelineno-0-335"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-336"><a id="__codelineno-0-336" name="__codelineno-0-336"></a><span class="sd">            The name of the parsed or prepared variable.</span>
+</span><span id="__span-0-337"><a id="__codelineno-0-337" name="__codelineno-0-337"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-338"><a id="__codelineno-0-338" name="__codelineno-0-338"></a>
+</span><span id="__span-0-339"><a id="__codelineno-0-339" name="__codelineno-0-339"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_columns</span><span class="p">(</span><span class="n">df</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">])</span>
+</span><span id="__span-0-340"><a id="__codelineno-0-340" name="__codelineno-0-340"></a>        <span class="n">name_or_tag</span> <span class="o">=</span> <span class="n">name_or_tag</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
+</span><span id="__span-0-341"><a id="__codelineno-0-341" name="__codelineno-0-341"></a>        <span class="k">if</span> <span class="n">name_or_tag</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">:</span>
+</span><span id="__span-0-342"><a id="__codelineno-0-342" name="__codelineno-0-342"></a>            <span class="k">return</span> <span class="n">name_or_tag</span>
+</span><span id="__span-0-343"><a id="__codelineno-0-343" name="__codelineno-0-343"></a>        <span class="k">elif</span> <span class="n">name_or_tag</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">:</span>
+</span><span id="__span-0-344"><a id="__codelineno-0-344" name="__codelineno-0-344"></a>            <span class="k">return</span> <span class="n">df</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">df</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">name_or_tag</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-345"><a id="__codelineno-0-345" name="__codelineno-0-345"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-346"><a id="__codelineno-0-346" name="__codelineno-0-346"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+</span><span id="__span-0-347"><a id="__codelineno-0-347" name="__codelineno-0-347"></a>                <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name_or_tag</span><span class="si">}</span><span class="s2"> is not the name or tag of a </span><span class="si">{</span><span class="n">info</span><span class="si">}</span><span class="s2"> variable.&quot;</span>
+</span><span id="__span-0-348"><a id="__codelineno-0-348" name="__codelineno-0-348"></a>            <span class="p">)</span>
+</span><span id="__span-0-349"><a id="__codelineno-0-349" name="__codelineno-0-349"></a>
+</span><span id="__span-0-350"><a id="__codelineno-0-350" name="__codelineno-0-350"></a>    <span class="nd">@staticmethod</span>
+</span><span id="__span-0-351"><a id="__codelineno-0-351" name="__codelineno-0-351"></a>    <span class="k">def</span> <span class="nf">tag_of</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">name_or_tag</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">info</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]:</span>
+</span><span id="__span-0-352"><a id="__codelineno-0-352" name="__codelineno-0-352"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-353"><a id="__codelineno-0-353" name="__codelineno-0-353"></a><span class="sd">        Determine the tag of a parsed or prepared variable, given either itself or its name.</span>
+</span><span id="__span-0-354"><a id="__codelineno-0-354" name="__codelineno-0-354"></a><span class="sd">        Retuirn None if the variable is None.</span>
+</span><span id="__span-0-355"><a id="__codelineno-0-355" name="__codelineno-0-355"></a>
+</span><span id="__span-0-356"><a id="__codelineno-0-356" name="__codelineno-0-356"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-357"><a id="__codelineno-0-357" name="__codelineno-0-357"></a><span class="sd">            df: The dataframe containing the parsed or prepared variables.</span>
+</span><span id="__span-0-358"><a id="__codelineno-0-358" name="__codelineno-0-358"></a><span class="sd">            name_or_tag: The name or tag of the parsed or prepared variable.</span>
+</span><span id="__span-0-359"><a id="__codelineno-0-359" name="__codelineno-0-359"></a><span class="sd">            info: A string describing the type of variable in question (parsed or prepared).</span>
+</span><span id="__span-0-360"><a id="__codelineno-0-360" name="__codelineno-0-360"></a>
+</span><span id="__span-0-361"><a id="__codelineno-0-361" name="__codelineno-0-361"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-362"><a id="__codelineno-0-362" name="__codelineno-0-362"></a><span class="sd">            The tag of the parsed or prepared variable.</span>
+</span><span id="__span-0-363"><a id="__codelineno-0-363" name="__codelineno-0-363"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-364"><a id="__codelineno-0-364" name="__codelineno-0-364"></a>
+</span><span id="__span-0-365"><a id="__codelineno-0-365" name="__codelineno-0-365"></a>        <span class="k">if</span> <span class="n">name_or_tag</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-366"><a id="__codelineno-0-366" name="__codelineno-0-366"></a>            <span class="k">return</span> <span class="kc">None</span>
+</span><span id="__span-0-367"><a id="__codelineno-0-367" name="__codelineno-0-367"></a>
+</span><span id="__span-0-368"><a id="__codelineno-0-368" name="__codelineno-0-368"></a>        <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_columns</span><span class="p">(</span><span class="n">df</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">])</span>
+</span><span id="__span-0-369"><a id="__codelineno-0-369" name="__codelineno-0-369"></a>        <span class="n">name_or_tag</span> <span class="o">=</span> <span class="n">name_or_tag</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
+</span><span id="__span-0-370"><a id="__codelineno-0-370" name="__codelineno-0-370"></a>        <span class="k">if</span> <span class="n">name_or_tag</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">:</span>
+</span><span id="__span-0-371"><a id="__codelineno-0-371" name="__codelineno-0-371"></a>            <span class="k">return</span> <span class="n">name_or_tag</span>
+</span><span id="__span-0-372"><a id="__codelineno-0-372" name="__codelineno-0-372"></a>        <span class="k">elif</span> <span class="n">name_or_tag</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">:</span>
+</span><span id="__span-0-373"><a id="__codelineno-0-373" name="__codelineno-0-373"></a>            <span class="k">return</span> <span class="n">df</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">name_or_tag</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-374"><a id="__codelineno-0-374" name="__codelineno-0-374"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-375"><a id="__codelineno-0-375" name="__codelineno-0-375"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+</span><span id="__span-0-376"><a id="__codelineno-0-376" name="__codelineno-0-376"></a>                <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name_or_tag</span><span class="si">}</span><span class="s2"> is not the name or tag of a </span><span class="si">{</span><span class="n">info</span><span class="si">}</span><span class="s2"> variable.&quot;</span>
+</span><span id="__span-0-377"><a id="__codelineno-0-377" name="__codelineno-0-377"></a>            <span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
               </details>
 
@@ -2451,8 +2451,7 @@ <h3 id="logos.tag_utils.TagUtils.check_columns" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/tag_utils.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-30">30</a></span>
-<span class="normal"><a href="#__codelineno-0-31">31</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-31">31</a></span>
 <span class="normal"><a href="#__codelineno-0-32">32</a></span>
 <span class="normal"><a href="#__codelineno-0-33">33</a></span>
 <span class="normal"><a href="#__codelineno-0-34">34</a></span>
@@ -2464,20 +2463,21 @@ <h3 id="logos.tag_utils.TagUtils.check_columns" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-40">40</a></span>
 <span class="normal"><a href="#__codelineno-0-41">41</a></span>
 <span class="normal"><a href="#__codelineno-0-42">42</a></span>
-<span class="normal"><a href="#__codelineno-0-43">43</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-30"><a id="__codelineno-0-30" name="__codelineno-0-30"></a><span class="nd">@staticmethod</span>
-</span><span id="__span-0-31"><a id="__codelineno-0-31" name="__codelineno-0-31"></a><span class="k">def</span> <span class="nf">check_columns</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">columns</span><span class="p">:</span> <span class="nb">list</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-32"><a id="__codelineno-0-32" name="__codelineno-0-32"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-33"><a id="__codelineno-0-33" name="__codelineno-0-33"></a><span class="sd">    Check that the specified columns exist in the dataframe.</span>
-</span><span id="__span-0-34"><a id="__codelineno-0-34" name="__codelineno-0-34"></a>
-</span><span id="__span-0-35"><a id="__codelineno-0-35" name="__codelineno-0-35"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-36"><a id="__codelineno-0-36" name="__codelineno-0-36"></a><span class="sd">        df: The dataframe to be checked.</span>
-</span><span id="__span-0-37"><a id="__codelineno-0-37" name="__codelineno-0-37"></a><span class="sd">        columns: The columns to be checked.</span>
-</span><span id="__span-0-38"><a id="__codelineno-0-38" name="__codelineno-0-38"></a>
-</span><span id="__span-0-39"><a id="__codelineno-0-39" name="__codelineno-0-39"></a><span class="sd">    Raises:</span>
-</span><span id="__span-0-40"><a id="__codelineno-0-40" name="__codelineno-0-40"></a><span class="sd">        ValueError: If any of the columns are not present in the dataframe.</span>
-</span><span id="__span-0-41"><a id="__codelineno-0-41" name="__codelineno-0-41"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-42"><a id="__codelineno-0-42" name="__codelineno-0-42"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="nb">set</span><span class="p">(</span><span class="n">columns</span><span class="p">)</span><span class="o">.</span><span class="n">issubset</span><span class="p">(</span><span class="nb">set</span><span class="p">(</span><span class="n">df</span><span class="o">.</span><span class="n">columns</span><span class="p">)):</span>
-</span><span id="__span-0-43"><a id="__codelineno-0-43" name="__codelineno-0-43"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Columns </span><span class="si">{</span><span class="n">columns</span><span class="si">}</span><span class="s2"> are not all present in the dataframe.&quot;</span><span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-43">43</a></span>
+<span class="normal"><a href="#__codelineno-0-44">44</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-31"><a id="__codelineno-0-31" name="__codelineno-0-31"></a><span class="nd">@staticmethod</span>
+</span><span id="__span-0-32"><a id="__codelineno-0-32" name="__codelineno-0-32"></a><span class="k">def</span> <span class="nf">check_columns</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">columns</span><span class="p">:</span> <span class="nb">list</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-33"><a id="__codelineno-0-33" name="__codelineno-0-33"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-34"><a id="__codelineno-0-34" name="__codelineno-0-34"></a><span class="sd">    Check that the specified columns exist in the dataframe.</span>
+</span><span id="__span-0-35"><a id="__codelineno-0-35" name="__codelineno-0-35"></a>
+</span><span id="__span-0-36"><a id="__codelineno-0-36" name="__codelineno-0-36"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-37"><a id="__codelineno-0-37" name="__codelineno-0-37"></a><span class="sd">        df: The dataframe to be checked.</span>
+</span><span id="__span-0-38"><a id="__codelineno-0-38" name="__codelineno-0-38"></a><span class="sd">        columns: The columns to be checked.</span>
+</span><span id="__span-0-39"><a id="__codelineno-0-39" name="__codelineno-0-39"></a>
+</span><span id="__span-0-40"><a id="__codelineno-0-40" name="__codelineno-0-40"></a><span class="sd">    Raises:</span>
+</span><span id="__span-0-41"><a id="__codelineno-0-41" name="__codelineno-0-41"></a><span class="sd">        ValueError: If any of the columns are not present in the dataframe.</span>
+</span><span id="__span-0-42"><a id="__codelineno-0-42" name="__codelineno-0-42"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-43"><a id="__codelineno-0-43" name="__codelineno-0-43"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="nb">set</span><span class="p">(</span><span class="n">columns</span><span class="p">)</span><span class="o">.</span><span class="n">issubset</span><span class="p">(</span><span class="nb">set</span><span class="p">(</span><span class="n">df</span><span class="o">.</span><span class="n">columns</span><span class="p">)):</span>
+</span><span id="__span-0-44"><a id="__codelineno-0-44" name="__codelineno-0-44"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Columns </span><span class="si">{</span><span class="n">columns</span><span class="si">}</span><span class="s2"> are not all present in the dataframe.&quot;</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -2569,8 +2569,7 @@ <h3 id="logos.tag_utils.TagUtils.check_fields" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/tag_utils.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-45">45</a></span>
-<span class="normal"><a href="#__codelineno-0-46">46</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-46">46</a></span>
 <span class="normal"><a href="#__codelineno-0-47">47</a></span>
 <span class="normal"><a href="#__codelineno-0-48">48</a></span>
 <span class="normal"><a href="#__codelineno-0-49">49</a></span>
@@ -2582,20 +2581,21 @@ <h3 id="logos.tag_utils.TagUtils.check_fields" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-55">55</a></span>
 <span class="normal"><a href="#__codelineno-0-56">56</a></span>
 <span class="normal"><a href="#__codelineno-0-57">57</a></span>
-<span class="normal"><a href="#__codelineno-0-58">58</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-45"><a id="__codelineno-0-45" name="__codelineno-0-45"></a><span class="nd">@staticmethod</span>
-</span><span id="__span-0-46"><a id="__codelineno-0-46" name="__codelineno-0-46"></a><span class="k">def</span> <span class="nf">check_fields</span><span class="p">(</span><span class="n">series</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">,</span> <span class="n">fields</span><span class="p">:</span> <span class="nb">list</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-47"><a id="__codelineno-0-47" name="__codelineno-0-47"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-48"><a id="__codelineno-0-48" name="__codelineno-0-48"></a><span class="sd">    Check that the specified fields exist in the specified series.</span>
-</span><span id="__span-0-49"><a id="__codelineno-0-49" name="__codelineno-0-49"></a>
-</span><span id="__span-0-50"><a id="__codelineno-0-50" name="__codelineno-0-50"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-51"><a id="__codelineno-0-51" name="__codelineno-0-51"></a><span class="sd">        series: The series to be checked.</span>
-</span><span id="__span-0-52"><a id="__codelineno-0-52" name="__codelineno-0-52"></a><span class="sd">        fields: The fields to be checked.</span>
-</span><span id="__span-0-53"><a id="__codelineno-0-53" name="__codelineno-0-53"></a>
-</span><span id="__span-0-54"><a id="__codelineno-0-54" name="__codelineno-0-54"></a><span class="sd">    Raises:</span>
-</span><span id="__span-0-55"><a id="__codelineno-0-55" name="__codelineno-0-55"></a><span class="sd">        ValueError: If any of the fields are not present in the series.</span>
-</span><span id="__span-0-56"><a id="__codelineno-0-56" name="__codelineno-0-56"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-57"><a id="__codelineno-0-57" name="__codelineno-0-57"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="nb">set</span><span class="p">(</span><span class="n">fields</span><span class="p">)</span><span class="o">.</span><span class="n">issubset</span><span class="p">(</span><span class="nb">set</span><span class="p">(</span><span class="n">series</span><span class="o">.</span><span class="n">index</span><span class="p">)):</span>
-</span><span id="__span-0-58"><a id="__codelineno-0-58" name="__codelineno-0-58"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Fields </span><span class="si">{</span><span class="n">fields</span><span class="si">}</span><span class="s2"> are not all present in the series.&quot;</span><span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-58">58</a></span>
+<span class="normal"><a href="#__codelineno-0-59">59</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-46"><a id="__codelineno-0-46" name="__codelineno-0-46"></a><span class="nd">@staticmethod</span>
+</span><span id="__span-0-47"><a id="__codelineno-0-47" name="__codelineno-0-47"></a><span class="k">def</span> <span class="nf">check_fields</span><span class="p">(</span><span class="n">series</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">,</span> <span class="n">fields</span><span class="p">:</span> <span class="nb">list</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-48"><a id="__codelineno-0-48" name="__codelineno-0-48"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-49"><a id="__codelineno-0-49" name="__codelineno-0-49"></a><span class="sd">    Check that the specified fields exist in the specified series.</span>
+</span><span id="__span-0-50"><a id="__codelineno-0-50" name="__codelineno-0-50"></a>
+</span><span id="__span-0-51"><a id="__codelineno-0-51" name="__codelineno-0-51"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-52"><a id="__codelineno-0-52" name="__codelineno-0-52"></a><span class="sd">        series: The series to be checked.</span>
+</span><span id="__span-0-53"><a id="__codelineno-0-53" name="__codelineno-0-53"></a><span class="sd">        fields: The fields to be checked.</span>
+</span><span id="__span-0-54"><a id="__codelineno-0-54" name="__codelineno-0-54"></a>
+</span><span id="__span-0-55"><a id="__codelineno-0-55" name="__codelineno-0-55"></a><span class="sd">    Raises:</span>
+</span><span id="__span-0-56"><a id="__codelineno-0-56" name="__codelineno-0-56"></a><span class="sd">        ValueError: If any of the fields are not present in the series.</span>
+</span><span id="__span-0-57"><a id="__codelineno-0-57" name="__codelineno-0-57"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-58"><a id="__codelineno-0-58" name="__codelineno-0-58"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="nb">set</span><span class="p">(</span><span class="n">fields</span><span class="p">)</span><span class="o">.</span><span class="n">issubset</span><span class="p">(</span><span class="nb">set</span><span class="p">(</span><span class="n">series</span><span class="o">.</span><span class="n">index</span><span class="p">)):</span>
+</span><span id="__span-0-59"><a id="__codelineno-0-59" name="__codelineno-0-59"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Fields </span><span class="si">{</span><span class="n">fields</span><span class="si">}</span><span class="s2"> are not all present in the series.&quot;</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -2727,8 +2727,7 @@ <h3 id="logos.tag_utils.TagUtils.best_effort_tag" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/tag_utils.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-60">60</a></span>
-<span class="normal"><a href="#__codelineno-0-61">61</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-61">61</a></span>
 <span class="normal"><a href="#__codelineno-0-62">62</a></span>
 <span class="normal"><a href="#__codelineno-0-63">63</a></span>
 <span class="normal"><a href="#__codelineno-0-64">64</a></span>
@@ -2755,35 +2754,36 @@ <h3 id="logos.tag_utils.TagUtils.best_effort_tag" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-85">85</a></span>
 <span class="normal"><a href="#__codelineno-0-86">86</a></span>
 <span class="normal"><a href="#__codelineno-0-87">87</a></span>
-<span class="normal"><a href="#__codelineno-0-88">88</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-60"><a id="__codelineno-0-60" name="__codelineno-0-60"></a><span class="nd">@staticmethod</span>
-</span><span id="__span-0-61"><a id="__codelineno-0-61" name="__codelineno-0-61"></a><span class="k">def</span> <span class="nf">best_effort_tag</span><span class="p">(</span>
-</span><span id="__span-0-62"><a id="__codelineno-0-62" name="__codelineno-0-62"></a>    <span class="n">templates_df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span>
-</span><span id="__span-0-63"><a id="__codelineno-0-63" name="__codelineno-0-63"></a>    <span class="n">variable_row</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">,</span>
-</span><span id="__span-0-64"><a id="__codelineno-0-64" name="__codelineno-0-64"></a>    <span class="n">enable_gpt_tagging</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
-</span><span id="__span-0-65"><a id="__codelineno-0-65" name="__codelineno-0-65"></a>    <span class="n">gpt_model</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="__span-0-66"><a id="__codelineno-0-66" name="__codelineno-0-66"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">bool</span><span class="p">]:</span>
-</span><span id="__span-0-67"><a id="__codelineno-0-67" name="__codelineno-0-67"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-68"><a id="__codelineno-0-68" name="__codelineno-0-68"></a><span class="sd">    Apply `gpt_tag` to `variable_row`, if possible, and return the result. If there is</span>
-</span><span id="__span-0-69"><a id="__codelineno-0-69" name="__codelineno-0-69"></a><span class="sd">    no environment variable called OPENAI_API_KEY, or if `enable_gpt_tagging` is False,</span>
-</span><span id="__span-0-70"><a id="__codelineno-0-70" name="__codelineno-0-70"></a><span class="sd">    apply `preceding_tokens_tag` instead.</span>
-</span><span id="__span-0-71"><a id="__codelineno-0-71" name="__codelineno-0-71"></a>
-</span><span id="__span-0-72"><a id="__codelineno-0-72" name="__codelineno-0-72"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-73"><a id="__codelineno-0-73" name="__codelineno-0-73"></a><span class="sd">        templates_df: The dataframe containing information about the log templates.</span>
-</span><span id="__span-0-74"><a id="__codelineno-0-74" name="__codelineno-0-74"></a><span class="sd">        variable_row: The row of the dataframe containing information about the parsed variable.</span>
-</span><span id="__span-0-75"><a id="__codelineno-0-75" name="__codelineno-0-75"></a><span class="sd">        enable_gpt_tagging: A boolean indicating whether GPT-3.5 tagging should be enabled.</span>
-</span><span id="__span-0-76"><a id="__codelineno-0-76" name="__codelineno-0-76"></a><span class="sd">        gpt_model: The GPT model to use.</span>
-</span><span id="__span-0-77"><a id="__codelineno-0-77" name="__codelineno-0-77"></a>
-</span><span id="__span-0-78"><a id="__codelineno-0-78" name="__codelineno-0-78"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-79"><a id="__codelineno-0-79" name="__codelineno-0-79"></a><span class="sd">        A tuple containing (i) the GPT-3.5 tag for the parsed variable name, if possible, or the</span>
-</span><span id="__span-0-80"><a id="__codelineno-0-80" name="__codelineno-0-80"></a><span class="sd">        best-effort tag otherwise, and (ii) a boolean indicating whether the GPT-3.5 tag was used.</span>
-</span><span id="__span-0-81"><a id="__codelineno-0-81" name="__codelineno-0-81"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-82"><a id="__codelineno-0-82" name="__codelineno-0-82"></a>    <span class="k">if</span> <span class="n">enable_gpt_tagging</span><span class="p">:</span>
-</span><span id="__span-0-83"><a id="__codelineno-0-83" name="__codelineno-0-83"></a>        <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-84"><a id="__codelineno-0-84" name="__codelineno-0-84"></a>            <span class="k">return</span> <span class="p">(</span><span class="n">TagUtils</span><span class="o">.</span><span class="n">gpt_tag</span><span class="p">(</span><span class="n">templates_df</span><span class="p">,</span> <span class="n">variable_row</span><span class="p">,</span> <span class="n">gpt_model</span><span class="p">),</span> <span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-85"><a id="__codelineno-0-85" name="__codelineno-0-85"></a>        <span class="k">except</span><span class="p">:</span>
-</span><span id="__span-0-86"><a id="__codelineno-0-86" name="__codelineno-0-86"></a>            <span class="k">return</span> <span class="p">(</span><span class="n">TagUtils</span><span class="o">.</span><span class="n">preceding_tokens_tag</span><span class="p">(</span><span class="n">variable_row</span><span class="p">),</span> <span class="kc">False</span><span class="p">)</span>
-</span><span id="__span-0-87"><a id="__codelineno-0-87" name="__codelineno-0-87"></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-88"><a id="__codelineno-0-88" name="__codelineno-0-88"></a>        <span class="k">return</span> <span class="p">(</span><span class="n">TagUtils</span><span class="o">.</span><span class="n">preceding_tokens_tag</span><span class="p">(</span><span class="n">variable_row</span><span class="p">),</span> <span class="kc">False</span><span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-88">88</a></span>
+<span class="normal"><a href="#__codelineno-0-89">89</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-61"><a id="__codelineno-0-61" name="__codelineno-0-61"></a><span class="nd">@staticmethod</span>
+</span><span id="__span-0-62"><a id="__codelineno-0-62" name="__codelineno-0-62"></a><span class="k">def</span> <span class="nf">best_effort_tag</span><span class="p">(</span>
+</span><span id="__span-0-63"><a id="__codelineno-0-63" name="__codelineno-0-63"></a>    <span class="n">templates_df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span>
+</span><span id="__span-0-64"><a id="__codelineno-0-64" name="__codelineno-0-64"></a>    <span class="n">variable_row</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">,</span>
+</span><span id="__span-0-65"><a id="__codelineno-0-65" name="__codelineno-0-65"></a>    <span class="n">enable_gpt_tagging</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
+</span><span id="__span-0-66"><a id="__codelineno-0-66" name="__codelineno-0-66"></a>    <span class="n">gpt_model</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-67"><a id="__codelineno-0-67" name="__codelineno-0-67"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">bool</span><span class="p">]:</span>
+</span><span id="__span-0-68"><a id="__codelineno-0-68" name="__codelineno-0-68"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-69"><a id="__codelineno-0-69" name="__codelineno-0-69"></a><span class="sd">    Apply `gpt_tag` to `variable_row`, if possible, and return the result. If there is</span>
+</span><span id="__span-0-70"><a id="__codelineno-0-70" name="__codelineno-0-70"></a><span class="sd">    no environment variable called OPENAI_API_KEY, or if `enable_gpt_tagging` is False,</span>
+</span><span id="__span-0-71"><a id="__codelineno-0-71" name="__codelineno-0-71"></a><span class="sd">    apply `preceding_tokens_tag` instead.</span>
+</span><span id="__span-0-72"><a id="__codelineno-0-72" name="__codelineno-0-72"></a>
+</span><span id="__span-0-73"><a id="__codelineno-0-73" name="__codelineno-0-73"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-74"><a id="__codelineno-0-74" name="__codelineno-0-74"></a><span class="sd">        templates_df: The dataframe containing information about the log templates.</span>
+</span><span id="__span-0-75"><a id="__codelineno-0-75" name="__codelineno-0-75"></a><span class="sd">        variable_row: The row of the dataframe containing information about the parsed variable.</span>
+</span><span id="__span-0-76"><a id="__codelineno-0-76" name="__codelineno-0-76"></a><span class="sd">        enable_gpt_tagging: A boolean indicating whether GPT-3.5 tagging should be enabled.</span>
+</span><span id="__span-0-77"><a id="__codelineno-0-77" name="__codelineno-0-77"></a><span class="sd">        gpt_model: The GPT model to use.</span>
+</span><span id="__span-0-78"><a id="__codelineno-0-78" name="__codelineno-0-78"></a>
+</span><span id="__span-0-79"><a id="__codelineno-0-79" name="__codelineno-0-79"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-80"><a id="__codelineno-0-80" name="__codelineno-0-80"></a><span class="sd">        A tuple containing (i) the GPT-3.5 tag for the parsed variable name, if possible, or the</span>
+</span><span id="__span-0-81"><a id="__codelineno-0-81" name="__codelineno-0-81"></a><span class="sd">        best-effort tag otherwise, and (ii) a boolean indicating whether the GPT-3.5 tag was used.</span>
+</span><span id="__span-0-82"><a id="__codelineno-0-82" name="__codelineno-0-82"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-83"><a id="__codelineno-0-83" name="__codelineno-0-83"></a>    <span class="k">if</span> <span class="n">enable_gpt_tagging</span><span class="p">:</span>
+</span><span id="__span-0-84"><a id="__codelineno-0-84" name="__codelineno-0-84"></a>        <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-85"><a id="__codelineno-0-85" name="__codelineno-0-85"></a>            <span class="k">return</span> <span class="p">(</span><span class="n">TagUtils</span><span class="o">.</span><span class="n">gpt_tag</span><span class="p">(</span><span class="n">templates_df</span><span class="p">,</span> <span class="n">variable_row</span><span class="p">,</span> <span class="n">gpt_model</span><span class="p">),</span> <span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-86"><a id="__codelineno-0-86" name="__codelineno-0-86"></a>        <span class="k">except</span><span class="p">:</span>
+</span><span id="__span-0-87"><a id="__codelineno-0-87" name="__codelineno-0-87"></a>            <span class="k">return</span> <span class="p">(</span><span class="n">TagUtils</span><span class="o">.</span><span class="n">preceding_tokens_tag</span><span class="p">(</span><span class="n">variable_row</span><span class="p">),</span> <span class="kc">False</span><span class="p">)</span>
+</span><span id="__span-0-88"><a id="__codelineno-0-88" name="__codelineno-0-88"></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-89"><a id="__codelineno-0-89" name="__codelineno-0-89"></a>        <span class="k">return</span> <span class="p">(</span><span class="n">TagUtils</span><span class="o">.</span><span class="n">preceding_tokens_tag</span><span class="p">(</span><span class="n">variable_row</span><span class="p">),</span> <span class="kc">False</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -2892,8 +2892,7 @@ <h3 id="logos.tag_utils.TagUtils.waterfall_tag" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/tag_utils.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-90"> 90</a></span>
-<span class="normal"><a href="#__codelineno-0-91"> 91</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-91"> 91</a></span>
 <span class="normal"><a href="#__codelineno-0-92"> 92</a></span>
 <span class="normal"><a href="#__codelineno-0-93"> 93</a></span>
 <span class="normal"><a href="#__codelineno-0-94"> 94</a></span>
@@ -2941,56 +2940,57 @@ <h3 id="logos.tag_utils.TagUtils.waterfall_tag" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-136">136</a></span>
 <span class="normal"><a href="#__codelineno-0-137">137</a></span>
 <span class="normal"><a href="#__codelineno-0-138">138</a></span>
-<span class="normal"><a href="#__codelineno-0-139">139</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-90"><a id="__codelineno-0-90" name="__codelineno-0-90"></a><span class="nd">@staticmethod</span>
-</span><span id="__span-0-91"><a id="__codelineno-0-91" name="__codelineno-0-91"></a><span class="k">def</span> <span class="nf">waterfall_tag</span><span class="p">(</span>
-</span><span id="__span-0-92"><a id="__codelineno-0-92" name="__codelineno-0-92"></a>    <span class="n">templates_df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span>
-</span><span id="__span-0-93"><a id="__codelineno-0-93" name="__codelineno-0-93"></a>    <span class="n">variable_row</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">,</span>
-</span><span id="__span-0-94"><a id="__codelineno-0-94" name="__codelineno-0-94"></a>    <span class="n">banned_values</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-95"><a id="__codelineno-0-95" name="__codelineno-0-95"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="p">]:</span>
-</span><span id="__span-0-96"><a id="__codelineno-0-96" name="__codelineno-0-96"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-97"><a id="__codelineno-0-97" name="__codelineno-0-97"></a><span class="sd">    Apply each of the tagging methods in turn, in order of increasing cost, until a tag is found</span>
-</span><span id="__span-0-98"><a id="__codelineno-0-98" name="__codelineno-0-98"></a><span class="sd">    that is not included in the banned values. In partidular, apply `preceding_tokens_tag` first,</span>
-</span><span id="__span-0-99"><a id="__codelineno-0-99" name="__codelineno-0-99"></a><span class="sd">    then `gpt_tag` with the GPT-3.5 model, and finally `gpt_tag` with the GPT-4 model. If none of</span>
-</span><span id="__span-0-100"><a id="__codelineno-0-100" name="__codelineno-0-100"></a><span class="sd">    these methods succeeds, return the name of the variable as the tag.</span>
-</span><span id="__span-0-101"><a id="__codelineno-0-101" name="__codelineno-0-101"></a>
-</span><span id="__span-0-102"><a id="__codelineno-0-102" name="__codelineno-0-102"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-103"><a id="__codelineno-0-103" name="__codelineno-0-103"></a><span class="sd">        templates_df: The dataframe containing information about the log templates.</span>
-</span><span id="__span-0-104"><a id="__codelineno-0-104" name="__codelineno-0-104"></a><span class="sd">        variable_row: The row of the dataframe containing information about the parsed variable.</span>
-</span><span id="__span-0-105"><a id="__codelineno-0-105" name="__codelineno-0-105"></a><span class="sd">        banned_values: A list of values that should not be used as tags.</span>
-</span><span id="__span-0-106"><a id="__codelineno-0-106" name="__codelineno-0-106"></a>
-</span><span id="__span-0-107"><a id="__codelineno-0-107" name="__codelineno-0-107"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-108"><a id="__codelineno-0-108" name="__codelineno-0-108"></a><span class="sd">        A tuple containing (i) the tag for the parsed variable, and (ii) the origin of the tag.</span>
-</span><span id="__span-0-109"><a id="__codelineno-0-109" name="__codelineno-0-109"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-110"><a id="__codelineno-0-110" name="__codelineno-0-110"></a>    <span class="n">name</span> <span class="o">=</span> <span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span>
-</span><span id="__span-0-111"><a id="__codelineno-0-111" name="__codelineno-0-111"></a>    <span class="k">if</span> <span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]:</span>
-</span><span id="__span-0-112"><a id="__codelineno-0-112" name="__codelineno-0-112"></a>        <span class="k">return</span> <span class="p">(</span><span class="n">name</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">REGEX_VARIABLE</span><span class="p">)</span>
-</span><span id="__span-0-113"><a id="__codelineno-0-113" name="__codelineno-0-113"></a>
-</span><span id="__span-0-114"><a id="__codelineno-0-114" name="__codelineno-0-114"></a>    <span class="c1"># Try to derive a tag from the preceding tokens in the corresponding template</span>
-</span><span id="__span-0-115"><a id="__codelineno-0-115" name="__codelineno-0-115"></a>    <span class="n">tag</span><span class="p">,</span> <span class="n">origin</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">preceding_tokens_tag</span><span class="p">(</span><span class="n">variable_row</span><span class="p">,</span> <span class="n">banned_values</span><span class="p">)</span>
-</span><span id="__span-0-116"><a id="__codelineno-0-116" name="__codelineno-0-116"></a>    <span class="k">if</span> <span class="n">tag</span> <span class="o">!=</span> <span class="n">name</span><span class="p">:</span>
-</span><span id="__span-0-117"><a id="__codelineno-0-117" name="__codelineno-0-117"></a>        <span class="k">return</span> <span class="p">(</span><span class="n">tag</span><span class="p">,</span> <span class="n">origin</span><span class="p">)</span>
-</span><span id="__span-0-118"><a id="__codelineno-0-118" name="__codelineno-0-118"></a>
-</span><span id="__span-0-119"><a id="__codelineno-0-119" name="__codelineno-0-119"></a>    <span class="c1"># Try to derive a tag using GPT-3.5</span>
-</span><span id="__span-0-120"><a id="__codelineno-0-120" name="__codelineno-0-120"></a>    <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-121"><a id="__codelineno-0-121" name="__codelineno-0-121"></a>        <span class="n">tag</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">gpt_tag</span><span class="p">(</span>
-</span><span id="__span-0-122"><a id="__codelineno-0-122" name="__codelineno-0-122"></a>            <span class="n">templates_df</span><span class="p">,</span> <span class="n">variable_row</span><span class="p">,</span> <span class="s2">&quot;gpt-3.5-turbo&quot;</span><span class="p">,</span> <span class="n">banned_values</span>
-</span><span id="__span-0-123"><a id="__codelineno-0-123" name="__codelineno-0-123"></a>        <span class="p">)</span>
-</span><span id="__span-0-124"><a id="__codelineno-0-124" name="__codelineno-0-124"></a>        <span class="k">if</span> <span class="n">tag</span> <span class="o">!=</span> <span class="n">name</span><span class="p">:</span>
-</span><span id="__span-0-125"><a id="__codelineno-0-125" name="__codelineno-0-125"></a>            <span class="k">return</span> <span class="p">(</span><span class="n">tag</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">GPT_3POINT5_TURBO</span><span class="p">)</span>
-</span><span id="__span-0-126"><a id="__codelineno-0-126" name="__codelineno-0-126"></a>    <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
-</span><span id="__span-0-127"><a id="__codelineno-0-127" name="__codelineno-0-127"></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Exception </span><span class="si">{</span><span class="n">e</span><span class="si">}</span><span class="s2"> came up while tagging </span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> with GPT-3.5.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-128"><a id="__codelineno-0-128" name="__codelineno-0-128"></a>        <span class="k">pass</span>
-</span><span id="__span-0-129"><a id="__codelineno-0-129" name="__codelineno-0-129"></a>
-</span><span id="__span-0-130"><a id="__codelineno-0-130" name="__codelineno-0-130"></a>    <span class="c1"># Try to derive a tag using GPT-4</span>
-</span><span id="__span-0-131"><a id="__codelineno-0-131" name="__codelineno-0-131"></a>    <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-132"><a id="__codelineno-0-132" name="__codelineno-0-132"></a>        <span class="n">tag</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">gpt_tag</span><span class="p">(</span><span class="n">templates_df</span><span class="p">,</span> <span class="n">variable_row</span><span class="p">,</span> <span class="s2">&quot;gpt-4&quot;</span><span class="p">,</span> <span class="n">banned_values</span><span class="p">)</span>
-</span><span id="__span-0-133"><a id="__codelineno-0-133" name="__codelineno-0-133"></a>        <span class="k">if</span> <span class="n">tag</span> <span class="o">!=</span> <span class="n">name</span><span class="p">:</span>
-</span><span id="__span-0-134"><a id="__codelineno-0-134" name="__codelineno-0-134"></a>            <span class="k">return</span> <span class="p">(</span><span class="n">tag</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">GPT_4</span><span class="p">)</span>
-</span><span id="__span-0-135"><a id="__codelineno-0-135" name="__codelineno-0-135"></a>    <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
-</span><span id="__span-0-136"><a id="__codelineno-0-136" name="__codelineno-0-136"></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Exception </span><span class="si">{</span><span class="n">e</span><span class="si">}</span><span class="s2"> came up while tagging </span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> with GPT-4.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-137"><a id="__codelineno-0-137" name="__codelineno-0-137"></a>        <span class="k">pass</span>
-</span><span id="__span-0-138"><a id="__codelineno-0-138" name="__codelineno-0-138"></a>
-</span><span id="__span-0-139"><a id="__codelineno-0-139" name="__codelineno-0-139"></a>    <span class="k">return</span> <span class="p">(</span><span class="n">name</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">NAME</span><span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-139">139</a></span>
+<span class="normal"><a href="#__codelineno-0-140">140</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-91"><a id="__codelineno-0-91" name="__codelineno-0-91"></a><span class="nd">@staticmethod</span>
+</span><span id="__span-0-92"><a id="__codelineno-0-92" name="__codelineno-0-92"></a><span class="k">def</span> <span class="nf">waterfall_tag</span><span class="p">(</span>
+</span><span id="__span-0-93"><a id="__codelineno-0-93" name="__codelineno-0-93"></a>    <span class="n">templates_df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span>
+</span><span id="__span-0-94"><a id="__codelineno-0-94" name="__codelineno-0-94"></a>    <span class="n">variable_row</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">,</span>
+</span><span id="__span-0-95"><a id="__codelineno-0-95" name="__codelineno-0-95"></a>    <span class="n">banned_values</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-96"><a id="__codelineno-0-96" name="__codelineno-0-96"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="p">]:</span>
+</span><span id="__span-0-97"><a id="__codelineno-0-97" name="__codelineno-0-97"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-98"><a id="__codelineno-0-98" name="__codelineno-0-98"></a><span class="sd">    Apply each of the tagging methods in turn, in order of increasing cost, until a tag is found</span>
+</span><span id="__span-0-99"><a id="__codelineno-0-99" name="__codelineno-0-99"></a><span class="sd">    that is not included in the banned values. In partidular, apply `preceding_tokens_tag` first,</span>
+</span><span id="__span-0-100"><a id="__codelineno-0-100" name="__codelineno-0-100"></a><span class="sd">    then `gpt_tag` with the GPT-3.5 model, and finally `gpt_tag` with the GPT-4 model. If none of</span>
+</span><span id="__span-0-101"><a id="__codelineno-0-101" name="__codelineno-0-101"></a><span class="sd">    these methods succeeds, return the name of the variable as the tag.</span>
+</span><span id="__span-0-102"><a id="__codelineno-0-102" name="__codelineno-0-102"></a>
+</span><span id="__span-0-103"><a id="__codelineno-0-103" name="__codelineno-0-103"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-104"><a id="__codelineno-0-104" name="__codelineno-0-104"></a><span class="sd">        templates_df: The dataframe containing information about the log templates.</span>
+</span><span id="__span-0-105"><a id="__codelineno-0-105" name="__codelineno-0-105"></a><span class="sd">        variable_row: The row of the dataframe containing information about the parsed variable.</span>
+</span><span id="__span-0-106"><a id="__codelineno-0-106" name="__codelineno-0-106"></a><span class="sd">        banned_values: A list of values that should not be used as tags.</span>
+</span><span id="__span-0-107"><a id="__codelineno-0-107" name="__codelineno-0-107"></a>
+</span><span id="__span-0-108"><a id="__codelineno-0-108" name="__codelineno-0-108"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-109"><a id="__codelineno-0-109" name="__codelineno-0-109"></a><span class="sd">        A tuple containing (i) the tag for the parsed variable, and (ii) the origin of the tag.</span>
+</span><span id="__span-0-110"><a id="__codelineno-0-110" name="__codelineno-0-110"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-111"><a id="__codelineno-0-111" name="__codelineno-0-111"></a>    <span class="n">name</span> <span class="o">=</span> <span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span>
+</span><span id="__span-0-112"><a id="__codelineno-0-112" name="__codelineno-0-112"></a>    <span class="k">if</span> <span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]:</span>
+</span><span id="__span-0-113"><a id="__codelineno-0-113" name="__codelineno-0-113"></a>        <span class="k">return</span> <span class="p">(</span><span class="n">name</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">REGEX_VARIABLE</span><span class="p">)</span>
+</span><span id="__span-0-114"><a id="__codelineno-0-114" name="__codelineno-0-114"></a>
+</span><span id="__span-0-115"><a id="__codelineno-0-115" name="__codelineno-0-115"></a>    <span class="c1"># Try to derive a tag from the preceding tokens in the corresponding template</span>
+</span><span id="__span-0-116"><a id="__codelineno-0-116" name="__codelineno-0-116"></a>    <span class="n">tag</span><span class="p">,</span> <span class="n">origin</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">preceding_tokens_tag</span><span class="p">(</span><span class="n">variable_row</span><span class="p">,</span> <span class="n">banned_values</span><span class="p">)</span>
+</span><span id="__span-0-117"><a id="__codelineno-0-117" name="__codelineno-0-117"></a>    <span class="k">if</span> <span class="n">tag</span> <span class="o">!=</span> <span class="n">name</span><span class="p">:</span>
+</span><span id="__span-0-118"><a id="__codelineno-0-118" name="__codelineno-0-118"></a>        <span class="k">return</span> <span class="p">(</span><span class="n">tag</span><span class="p">,</span> <span class="n">origin</span><span class="p">)</span>
+</span><span id="__span-0-119"><a id="__codelineno-0-119" name="__codelineno-0-119"></a>
+</span><span id="__span-0-120"><a id="__codelineno-0-120" name="__codelineno-0-120"></a>    <span class="c1"># Try to derive a tag using GPT-3.5</span>
+</span><span id="__span-0-121"><a id="__codelineno-0-121" name="__codelineno-0-121"></a>    <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-122"><a id="__codelineno-0-122" name="__codelineno-0-122"></a>        <span class="n">tag</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">gpt_tag</span><span class="p">(</span>
+</span><span id="__span-0-123"><a id="__codelineno-0-123" name="__codelineno-0-123"></a>            <span class="n">templates_df</span><span class="p">,</span> <span class="n">variable_row</span><span class="p">,</span> <span class="s2">&quot;gpt-3.5-turbo&quot;</span><span class="p">,</span> <span class="n">banned_values</span>
+</span><span id="__span-0-124"><a id="__codelineno-0-124" name="__codelineno-0-124"></a>        <span class="p">)</span>
+</span><span id="__span-0-125"><a id="__codelineno-0-125" name="__codelineno-0-125"></a>        <span class="k">if</span> <span class="n">tag</span> <span class="o">!=</span> <span class="n">name</span><span class="p">:</span>
+</span><span id="__span-0-126"><a id="__codelineno-0-126" name="__codelineno-0-126"></a>            <span class="k">return</span> <span class="p">(</span><span class="n">tag</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">GPT_3POINT5_TURBO</span><span class="p">)</span>
+</span><span id="__span-0-127"><a id="__codelineno-0-127" name="__codelineno-0-127"></a>    <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-128"><a id="__codelineno-0-128" name="__codelineno-0-128"></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Exception </span><span class="si">{</span><span class="n">e</span><span class="si">}</span><span class="s2"> came up while tagging </span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> with GPT-3.5.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-129"><a id="__codelineno-0-129" name="__codelineno-0-129"></a>        <span class="k">pass</span>
+</span><span id="__span-0-130"><a id="__codelineno-0-130" name="__codelineno-0-130"></a>
+</span><span id="__span-0-131"><a id="__codelineno-0-131" name="__codelineno-0-131"></a>    <span class="c1"># Try to derive a tag using GPT-4</span>
+</span><span id="__span-0-132"><a id="__codelineno-0-132" name="__codelineno-0-132"></a>    <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-133"><a id="__codelineno-0-133" name="__codelineno-0-133"></a>        <span class="n">tag</span> <span class="o">=</span> <span class="n">TagUtils</span><span class="o">.</span><span class="n">gpt_tag</span><span class="p">(</span><span class="n">templates_df</span><span class="p">,</span> <span class="n">variable_row</span><span class="p">,</span> <span class="s2">&quot;gpt-4&quot;</span><span class="p">,</span> <span class="n">banned_values</span><span class="p">)</span>
+</span><span id="__span-0-134"><a id="__codelineno-0-134" name="__codelineno-0-134"></a>        <span class="k">if</span> <span class="n">tag</span> <span class="o">!=</span> <span class="n">name</span><span class="p">:</span>
+</span><span id="__span-0-135"><a id="__codelineno-0-135" name="__codelineno-0-135"></a>            <span class="k">return</span> <span class="p">(</span><span class="n">tag</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">GPT_4</span><span class="p">)</span>
+</span><span id="__span-0-136"><a id="__codelineno-0-136" name="__codelineno-0-136"></a>    <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-137"><a id="__codelineno-0-137" name="__codelineno-0-137"></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Exception </span><span class="si">{</span><span class="n">e</span><span class="si">}</span><span class="s2"> came up while tagging </span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> with GPT-4.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-138"><a id="__codelineno-0-138" name="__codelineno-0-138"></a>        <span class="k">pass</span>
+</span><span id="__span-0-139"><a id="__codelineno-0-139" name="__codelineno-0-139"></a>
+</span><span id="__span-0-140"><a id="__codelineno-0-140" name="__codelineno-0-140"></a>    <span class="k">return</span> <span class="p">(</span><span class="n">name</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">NAME</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -3082,8 +3082,7 @@ <h3 id="logos.tag_utils.TagUtils.preceding_tokens_tag" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/tag_utils.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-141">141</a></span>
-<span class="normal"><a href="#__codelineno-0-142">142</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-142">142</a></span>
 <span class="normal"><a href="#__codelineno-0-143">143</a></span>
 <span class="normal"><a href="#__codelineno-0-144">144</a></span>
 <span class="normal"><a href="#__codelineno-0-145">145</a></span>
@@ -3121,46 +3120,47 @@ <h3 id="logos.tag_utils.TagUtils.preceding_tokens_tag" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-177">177</a></span>
 <span class="normal"><a href="#__codelineno-0-178">178</a></span>
 <span class="normal"><a href="#__codelineno-0-179">179</a></span>
-<span class="normal"><a href="#__codelineno-0-180">180</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-141"><a id="__codelineno-0-141" name="__codelineno-0-141"></a><span class="nd">@staticmethod</span>
-</span><span id="__span-0-142"><a id="__codelineno-0-142" name="__codelineno-0-142"></a><span class="k">def</span> <span class="nf">preceding_tokens_tag</span><span class="p">(</span>
-</span><span id="__span-0-143"><a id="__codelineno-0-143" name="__codelineno-0-143"></a>    <span class="n">variable_row</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">,</span> <span class="n">banned_values</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-144"><a id="__codelineno-0-144" name="__codelineno-0-144"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="p">]:</span>
-</span><span id="__span-0-145"><a id="__codelineno-0-145" name="__codelineno-0-145"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-146"><a id="__codelineno-0-146" name="__codelineno-0-146"></a><span class="sd">    Try to derive a tag for a parsed variable name based on the preceding tokens in the corresponding template.</span>
-</span><span id="__span-0-147"><a id="__codelineno-0-147" name="__codelineno-0-147"></a>
-</span><span id="__span-0-148"><a id="__codelineno-0-148" name="__codelineno-0-148"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-149"><a id="__codelineno-0-149" name="__codelineno-0-149"></a><span class="sd">        variable_row: The row of the dataframe containing information about the parsed variable.</span>
-</span><span id="__span-0-150"><a id="__codelineno-0-150" name="__codelineno-0-150"></a><span class="sd">        banned_values: A list of values that should not be used as tags.</span>
-</span><span id="__span-0-151"><a id="__codelineno-0-151" name="__codelineno-0-151"></a>
-</span><span id="__span-0-152"><a id="__codelineno-0-152" name="__codelineno-0-152"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-153"><a id="__codelineno-0-153" name="__codelineno-0-153"></a><span class="sd">        A tuple containing (i) the tag for the parsed variable, and (ii) the origin of the tag.</span>
-</span><span id="__span-0-154"><a id="__codelineno-0-154" name="__codelineno-0-154"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-155"><a id="__codelineno-0-155" name="__codelineno-0-155"></a>
-</span><span id="__span-0-156"><a id="__codelineno-0-156" name="__codelineno-0-156"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_fields</span><span class="p">(</span><span class="n">variable_row</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Preceding 3 tokens&quot;</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;From regex&quot;</span><span class="p">])</span>
-</span><span id="__span-0-157"><a id="__codelineno-0-157" name="__codelineno-0-157"></a>    <span class="n">name</span> <span class="o">=</span> <span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span>
-</span><span id="__span-0-158"><a id="__codelineno-0-158" name="__codelineno-0-158"></a>    <span class="k">if</span> <span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]:</span>
-</span><span id="__span-0-159"><a id="__codelineno-0-159" name="__codelineno-0-159"></a>        <span class="k">return</span> <span class="n">name</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">REGEX_VARIABLE</span>
-</span><span id="__span-0-160"><a id="__codelineno-0-160" name="__codelineno-0-160"></a>
-</span><span id="__span-0-161"><a id="__codelineno-0-161" name="__codelineno-0-161"></a>    <span class="n">pr</span> <span class="o">=</span> <span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;Preceding 3 tokens&quot;</span><span class="p">]</span>
-</span><span id="__span-0-162"><a id="__codelineno-0-162" name="__codelineno-0-162"></a>    <span class="n">tag</span> <span class="o">=</span> <span class="n">name</span>
-</span><span id="__span-0-163"><a id="__codelineno-0-163" name="__codelineno-0-163"></a>    <span class="n">origin</span> <span class="o">=</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">NAME</span>
-</span><span id="__span-0-164"><a id="__codelineno-0-164" name="__codelineno-0-164"></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">pr</span><span class="p">)</span> <span class="o">&gt;=</span> <span class="mi">2</span> <span class="ow">and</span> <span class="p">(</span><span class="n">pr</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span> <span class="ow">in</span> <span class="s2">&quot;:=&quot;</span><span class="p">)</span> <span class="ow">and</span> <span class="p">(</span><span class="n">pr</span><span class="p">[</span><span class="o">-</span><span class="mi">2</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;&lt;&quot;</span><span class="p">):</span>
-</span><span id="__span-0-165"><a id="__codelineno-0-165" name="__codelineno-0-165"></a>        <span class="n">tag</span> <span class="o">=</span> <span class="n">pr</span><span class="p">[</span><span class="o">-</span><span class="mi">2</span><span class="p">]</span>
-</span><span id="__span-0-166"><a id="__codelineno-0-166" name="__codelineno-0-166"></a>        <span class="n">origin</span> <span class="o">=</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">PRECEDING</span>
-</span><span id="__span-0-167"><a id="__codelineno-0-167" name="__codelineno-0-167"></a>    <span class="k">elif</span> <span class="p">(</span>
-</span><span id="__span-0-168"><a id="__codelineno-0-168" name="__codelineno-0-168"></a>        <span class="nb">len</span><span class="p">(</span><span class="n">pr</span><span class="p">)</span> <span class="o">==</span> <span class="mi">3</span>
-</span><span id="__span-0-169"><a id="__codelineno-0-169" name="__codelineno-0-169"></a>        <span class="ow">and</span> <span class="p">(</span><span class="n">pr</span><span class="p">[</span><span class="mi">2</span><span class="p">]</span> <span class="ow">in</span> <span class="s2">&quot;&quot;&quot;&quot;&#39;&quot;&quot;&quot;</span><span class="p">)</span>
-</span><span id="__span-0-170"><a id="__codelineno-0-170" name="__codelineno-0-170"></a>        <span class="ow">and</span> <span class="p">(</span><span class="n">pr</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="ow">in</span> <span class="s2">&quot;:=&quot;</span><span class="p">)</span>
-</span><span id="__span-0-171"><a id="__codelineno-0-171" name="__codelineno-0-171"></a>        <span class="ow">and</span> <span class="p">(</span><span class="n">pr</span><span class="p">[</span><span class="mi">0</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;&lt;&quot;</span><span class="p">)</span>
-</span><span id="__span-0-172"><a id="__codelineno-0-172" name="__codelineno-0-172"></a>    <span class="p">):</span>
-</span><span id="__span-0-173"><a id="__codelineno-0-173" name="__codelineno-0-173"></a>        <span class="n">tag</span> <span class="o">=</span> <span class="n">pr</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-174"><a id="__codelineno-0-174" name="__codelineno-0-174"></a>        <span class="n">origin</span> <span class="o">=</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">PRECEDING</span>
-</span><span id="__span-0-175"><a id="__codelineno-0-175" name="__codelineno-0-175"></a>
-</span><span id="__span-0-176"><a id="__codelineno-0-176" name="__codelineno-0-176"></a>    <span class="c1"># Double-check that the tag is not in the banned values</span>
-</span><span id="__span-0-177"><a id="__codelineno-0-177" name="__codelineno-0-177"></a>    <span class="k">if</span> <span class="n">banned_values</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">tag</span> <span class="ow">in</span> <span class="n">banned_values</span><span class="p">:</span>
-</span><span id="__span-0-178"><a id="__codelineno-0-178" name="__codelineno-0-178"></a>        <span class="k">return</span> <span class="n">name</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">NAME</span>
-</span><span id="__span-0-179"><a id="__codelineno-0-179" name="__codelineno-0-179"></a>
-</span><span id="__span-0-180"><a id="__codelineno-0-180" name="__codelineno-0-180"></a>    <span class="k">return</span> <span class="n">tag</span><span class="p">,</span> <span class="n">origin</span>
+<span class="normal"><a href="#__codelineno-0-180">180</a></span>
+<span class="normal"><a href="#__codelineno-0-181">181</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-142"><a id="__codelineno-0-142" name="__codelineno-0-142"></a><span class="nd">@staticmethod</span>
+</span><span id="__span-0-143"><a id="__codelineno-0-143" name="__codelineno-0-143"></a><span class="k">def</span> <span class="nf">preceding_tokens_tag</span><span class="p">(</span>
+</span><span id="__span-0-144"><a id="__codelineno-0-144" name="__codelineno-0-144"></a>    <span class="n">variable_row</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">,</span> <span class="n">banned_values</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-145"><a id="__codelineno-0-145" name="__codelineno-0-145"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="p">]:</span>
+</span><span id="__span-0-146"><a id="__codelineno-0-146" name="__codelineno-0-146"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-147"><a id="__codelineno-0-147" name="__codelineno-0-147"></a><span class="sd">    Try to derive a tag for a parsed variable name based on the preceding tokens in the corresponding template.</span>
+</span><span id="__span-0-148"><a id="__codelineno-0-148" name="__codelineno-0-148"></a>
+</span><span id="__span-0-149"><a id="__codelineno-0-149" name="__codelineno-0-149"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-150"><a id="__codelineno-0-150" name="__codelineno-0-150"></a><span class="sd">        variable_row: The row of the dataframe containing information about the parsed variable.</span>
+</span><span id="__span-0-151"><a id="__codelineno-0-151" name="__codelineno-0-151"></a><span class="sd">        banned_values: A list of values that should not be used as tags.</span>
+</span><span id="__span-0-152"><a id="__codelineno-0-152" name="__codelineno-0-152"></a>
+</span><span id="__span-0-153"><a id="__codelineno-0-153" name="__codelineno-0-153"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-154"><a id="__codelineno-0-154" name="__codelineno-0-154"></a><span class="sd">        A tuple containing (i) the tag for the parsed variable, and (ii) the origin of the tag.</span>
+</span><span id="__span-0-155"><a id="__codelineno-0-155" name="__codelineno-0-155"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-156"><a id="__codelineno-0-156" name="__codelineno-0-156"></a>
+</span><span id="__span-0-157"><a id="__codelineno-0-157" name="__codelineno-0-157"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_fields</span><span class="p">(</span><span class="n">variable_row</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Preceding 3 tokens&quot;</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;From regex&quot;</span><span class="p">])</span>
+</span><span id="__span-0-158"><a id="__codelineno-0-158" name="__codelineno-0-158"></a>    <span class="n">name</span> <span class="o">=</span> <span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span>
+</span><span id="__span-0-159"><a id="__codelineno-0-159" name="__codelineno-0-159"></a>    <span class="k">if</span> <span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;From regex&quot;</span><span class="p">]:</span>
+</span><span id="__span-0-160"><a id="__codelineno-0-160" name="__codelineno-0-160"></a>        <span class="k">return</span> <span class="n">name</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">REGEX_VARIABLE</span>
+</span><span id="__span-0-161"><a id="__codelineno-0-161" name="__codelineno-0-161"></a>
+</span><span id="__span-0-162"><a id="__codelineno-0-162" name="__codelineno-0-162"></a>    <span class="n">pr</span> <span class="o">=</span> <span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;Preceding 3 tokens&quot;</span><span class="p">]</span>
+</span><span id="__span-0-163"><a id="__codelineno-0-163" name="__codelineno-0-163"></a>    <span class="n">tag</span> <span class="o">=</span> <span class="n">name</span>
+</span><span id="__span-0-164"><a id="__codelineno-0-164" name="__codelineno-0-164"></a>    <span class="n">origin</span> <span class="o">=</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">NAME</span>
+</span><span id="__span-0-165"><a id="__codelineno-0-165" name="__codelineno-0-165"></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">pr</span><span class="p">)</span> <span class="o">&gt;=</span> <span class="mi">2</span> <span class="ow">and</span> <span class="p">(</span><span class="n">pr</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span> <span class="ow">in</span> <span class="s2">&quot;:=&quot;</span><span class="p">)</span> <span class="ow">and</span> <span class="p">(</span><span class="n">pr</span><span class="p">[</span><span class="o">-</span><span class="mi">2</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;&lt;&quot;</span><span class="p">):</span>
+</span><span id="__span-0-166"><a id="__codelineno-0-166" name="__codelineno-0-166"></a>        <span class="n">tag</span> <span class="o">=</span> <span class="n">pr</span><span class="p">[</span><span class="o">-</span><span class="mi">2</span><span class="p">]</span>
+</span><span id="__span-0-167"><a id="__codelineno-0-167" name="__codelineno-0-167"></a>        <span class="n">origin</span> <span class="o">=</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">PRECEDING</span>
+</span><span id="__span-0-168"><a id="__codelineno-0-168" name="__codelineno-0-168"></a>    <span class="k">elif</span> <span class="p">(</span>
+</span><span id="__span-0-169"><a id="__codelineno-0-169" name="__codelineno-0-169"></a>        <span class="nb">len</span><span class="p">(</span><span class="n">pr</span><span class="p">)</span> <span class="o">==</span> <span class="mi">3</span>
+</span><span id="__span-0-170"><a id="__codelineno-0-170" name="__codelineno-0-170"></a>        <span class="ow">and</span> <span class="p">(</span><span class="n">pr</span><span class="p">[</span><span class="mi">2</span><span class="p">]</span> <span class="ow">in</span> <span class="s2">&quot;&quot;&quot;&quot;&#39;&quot;&quot;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-171"><a id="__codelineno-0-171" name="__codelineno-0-171"></a>        <span class="ow">and</span> <span class="p">(</span><span class="n">pr</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="ow">in</span> <span class="s2">&quot;:=&quot;</span><span class="p">)</span>
+</span><span id="__span-0-172"><a id="__codelineno-0-172" name="__codelineno-0-172"></a>        <span class="ow">and</span> <span class="p">(</span><span class="n">pr</span><span class="p">[</span><span class="mi">0</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span> <span class="o">!=</span> <span class="s2">&quot;&lt;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-173"><a id="__codelineno-0-173" name="__codelineno-0-173"></a>    <span class="p">):</span>
+</span><span id="__span-0-174"><a id="__codelineno-0-174" name="__codelineno-0-174"></a>        <span class="n">tag</span> <span class="o">=</span> <span class="n">pr</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-175"><a id="__codelineno-0-175" name="__codelineno-0-175"></a>        <span class="n">origin</span> <span class="o">=</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">PRECEDING</span>
+</span><span id="__span-0-176"><a id="__codelineno-0-176" name="__codelineno-0-176"></a>
+</span><span id="__span-0-177"><a id="__codelineno-0-177" name="__codelineno-0-177"></a>    <span class="c1"># Double-check that the tag is not in the banned values</span>
+</span><span id="__span-0-178"><a id="__codelineno-0-178" name="__codelineno-0-178"></a>    <span class="k">if</span> <span class="n">banned_values</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">tag</span> <span class="ow">in</span> <span class="n">banned_values</span><span class="p">:</span>
+</span><span id="__span-0-179"><a id="__codelineno-0-179" name="__codelineno-0-179"></a>        <span class="k">return</span> <span class="n">name</span><span class="p">,</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">NAME</span>
+</span><span id="__span-0-180"><a id="__codelineno-0-180" name="__codelineno-0-180"></a>
+</span><span id="__span-0-181"><a id="__codelineno-0-181" name="__codelineno-0-181"></a>    <span class="k">return</span> <span class="n">tag</span><span class="p">,</span> <span class="n">origin</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -3281,8 +3281,7 @@ <h3 id="logos.tag_utils.TagUtils.gpt_tag" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/tag_utils.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-182">182</a></span>
-<span class="normal"><a href="#__codelineno-0-183">183</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-183">183</a></span>
 <span class="normal"><a href="#__codelineno-0-184">184</a></span>
 <span class="normal"><a href="#__codelineno-0-185">185</a></span>
 <span class="normal"><a href="#__codelineno-0-186">186</a></span>
@@ -3358,84 +3357,85 @@ <h3 id="logos.tag_utils.TagUtils.gpt_tag" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-256">256</a></span>
 <span class="normal"><a href="#__codelineno-0-257">257</a></span>
 <span class="normal"><a href="#__codelineno-0-258">258</a></span>
-<span class="normal"><a href="#__codelineno-0-259">259</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-182"><a id="__codelineno-0-182" name="__codelineno-0-182"></a><span class="nd">@staticmethod</span>
-</span><span id="__span-0-183"><a id="__codelineno-0-183" name="__codelineno-0-183"></a><span class="k">def</span> <span class="nf">gpt_tag</span><span class="p">(</span>
-</span><span id="__span-0-184"><a id="__codelineno-0-184" name="__codelineno-0-184"></a>    <span class="n">templates_df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span>
-</span><span id="__span-0-185"><a id="__codelineno-0-185" name="__codelineno-0-185"></a>    <span class="n">variable_row</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">,</span>
-</span><span id="__span-0-186"><a id="__codelineno-0-186" name="__codelineno-0-186"></a>    <span class="n">model</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;gpt-3.5-turbo&quot;</span><span class="p">,</span>
-</span><span id="__span-0-187"><a id="__codelineno-0-187" name="__codelineno-0-187"></a>    <span class="n">banned_values</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-188"><a id="__codelineno-0-188" name="__codelineno-0-188"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-</span><span id="__span-0-189"><a id="__codelineno-0-189" name="__codelineno-0-189"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-190"><a id="__codelineno-0-190" name="__codelineno-0-190"></a><span class="sd">    Use GPT to derive a tag the variable described in `variable_row`,</span>
-</span><span id="__span-0-191"><a id="__codelineno-0-191" name="__codelineno-0-191"></a><span class="sd">    using information about the corresponding log template, retrieved from `templates_df`.</span>
-</span><span id="__span-0-192"><a id="__codelineno-0-192" name="__codelineno-0-192"></a>
-</span><span id="__span-0-193"><a id="__codelineno-0-193" name="__codelineno-0-193"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-194"><a id="__codelineno-0-194" name="__codelineno-0-194"></a><span class="sd">        templates_df: The dataframe containing information about the log templates.</span>
-</span><span id="__span-0-195"><a id="__codelineno-0-195" name="__codelineno-0-195"></a><span class="sd">        variable_row: The row of the dataframe containing information about the parsed variable.</span>
-</span><span id="__span-0-196"><a id="__codelineno-0-196" name="__codelineno-0-196"></a><span class="sd">        model: The GPT model to use.</span>
-</span><span id="__span-0-197"><a id="__codelineno-0-197" name="__codelineno-0-197"></a><span class="sd">        banned_values: A list of values that should not be used as tags.</span>
-</span><span id="__span-0-198"><a id="__codelineno-0-198" name="__codelineno-0-198"></a>
-</span><span id="__span-0-199"><a id="__codelineno-0-199" name="__codelineno-0-199"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-200"><a id="__codelineno-0-200" name="__codelineno-0-200"></a><span class="sd">        The GPT-generated tag for the parsed variable name.</span>
-</span><span id="__span-0-201"><a id="__codelineno-0-201" name="__codelineno-0-201"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-202"><a id="__codelineno-0-202" name="__codelineno-0-202"></a>
-</span><span id="__span-0-203"><a id="__codelineno-0-203" name="__codelineno-0-203"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_fields</span><span class="p">(</span><span class="n">variable_row</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;Examples&quot;</span><span class="p">])</span>
-</span><span id="__span-0-204"><a id="__codelineno-0-204" name="__codelineno-0-204"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_columns</span><span class="p">(</span><span class="n">templates_df</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">,</span> <span class="s2">&quot;TemplateExample&quot;</span><span class="p">])</span>
-</span><span id="__span-0-205"><a id="__codelineno-0-205" name="__codelineno-0-205"></a>
-</span><span id="__span-0-206"><a id="__codelineno-0-206" name="__codelineno-0-206"></a>    <span class="n">template_id</span> <span class="o">=</span> <span class="n">ParsedVariableName</span><span class="p">(</span><span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">])</span><span class="o">.</span><span class="n">template_id</span><span class="p">()</span>
-</span><span id="__span-0-207"><a id="__codelineno-0-207" name="__codelineno-0-207"></a>    <span class="n">idx</span> <span class="o">=</span> <span class="n">ParsedVariableName</span><span class="p">(</span><span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">])</span><span class="o">.</span><span class="n">index</span><span class="p">()</span>
-</span><span id="__span-0-208"><a id="__codelineno-0-208" name="__codelineno-0-208"></a>
-</span><span id="__span-0-209"><a id="__codelineno-0-209" name="__codelineno-0-209"></a>    <span class="n">line</span> <span class="o">=</span> <span class="n">templates_df</span><span class="p">[</span><span class="n">templates_df</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">template_id</span><span class="p">][</span>
-</span><span id="__span-0-210"><a id="__codelineno-0-210" name="__codelineno-0-210"></a>        <span class="s2">&quot;TemplateExample&quot;</span>
-</span><span id="__span-0-211"><a id="__codelineno-0-211" name="__codelineno-0-211"></a>    <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-212"><a id="__codelineno-0-212" name="__codelineno-0-212"></a>    <span class="n">line_toks</span> <span class="o">=</span> <span class="n">line</span><span class="o">.</span><span class="n">split</span><span class="p">()</span>
-</span><span id="__span-0-213"><a id="__codelineno-0-213" name="__codelineno-0-213"></a>
-</span><span id="__span-0-214"><a id="__codelineno-0-214" name="__codelineno-0-214"></a>    <span class="c1"># Define the messages to send to the model</span>
-</span><span id="__span-0-215"><a id="__codelineno-0-215" name="__codelineno-0-215"></a>    <span class="n">messages</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="__span-0-216"><a id="__codelineno-0-216" name="__codelineno-0-216"></a>        <span class="p">{</span>
-</span><span id="__span-0-217"><a id="__codelineno-0-217" name="__codelineno-0-217"></a>            <span class="s2">&quot;role&quot;</span><span class="p">:</span> <span class="s2">&quot;system&quot;</span><span class="p">,</span>
-</span><span id="__span-0-218"><a id="__codelineno-0-218" name="__codelineno-0-218"></a>            <span class="s2">&quot;content&quot;</span><span class="p">:</span> <span class="s2">&quot;You are a backend engineer that knows all about the logging infrastructure of a distributed system.&quot;</span><span class="p">,</span>
-</span><span id="__span-0-219"><a id="__codelineno-0-219" name="__codelineno-0-219"></a>        <span class="p">},</span>
-</span><span id="__span-0-220"><a id="__codelineno-0-220" name="__codelineno-0-220"></a>        <span class="p">{</span>
-</span><span id="__span-0-221"><a id="__codelineno-0-221" name="__codelineno-0-221"></a>            <span class="s2">&quot;role&quot;</span><span class="p">:</span> <span class="s2">&quot;user&quot;</span><span class="p">,</span>
-</span><span id="__span-0-222"><a id="__codelineno-0-222" name="__codelineno-0-222"></a>            <span class="s2">&quot;content&quot;</span><span class="p">:</span> <span class="sa">f</span><span class="s2">&quot;&quot;&quot;Generate a tag for the variable that takes the value </span><span class="si">{</span><span class="n">line_toks</span><span class="p">[</span><span class="n">idx</span><span class="p">]</span><span class="si">}</span><span class="s2"> &quot;&quot;&quot;</span>
-</span><span id="__span-0-223"><a id="__codelineno-0-223" name="__codelineno-0-223"></a>            <span class="sa">f</span><span class="s2">&quot;&quot;&quot;in the following log line:</span><span class="se">\n</span><span class="s2"> </span><span class="si">{</span><span class="n">line</span><span class="si">}</span><span class="se">\n</span><span class="s2">&quot;&quot;&quot;</span>
-</span><span id="__span-0-224"><a id="__codelineno-0-224" name="__codelineno-0-224"></a>            <span class="sa">f</span><span class="s2">&quot;&quot;&quot;Here are the 3 tokens that precede the variable: [</span><span class="si">{</span><span class="s1">&#39;, &#39;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">line_toks</span><span class="p">[</span><span class="nb">max</span><span class="p">(</span><span class="n">idx</span><span class="o">-</span><span class="mi">3</span><span class="p">,</span><span class="w"> </span><span class="mi">0</span><span class="p">):</span><span class="n">idx</span><span class="p">])</span><span class="si">}</span><span class="s2"> ]</span><span class="se">\n</span><span class="s2">&quot;&quot;&quot;</span>
-</span><span id="__span-0-225"><a id="__codelineno-0-225" name="__codelineno-0-225"></a>            <span class="sa">f</span><span class="s2">&quot;&quot;&quot;Here are some more example values for this variable: [</span><span class="si">{</span><span class="s1">&#39;, &#39;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">variable_row</span><span class="p">[</span><span class="s1">&#39;Examples&#39;</span><span class="p">])</span><span class="si">}</span><span class="s2"> ]</span><span class="se">\n</span><span class="s2">&quot;&quot;&quot;</span>
-</span><span id="__span-0-226"><a id="__codelineno-0-226" name="__codelineno-0-226"></a>            <span class="c1">#f&quot;&quot;&quot;Make sure the tag matches none of the following values: [{&#39;, &#39;.join(banned_values) if banned_values is not None else &#39;&#39;} ]\n&quot;&quot;&quot;</span>
-</span><span id="__span-0-227"><a id="__codelineno-0-227" name="__codelineno-0-227"></a><span class="w">            </span><span class="sd">&quot;&quot;&quot;Return only the tag as a single word, possibly including underscores. DO NOT EVER REPLY WITH MORE THAN ONE WORD.\n&quot;&quot;&quot;</span><span class="p">,</span>
-</span><span id="__span-0-228"><a id="__codelineno-0-228" name="__codelineno-0-228"></a>        <span class="p">},</span>
-</span><span id="__span-0-229"><a id="__codelineno-0-229" name="__codelineno-0-229"></a>    <span class="p">]</span>
-</span><span id="__span-0-230"><a id="__codelineno-0-230" name="__codelineno-0-230"></a>
-</span><span id="__span-0-231"><a id="__codelineno-0-231" name="__codelineno-0-231"></a>    <span class="n">client</span> <span class="o">=</span> <span class="n">OpenAI</span><span class="p">()</span>
-</span><span id="__span-0-232"><a id="__codelineno-0-232" name="__codelineno-0-232"></a>
-</span><span id="__span-0-233"><a id="__codelineno-0-233" name="__codelineno-0-233"></a>    <span class="n">tag</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-234"><a id="__codelineno-0-234" name="__codelineno-0-234"></a>        <span class="n">client</span><span class="o">.</span><span class="n">chat</span><span class="o">.</span><span class="n">completions</span><span class="o">.</span><span class="n">create</span><span class="p">(</span><span class="n">model</span><span class="o">=</span><span class="n">model</span><span class="p">,</span> <span class="n">messages</span><span class="o">=</span><span class="n">messages</span><span class="p">)</span>
-</span><span id="__span-0-235"><a id="__codelineno-0-235" name="__codelineno-0-235"></a>        <span class="o">.</span><span class="n">choices</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-236"><a id="__codelineno-0-236" name="__codelineno-0-236"></a>        <span class="o">.</span><span class="n">message</span><span class="o">.</span><span class="n">content</span>
-</span><span id="__span-0-237"><a id="__codelineno-0-237" name="__codelineno-0-237"></a>    <span class="p">)</span>
-</span><span id="__span-0-238"><a id="__codelineno-0-238" name="__codelineno-0-238"></a>    <span class="n">tag_length</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">tag</span><span class="o">.</span><span class="n">split</span><span class="p">())</span>
-</span><span id="__span-0-239"><a id="__codelineno-0-239" name="__codelineno-0-239"></a>    <span class="k">if</span> <span class="n">tag_length</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="__span-0-240"><a id="__codelineno-0-240" name="__codelineno-0-240"></a>        <span class="c1"># GPT didn&#39;t listen to us and returned a phrase describing the tag.</span>
-</span><span id="__span-0-241"><a id="__codelineno-0-241" name="__codelineno-0-241"></a>        <span class="c1"># Extract the word between the second-last and last occurrence of double quotes.</span>
-</span><span id="__span-0-242"><a id="__codelineno-0-242" name="__codelineno-0-242"></a>        <span class="n">tag</span> <span class="o">=</span> <span class="n">tag</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;&quot;&#39;</span><span class="p">)[</span><span class="o">-</span><span class="mi">2</span><span class="p">]</span>
-</span><span id="__span-0-243"><a id="__codelineno-0-243" name="__codelineno-0-243"></a>
+<span class="normal"><a href="#__codelineno-0-259">259</a></span>
+<span class="normal"><a href="#__codelineno-0-260">260</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-183"><a id="__codelineno-0-183" name="__codelineno-0-183"></a><span class="nd">@staticmethod</span>
+</span><span id="__span-0-184"><a id="__codelineno-0-184" name="__codelineno-0-184"></a><span class="k">def</span> <span class="nf">gpt_tag</span><span class="p">(</span>
+</span><span id="__span-0-185"><a id="__codelineno-0-185" name="__codelineno-0-185"></a>    <span class="n">templates_df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span>
+</span><span id="__span-0-186"><a id="__codelineno-0-186" name="__codelineno-0-186"></a>    <span class="n">variable_row</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">,</span>
+</span><span id="__span-0-187"><a id="__codelineno-0-187" name="__codelineno-0-187"></a>    <span class="n">model</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;gpt-3.5-turbo&quot;</span><span class="p">,</span>
+</span><span id="__span-0-188"><a id="__codelineno-0-188" name="__codelineno-0-188"></a>    <span class="n">banned_values</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-189"><a id="__codelineno-0-189" name="__codelineno-0-189"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-190"><a id="__codelineno-0-190" name="__codelineno-0-190"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-191"><a id="__codelineno-0-191" name="__codelineno-0-191"></a><span class="sd">    Use GPT to derive a tag the variable described in `variable_row`,</span>
+</span><span id="__span-0-192"><a id="__codelineno-0-192" name="__codelineno-0-192"></a><span class="sd">    using information about the corresponding log template, retrieved from `templates_df`.</span>
+</span><span id="__span-0-193"><a id="__codelineno-0-193" name="__codelineno-0-193"></a>
+</span><span id="__span-0-194"><a id="__codelineno-0-194" name="__codelineno-0-194"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-195"><a id="__codelineno-0-195" name="__codelineno-0-195"></a><span class="sd">        templates_df: The dataframe containing information about the log templates.</span>
+</span><span id="__span-0-196"><a id="__codelineno-0-196" name="__codelineno-0-196"></a><span class="sd">        variable_row: The row of the dataframe containing information about the parsed variable.</span>
+</span><span id="__span-0-197"><a id="__codelineno-0-197" name="__codelineno-0-197"></a><span class="sd">        model: The GPT model to use.</span>
+</span><span id="__span-0-198"><a id="__codelineno-0-198" name="__codelineno-0-198"></a><span class="sd">        banned_values: A list of values that should not be used as tags.</span>
+</span><span id="__span-0-199"><a id="__codelineno-0-199" name="__codelineno-0-199"></a>
+</span><span id="__span-0-200"><a id="__codelineno-0-200" name="__codelineno-0-200"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-201"><a id="__codelineno-0-201" name="__codelineno-0-201"></a><span class="sd">        The GPT-generated tag for the parsed variable name.</span>
+</span><span id="__span-0-202"><a id="__codelineno-0-202" name="__codelineno-0-202"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-203"><a id="__codelineno-0-203" name="__codelineno-0-203"></a>
+</span><span id="__span-0-204"><a id="__codelineno-0-204" name="__codelineno-0-204"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_fields</span><span class="p">(</span><span class="n">variable_row</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;Examples&quot;</span><span class="p">])</span>
+</span><span id="__span-0-205"><a id="__codelineno-0-205" name="__codelineno-0-205"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_columns</span><span class="p">(</span><span class="n">templates_df</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">,</span> <span class="s2">&quot;TemplateExample&quot;</span><span class="p">])</span>
+</span><span id="__span-0-206"><a id="__codelineno-0-206" name="__codelineno-0-206"></a>
+</span><span id="__span-0-207"><a id="__codelineno-0-207" name="__codelineno-0-207"></a>    <span class="n">template_id</span> <span class="o">=</span> <span class="n">ParsedVariableName</span><span class="p">(</span><span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">])</span><span class="o">.</span><span class="n">template_id</span><span class="p">()</span>
+</span><span id="__span-0-208"><a id="__codelineno-0-208" name="__codelineno-0-208"></a>    <span class="n">idx</span> <span class="o">=</span> <span class="n">ParsedVariableName</span><span class="p">(</span><span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">])</span><span class="o">.</span><span class="n">index</span><span class="p">()</span>
+</span><span id="__span-0-209"><a id="__codelineno-0-209" name="__codelineno-0-209"></a>
+</span><span id="__span-0-210"><a id="__codelineno-0-210" name="__codelineno-0-210"></a>    <span class="n">line</span> <span class="o">=</span> <span class="n">templates_df</span><span class="p">[</span><span class="n">templates_df</span><span class="p">[</span><span class="s2">&quot;TemplateId&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">template_id</span><span class="p">][</span>
+</span><span id="__span-0-211"><a id="__codelineno-0-211" name="__codelineno-0-211"></a>        <span class="s2">&quot;TemplateExample&quot;</span>
+</span><span id="__span-0-212"><a id="__codelineno-0-212" name="__codelineno-0-212"></a>    <span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-213"><a id="__codelineno-0-213" name="__codelineno-0-213"></a>    <span class="n">line_toks</span> <span class="o">=</span> <span class="n">line</span><span class="o">.</span><span class="n">split</span><span class="p">()</span>
+</span><span id="__span-0-214"><a id="__codelineno-0-214" name="__codelineno-0-214"></a>
+</span><span id="__span-0-215"><a id="__codelineno-0-215" name="__codelineno-0-215"></a>    <span class="c1"># Define the messages to send to the model</span>
+</span><span id="__span-0-216"><a id="__codelineno-0-216" name="__codelineno-0-216"></a>    <span class="n">messages</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="__span-0-217"><a id="__codelineno-0-217" name="__codelineno-0-217"></a>        <span class="p">{</span>
+</span><span id="__span-0-218"><a id="__codelineno-0-218" name="__codelineno-0-218"></a>            <span class="s2">&quot;role&quot;</span><span class="p">:</span> <span class="s2">&quot;system&quot;</span><span class="p">,</span>
+</span><span id="__span-0-219"><a id="__codelineno-0-219" name="__codelineno-0-219"></a>            <span class="s2">&quot;content&quot;</span><span class="p">:</span> <span class="s2">&quot;You are a backend engineer that knows all about the logging infrastructure of a distributed system.&quot;</span><span class="p">,</span>
+</span><span id="__span-0-220"><a id="__codelineno-0-220" name="__codelineno-0-220"></a>        <span class="p">},</span>
+</span><span id="__span-0-221"><a id="__codelineno-0-221" name="__codelineno-0-221"></a>        <span class="p">{</span>
+</span><span id="__span-0-222"><a id="__codelineno-0-222" name="__codelineno-0-222"></a>            <span class="s2">&quot;role&quot;</span><span class="p">:</span> <span class="s2">&quot;user&quot;</span><span class="p">,</span>
+</span><span id="__span-0-223"><a id="__codelineno-0-223" name="__codelineno-0-223"></a>            <span class="s2">&quot;content&quot;</span><span class="p">:</span> <span class="sa">f</span><span class="s2">&quot;&quot;&quot;Generate a tag for the variable that takes the value </span><span class="si">{</span><span class="n">line_toks</span><span class="p">[</span><span class="n">idx</span><span class="p">]</span><span class="si">}</span><span class="s2"> &quot;&quot;&quot;</span>
+</span><span id="__span-0-224"><a id="__codelineno-0-224" name="__codelineno-0-224"></a>            <span class="sa">f</span><span class="s2">&quot;&quot;&quot;in the following log line:</span><span class="se">\n</span><span class="s2"> </span><span class="si">{</span><span class="n">line</span><span class="si">}</span><span class="se">\n</span><span class="s2">&quot;&quot;&quot;</span>
+</span><span id="__span-0-225"><a id="__codelineno-0-225" name="__codelineno-0-225"></a>            <span class="sa">f</span><span class="s2">&quot;&quot;&quot;Here are the 3 tokens that precede the variable: [</span><span class="si">{</span><span class="s1">&#39;, &#39;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">line_toks</span><span class="p">[</span><span class="nb">max</span><span class="p">(</span><span class="n">idx</span><span class="o">-</span><span class="mi">3</span><span class="p">,</span><span class="w"> </span><span class="mi">0</span><span class="p">):</span><span class="n">idx</span><span class="p">])</span><span class="si">}</span><span class="s2"> ]</span><span class="se">\n</span><span class="s2">&quot;&quot;&quot;</span>
+</span><span id="__span-0-226"><a id="__codelineno-0-226" name="__codelineno-0-226"></a>            <span class="sa">f</span><span class="s2">&quot;&quot;&quot;Here are some more example values for this variable: [</span><span class="si">{</span><span class="s1">&#39;, &#39;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">variable_row</span><span class="p">[</span><span class="s1">&#39;Examples&#39;</span><span class="p">])</span><span class="si">}</span><span class="s2"> ]</span><span class="se">\n</span><span class="s2">&quot;&quot;&quot;</span>
+</span><span id="__span-0-227"><a id="__codelineno-0-227" name="__codelineno-0-227"></a>            <span class="c1">#f&quot;&quot;&quot;Make sure the tag matches none of the following values: [{&#39;, &#39;.join(banned_values) if banned_values is not None else &#39;&#39;} ]\n&quot;&quot;&quot;</span>
+</span><span id="__span-0-228"><a id="__codelineno-0-228" name="__codelineno-0-228"></a><span class="w">            </span><span class="sd">&quot;&quot;&quot;Return only the tag as a single word, possibly including underscores. DO NOT EVER REPLY WITH MORE THAN ONE WORD.\n&quot;&quot;&quot;</span><span class="p">,</span>
+</span><span id="__span-0-229"><a id="__codelineno-0-229" name="__codelineno-0-229"></a>        <span class="p">},</span>
+</span><span id="__span-0-230"><a id="__codelineno-0-230" name="__codelineno-0-230"></a>    <span class="p">]</span>
+</span><span id="__span-0-231"><a id="__codelineno-0-231" name="__codelineno-0-231"></a>
+</span><span id="__span-0-232"><a id="__codelineno-0-232" name="__codelineno-0-232"></a>    <span class="n">client</span> <span class="o">=</span> <span class="n">OpenAI</span><span class="p">()</span>
+</span><span id="__span-0-233"><a id="__codelineno-0-233" name="__codelineno-0-233"></a>
+</span><span id="__span-0-234"><a id="__codelineno-0-234" name="__codelineno-0-234"></a>    <span class="n">tag</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-235"><a id="__codelineno-0-235" name="__codelineno-0-235"></a>        <span class="n">client</span><span class="o">.</span><span class="n">chat</span><span class="o">.</span><span class="n">completions</span><span class="o">.</span><span class="n">create</span><span class="p">(</span><span class="n">model</span><span class="o">=</span><span class="n">model</span><span class="p">,</span> <span class="n">messages</span><span class="o">=</span><span class="n">messages</span><span class="p">)</span>
+</span><span id="__span-0-236"><a id="__codelineno-0-236" name="__codelineno-0-236"></a>        <span class="o">.</span><span class="n">choices</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-237"><a id="__codelineno-0-237" name="__codelineno-0-237"></a>        <span class="o">.</span><span class="n">message</span><span class="o">.</span><span class="n">content</span>
+</span><span id="__span-0-238"><a id="__codelineno-0-238" name="__codelineno-0-238"></a>    <span class="p">)</span>
+</span><span id="__span-0-239"><a id="__codelineno-0-239" name="__codelineno-0-239"></a>    <span class="n">tag_length</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">tag</span><span class="o">.</span><span class="n">split</span><span class="p">())</span>
+</span><span id="__span-0-240"><a id="__codelineno-0-240" name="__codelineno-0-240"></a>    <span class="k">if</span> <span class="n">tag_length</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="__span-0-241"><a id="__codelineno-0-241" name="__codelineno-0-241"></a>        <span class="c1"># GPT didn&#39;t listen to us and returned a phrase describing the tag.</span>
+</span><span id="__span-0-242"><a id="__codelineno-0-242" name="__codelineno-0-242"></a>        <span class="c1"># Extract the word between the second-last and last occurrence of double quotes.</span>
+</span><span id="__span-0-243"><a id="__codelineno-0-243" name="__codelineno-0-243"></a>        <span class="n">tag</span> <span class="o">=</span> <span class="n">tag</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;&quot;&#39;</span><span class="p">)[</span><span class="o">-</span><span class="mi">2</span><span class="p">]</span>
 </span><span id="__span-0-244"><a id="__codelineno-0-244" name="__codelineno-0-244"></a>
-</span><span id="__span-0-245"><a id="__codelineno-0-245" name="__codelineno-0-245"></a>    <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="s2">&quot;gpt_log.txt&quot;</span><span class="p">,</span> <span class="s2">&quot;a+&quot;</span><span class="p">)</span> <span class="k">as</span> <span class="n">f</span><span class="p">:</span>
-</span><span id="__span-0-246"><a id="__codelineno-0-246" name="__codelineno-0-246"></a>        <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="s1">&#39;----------------------------------</span><span class="se">\n</span><span class="s1">&#39;</span><span class="p">)</span>
-</span><span id="__span-0-247"><a id="__codelineno-0-247" name="__codelineno-0-247"></a>        <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Variable name: </span><span class="si">{</span><span class="n">variable_row</span><span class="p">[</span><span class="s1">&#39;Name&#39;</span><span class="p">]</span><span class="si">}</span><span class="se">\n\n</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="__span-0-248"><a id="__codelineno-0-248" name="__codelineno-0-248"></a>        <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Model used: </span><span class="si">{</span><span class="n">model</span><span class="si">}</span><span class="se">\n\n</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="__span-0-249"><a id="__codelineno-0-249" name="__codelineno-0-249"></a>        <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Messages sent to the model:</span><span class="se">\n</span><span class="si">{</span><span class="n">messages</span><span class="si">}</span><span class="se">\n\n</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="__span-0-250"><a id="__codelineno-0-250" name="__codelineno-0-250"></a>        <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Tag generated by the model:</span><span class="se">\n</span><span class="si">{</span><span class="n">tag</span><span class="si">}</span><span class="se">\n\n</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="__span-0-251"><a id="__codelineno-0-251" name="__codelineno-0-251"></a>        <span class="n">f</span><span class="o">.</span><span class="n">flush</span><span class="p">()</span>
-</span><span id="__span-0-252"><a id="__codelineno-0-252" name="__codelineno-0-252"></a>
-</span><span id="__span-0-253"><a id="__codelineno-0-253" name="__codelineno-0-253"></a>    <span class="c1"># Double-check that the tag is not in the banned values</span>
-</span><span id="__span-0-254"><a id="__codelineno-0-254" name="__codelineno-0-254"></a>    <span class="k">if</span> <span class="n">banned_values</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">tag</span> <span class="ow">in</span> <span class="n">banned_values</span><span class="p">:</span>
-</span><span id="__span-0-255"><a id="__codelineno-0-255" name="__codelineno-0-255"></a>        <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="s2">&quot;gpt_log.txt&quot;</span><span class="p">,</span> <span class="s2">&quot;a+&quot;</span><span class="p">)</span> <span class="k">as</span> <span class="n">f</span><span class="p">:</span>
-</span><span id="__span-0-256"><a id="__codelineno-0-256" name="__codelineno-0-256"></a>            <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="s1">&#39;That tag is banned, returning name.</span><span class="se">\n</span><span class="s1">&#39;</span><span class="p">)</span>
-</span><span id="__span-0-257"><a id="__codelineno-0-257" name="__codelineno-0-257"></a>        <span class="k">return</span> <span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span>
-</span><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a>
-</span><span id="__span-0-259"><a id="__codelineno-0-259" name="__codelineno-0-259"></a>    <span class="k">return</span> <span class="n">tag</span>
+</span><span id="__span-0-245"><a id="__codelineno-0-245" name="__codelineno-0-245"></a>
+</span><span id="__span-0-246"><a id="__codelineno-0-246" name="__codelineno-0-246"></a>    <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="s2">&quot;gpt_log.txt&quot;</span><span class="p">,</span> <span class="s2">&quot;a+&quot;</span><span class="p">)</span> <span class="k">as</span> <span class="n">f</span><span class="p">:</span>
+</span><span id="__span-0-247"><a id="__codelineno-0-247" name="__codelineno-0-247"></a>        <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="s1">&#39;----------------------------------</span><span class="se">\n</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="__span-0-248"><a id="__codelineno-0-248" name="__codelineno-0-248"></a>        <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Variable name: </span><span class="si">{</span><span class="n">variable_row</span><span class="p">[</span><span class="s1">&#39;Name&#39;</span><span class="p">]</span><span class="si">}</span><span class="se">\n\n</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-249"><a id="__codelineno-0-249" name="__codelineno-0-249"></a>        <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Model used: </span><span class="si">{</span><span class="n">model</span><span class="si">}</span><span class="se">\n\n</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-250"><a id="__codelineno-0-250" name="__codelineno-0-250"></a>        <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Messages sent to the model:</span><span class="se">\n</span><span class="si">{</span><span class="n">messages</span><span class="si">}</span><span class="se">\n\n</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-251"><a id="__codelineno-0-251" name="__codelineno-0-251"></a>        <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Tag generated by the model:</span><span class="se">\n</span><span class="si">{</span><span class="n">tag</span><span class="si">}</span><span class="se">\n\n</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-252"><a id="__codelineno-0-252" name="__codelineno-0-252"></a>        <span class="n">f</span><span class="o">.</span><span class="n">flush</span><span class="p">()</span>
+</span><span id="__span-0-253"><a id="__codelineno-0-253" name="__codelineno-0-253"></a>
+</span><span id="__span-0-254"><a id="__codelineno-0-254" name="__codelineno-0-254"></a>    <span class="c1"># Double-check that the tag is not in the banned values</span>
+</span><span id="__span-0-255"><a id="__codelineno-0-255" name="__codelineno-0-255"></a>    <span class="k">if</span> <span class="n">banned_values</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">tag</span> <span class="ow">in</span> <span class="n">banned_values</span><span class="p">:</span>
+</span><span id="__span-0-256"><a id="__codelineno-0-256" name="__codelineno-0-256"></a>        <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="s2">&quot;gpt_log.txt&quot;</span><span class="p">,</span> <span class="s2">&quot;a+&quot;</span><span class="p">)</span> <span class="k">as</span> <span class="n">f</span><span class="p">:</span>
+</span><span id="__span-0-257"><a id="__codelineno-0-257" name="__codelineno-0-257"></a>            <span class="n">f</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="s1">&#39;That tag is banned, returning name.</span><span class="se">\n</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a>        <span class="k">return</span> <span class="n">variable_row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span>
+</span><span id="__span-0-259"><a id="__codelineno-0-259" name="__codelineno-0-259"></a>
+</span><span id="__span-0-260"><a id="__codelineno-0-260" name="__codelineno-0-260"></a>    <span class="k">return</span> <span class="n">tag</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -3514,8 +3514,7 @@ <h3 id="logos.tag_utils.TagUtils.deduplicate_tags" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/tag_utils.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-261">261</a></span>
-<span class="normal"><a href="#__codelineno-0-262">262</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-262">262</a></span>
 <span class="normal"><a href="#__codelineno-0-263">263</a></span>
 <span class="normal"><a href="#__codelineno-0-264">264</a></span>
 <span class="normal"><a href="#__codelineno-0-265">265</a></span>
@@ -3534,27 +3533,28 @@ <h3 id="logos.tag_utils.TagUtils.deduplicate_tags" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-278">278</a></span>
 <span class="normal"><a href="#__codelineno-0-279">279</a></span>
 <span class="normal"><a href="#__codelineno-0-280">280</a></span>
-<span class="normal"><a href="#__codelineno-0-281">281</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-261"><a id="__codelineno-0-261" name="__codelineno-0-261"></a><span class="nd">@staticmethod</span>
-</span><span id="__span-0-262"><a id="__codelineno-0-262" name="__codelineno-0-262"></a><span class="k">def</span> <span class="nf">deduplicate_tags</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
-</span><span id="__span-0-263"><a id="__codelineno-0-263" name="__codelineno-0-263"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-264"><a id="__codelineno-0-264" name="__codelineno-0-264"></a><span class="sd">    Ensure that the tags in df are unique, by making the tag column of any row</span>
-</span><span id="__span-0-265"><a id="__codelineno-0-265" name="__codelineno-0-265"></a><span class="sd">    with a seen-before tag equal to the name column of that row.</span>
-</span><span id="__span-0-266"><a id="__codelineno-0-266" name="__codelineno-0-266"></a>
-</span><span id="__span-0-267"><a id="__codelineno-0-267" name="__codelineno-0-267"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-268"><a id="__codelineno-0-268" name="__codelineno-0-268"></a><span class="sd">        df: The dataframe to be deduplicated.</span>
-</span><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a>
-</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a><span class="sd">        The deduplicated dataframe.</span>
-</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a>
-</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_columns</span><span class="p">(</span><span class="n">df</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">,</span> <span class="s2">&quot;TagOrigin&quot;</span><span class="p">])</span>
-</span><span id="__span-0-275"><a id="__codelineno-0-275" name="__codelineno-0-275"></a>    <span class="n">seen_tags</span> <span class="o">=</span> <span class="nb">set</span><span class="p">()</span>
-</span><span id="__span-0-276"><a id="__codelineno-0-276" name="__codelineno-0-276"></a>    <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">row</span> <span class="ow">in</span> <span class="n">df</span><span class="o">.</span><span class="n">iterrows</span><span class="p">():</span>
-</span><span id="__span-0-277"><a id="__codelineno-0-277" name="__codelineno-0-277"></a>        <span class="k">if</span> <span class="n">row</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span> <span class="ow">in</span> <span class="n">seen_tags</span><span class="p">:</span>
-</span><span id="__span-0-278"><a id="__codelineno-0-278" name="__codelineno-0-278"></a>            <span class="n">df</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">i</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span>
-</span><span id="__span-0-279"><a id="__codelineno-0-279" name="__codelineno-0-279"></a>            <span class="n">df</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">i</span><span class="p">,</span> <span class="s2">&quot;TagOrigin&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">NAME</span>
-</span><span id="__span-0-280"><a id="__codelineno-0-280" name="__codelineno-0-280"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-281"><a id="__codelineno-0-281" name="__codelineno-0-281"></a>            <span class="n">seen_tags</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">row</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">])</span>
+<span class="normal"><a href="#__codelineno-0-281">281</a></span>
+<span class="normal"><a href="#__codelineno-0-282">282</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-262"><a id="__codelineno-0-262" name="__codelineno-0-262"></a><span class="nd">@staticmethod</span>
+</span><span id="__span-0-263"><a id="__codelineno-0-263" name="__codelineno-0-263"></a><span class="k">def</span> <span class="nf">deduplicate_tags</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
+</span><span id="__span-0-264"><a id="__codelineno-0-264" name="__codelineno-0-264"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-265"><a id="__codelineno-0-265" name="__codelineno-0-265"></a><span class="sd">    Ensure that the tags in df are unique, by making the tag column of any row</span>
+</span><span id="__span-0-266"><a id="__codelineno-0-266" name="__codelineno-0-266"></a><span class="sd">    with a seen-before tag equal to the name column of that row.</span>
+</span><span id="__span-0-267"><a id="__codelineno-0-267" name="__codelineno-0-267"></a>
+</span><span id="__span-0-268"><a id="__codelineno-0-268" name="__codelineno-0-268"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a><span class="sd">        df: The dataframe to be deduplicated.</span>
+</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a>
+</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a><span class="sd">        The deduplicated dataframe.</span>
+</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a>
+</span><span id="__span-0-275"><a id="__codelineno-0-275" name="__codelineno-0-275"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_columns</span><span class="p">(</span><span class="n">df</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">,</span> <span class="s2">&quot;TagOrigin&quot;</span><span class="p">])</span>
+</span><span id="__span-0-276"><a id="__codelineno-0-276" name="__codelineno-0-276"></a>    <span class="n">seen_tags</span> <span class="o">=</span> <span class="nb">set</span><span class="p">()</span>
+</span><span id="__span-0-277"><a id="__codelineno-0-277" name="__codelineno-0-277"></a>    <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">row</span> <span class="ow">in</span> <span class="n">df</span><span class="o">.</span><span class="n">iterrows</span><span class="p">():</span>
+</span><span id="__span-0-278"><a id="__codelineno-0-278" name="__codelineno-0-278"></a>        <span class="k">if</span> <span class="n">row</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span> <span class="ow">in</span> <span class="n">seen_tags</span><span class="p">:</span>
+</span><span id="__span-0-279"><a id="__codelineno-0-279" name="__codelineno-0-279"></a>            <span class="n">df</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">i</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">row</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span>
+</span><span id="__span-0-280"><a id="__codelineno-0-280" name="__codelineno-0-280"></a>            <span class="n">df</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">i</span><span class="p">,</span> <span class="s2">&quot;TagOrigin&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">TagOrigin</span><span class="o">.</span><span class="n">NAME</span>
+</span><span id="__span-0-281"><a id="__codelineno-0-281" name="__codelineno-0-281"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-282"><a id="__codelineno-0-282" name="__codelineno-0-282"></a>            <span class="n">seen_tags</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">row</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">])</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -3674,8 +3674,7 @@ <h3 id="logos.tag_utils.TagUtils.set_tag" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/tag_utils.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-283">283</a></span>
-<span class="normal"><a href="#__codelineno-0-284">284</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-284">284</a></span>
 <span class="normal"><a href="#__codelineno-0-285">285</a></span>
 <span class="normal"><a href="#__codelineno-0-286">286</a></span>
 <span class="normal"><a href="#__codelineno-0-287">287</a></span>
@@ -3693,26 +3692,27 @@ <h3 id="logos.tag_utils.TagUtils.set_tag" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-299">299</a></span>
 <span class="normal"><a href="#__codelineno-0-300">300</a></span>
 <span class="normal"><a href="#__codelineno-0-301">301</a></span>
-<span class="normal"><a href="#__codelineno-0-302">302</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-283"><a id="__codelineno-0-283" name="__codelineno-0-283"></a><span class="nd">@staticmethod</span>
-</span><span id="__span-0-284"><a id="__codelineno-0-284" name="__codelineno-0-284"></a><span class="k">def</span> <span class="nf">set_tag</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">tag</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">info</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-285"><a id="__codelineno-0-285" name="__codelineno-0-285"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-286"><a id="__codelineno-0-286" name="__codelineno-0-286"></a><span class="sd">    Tag a parsed or prepared variable for easier access.</span>
-</span><span id="__span-0-287"><a id="__codelineno-0-287" name="__codelineno-0-287"></a>
-</span><span id="__span-0-288"><a id="__codelineno-0-288" name="__codelineno-0-288"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-289"><a id="__codelineno-0-289" name="__codelineno-0-289"></a><span class="sd">        df: The dataframe containing the parsed or prepared variables.</span>
-</span><span id="__span-0-290"><a id="__codelineno-0-290" name="__codelineno-0-290"></a><span class="sd">        name: The name of the parsed or prepared variable.</span>
-</span><span id="__span-0-291"><a id="__codelineno-0-291" name="__codelineno-0-291"></a><span class="sd">        tag: The tag to be set.</span>
-</span><span id="__span-0-292"><a id="__codelineno-0-292" name="__codelineno-0-292"></a><span class="sd">        info: A string describing the type of variable being tagged (parsed or prepared).</span>
-</span><span id="__span-0-293"><a id="__codelineno-0-293" name="__codelineno-0-293"></a>
-</span><span id="__span-0-294"><a id="__codelineno-0-294" name="__codelineno-0-294"></a><span class="sd">    Raises:</span>
-</span><span id="__span-0-295"><a id="__codelineno-0-295" name="__codelineno-0-295"></a><span class="sd">        ValueError: If the name is not the name of a parsed or prepared variable.</span>
-</span><span id="__span-0-296"><a id="__codelineno-0-296" name="__codelineno-0-296"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-297"><a id="__codelineno-0-297" name="__codelineno-0-297"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_columns</span><span class="p">(</span><span class="n">df</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">])</span>
-</span><span id="__span-0-298"><a id="__codelineno-0-298" name="__codelineno-0-298"></a>    <span class="k">if</span> <span class="n">name</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">:</span>
-</span><span id="__span-0-299"><a id="__codelineno-0-299" name="__codelineno-0-299"></a>        <span class="n">df</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">name</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">tag</span>
-</span><span id="__span-0-300"><a id="__codelineno-0-300" name="__codelineno-0-300"></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Variable </span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> tagged as </span><span class="si">{</span><span class="n">tag</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="__span-0-301"><a id="__codelineno-0-301" name="__codelineno-0-301"></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-302"><a id="__codelineno-0-302" name="__codelineno-0-302"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> is not the name of a </span><span class="si">{</span><span class="n">info</span><span class="si">}</span><span class="s2"> variable.&quot;</span><span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-302">302</a></span>
+<span class="normal"><a href="#__codelineno-0-303">303</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-284"><a id="__codelineno-0-284" name="__codelineno-0-284"></a><span class="nd">@staticmethod</span>
+</span><span id="__span-0-285"><a id="__codelineno-0-285" name="__codelineno-0-285"></a><span class="k">def</span> <span class="nf">set_tag</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">tag</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">info</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-286"><a id="__codelineno-0-286" name="__codelineno-0-286"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-287"><a id="__codelineno-0-287" name="__codelineno-0-287"></a><span class="sd">    Tag a parsed or prepared variable for easier access.</span>
+</span><span id="__span-0-288"><a id="__codelineno-0-288" name="__codelineno-0-288"></a>
+</span><span id="__span-0-289"><a id="__codelineno-0-289" name="__codelineno-0-289"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-290"><a id="__codelineno-0-290" name="__codelineno-0-290"></a><span class="sd">        df: The dataframe containing the parsed or prepared variables.</span>
+</span><span id="__span-0-291"><a id="__codelineno-0-291" name="__codelineno-0-291"></a><span class="sd">        name: The name of the parsed or prepared variable.</span>
+</span><span id="__span-0-292"><a id="__codelineno-0-292" name="__codelineno-0-292"></a><span class="sd">        tag: The tag to be set.</span>
+</span><span id="__span-0-293"><a id="__codelineno-0-293" name="__codelineno-0-293"></a><span class="sd">        info: A string describing the type of variable being tagged (parsed or prepared).</span>
+</span><span id="__span-0-294"><a id="__codelineno-0-294" name="__codelineno-0-294"></a>
+</span><span id="__span-0-295"><a id="__codelineno-0-295" name="__codelineno-0-295"></a><span class="sd">    Raises:</span>
+</span><span id="__span-0-296"><a id="__codelineno-0-296" name="__codelineno-0-296"></a><span class="sd">        ValueError: If the name is not the name of a parsed or prepared variable.</span>
+</span><span id="__span-0-297"><a id="__codelineno-0-297" name="__codelineno-0-297"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-298"><a id="__codelineno-0-298" name="__codelineno-0-298"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_columns</span><span class="p">(</span><span class="n">df</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">])</span>
+</span><span id="__span-0-299"><a id="__codelineno-0-299" name="__codelineno-0-299"></a>    <span class="k">if</span> <span class="n">name</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">:</span>
+</span><span id="__span-0-300"><a id="__codelineno-0-300" name="__codelineno-0-300"></a>        <span class="n">df</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">name</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">tag</span>
+</span><span id="__span-0-301"><a id="__codelineno-0-301" name="__codelineno-0-301"></a>        <span class="n">Printer</span><span class="o">.</span><span class="n">printv</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Variable </span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> tagged as </span><span class="si">{</span><span class="n">tag</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-302"><a id="__codelineno-0-302" name="__codelineno-0-302"></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-303"><a id="__codelineno-0-303" name="__codelineno-0-303"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> is not the name of a </span><span class="si">{</span><span class="n">info</span><span class="si">}</span><span class="s2"> variable.&quot;</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -3818,8 +3818,7 @@ <h3 id="logos.tag_utils.TagUtils.get_tag" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/tag_utils.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-304">304</a></span>
-<span class="normal"><a href="#__codelineno-0-305">305</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-305">305</a></span>
 <span class="normal"><a href="#__codelineno-0-306">306</a></span>
 <span class="normal"><a href="#__codelineno-0-307">307</a></span>
 <span class="normal"><a href="#__codelineno-0-308">308</a></span>
@@ -3836,25 +3835,26 @@ <h3 id="logos.tag_utils.TagUtils.get_tag" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-319">319</a></span>
 <span class="normal"><a href="#__codelineno-0-320">320</a></span>
 <span class="normal"><a href="#__codelineno-0-321">321</a></span>
-<span class="normal"><a href="#__codelineno-0-322">322</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-304"><a id="__codelineno-0-304" name="__codelineno-0-304"></a><span class="nd">@staticmethod</span>
-</span><span id="__span-0-305"><a id="__codelineno-0-305" name="__codelineno-0-305"></a><span class="k">def</span> <span class="nf">get_tag</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">info</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-</span><span id="__span-0-306"><a id="__codelineno-0-306" name="__codelineno-0-306"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-307"><a id="__codelineno-0-307" name="__codelineno-0-307"></a><span class="sd">    Retrieve the tag of a parsed or prepared variable.</span>
-</span><span id="__span-0-308"><a id="__codelineno-0-308" name="__codelineno-0-308"></a>
-</span><span id="__span-0-309"><a id="__codelineno-0-309" name="__codelineno-0-309"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-310"><a id="__codelineno-0-310" name="__codelineno-0-310"></a><span class="sd">        df: The dataframe containing the parsed or prepared variables.</span>
-</span><span id="__span-0-311"><a id="__codelineno-0-311" name="__codelineno-0-311"></a><span class="sd">        name: The name of the parsed or prepared variable.</span>
-</span><span id="__span-0-312"><a id="__codelineno-0-312" name="__codelineno-0-312"></a><span class="sd">        info: A string describing the type of variable being tagged (parsed or prepared).</span>
-</span><span id="__span-0-313"><a id="__codelineno-0-313" name="__codelineno-0-313"></a>
-</span><span id="__span-0-314"><a id="__codelineno-0-314" name="__codelineno-0-314"></a><span class="sd">    Raises:</span>
-</span><span id="__span-0-315"><a id="__codelineno-0-315" name="__codelineno-0-315"></a><span class="sd">        ValueError: If the name is not the name of a parsed or prepared variable.</span>
-</span><span id="__span-0-316"><a id="__codelineno-0-316" name="__codelineno-0-316"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-317"><a id="__codelineno-0-317" name="__codelineno-0-317"></a>
-</span><span id="__span-0-318"><a id="__codelineno-0-318" name="__codelineno-0-318"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_columns</span><span class="p">(</span><span class="n">df</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">])</span>
-</span><span id="__span-0-319"><a id="__codelineno-0-319" name="__codelineno-0-319"></a>    <span class="k">if</span> <span class="n">name</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">:</span>
-</span><span id="__span-0-320"><a id="__codelineno-0-320" name="__codelineno-0-320"></a>        <span class="k">return</span> <span class="n">df</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">name</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-321"><a id="__codelineno-0-321" name="__codelineno-0-321"></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-322"><a id="__codelineno-0-322" name="__codelineno-0-322"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> is not the name of a </span><span class="si">{</span><span class="n">info</span><span class="si">}</span><span class="s2"> variable.&quot;</span><span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-322">322</a></span>
+<span class="normal"><a href="#__codelineno-0-323">323</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-305"><a id="__codelineno-0-305" name="__codelineno-0-305"></a><span class="nd">@staticmethod</span>
+</span><span id="__span-0-306"><a id="__codelineno-0-306" name="__codelineno-0-306"></a><span class="k">def</span> <span class="nf">get_tag</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">info</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-307"><a id="__codelineno-0-307" name="__codelineno-0-307"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-308"><a id="__codelineno-0-308" name="__codelineno-0-308"></a><span class="sd">    Retrieve the tag of a parsed or prepared variable.</span>
+</span><span id="__span-0-309"><a id="__codelineno-0-309" name="__codelineno-0-309"></a>
+</span><span id="__span-0-310"><a id="__codelineno-0-310" name="__codelineno-0-310"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-311"><a id="__codelineno-0-311" name="__codelineno-0-311"></a><span class="sd">        df: The dataframe containing the parsed or prepared variables.</span>
+</span><span id="__span-0-312"><a id="__codelineno-0-312" name="__codelineno-0-312"></a><span class="sd">        name: The name of the parsed or prepared variable.</span>
+</span><span id="__span-0-313"><a id="__codelineno-0-313" name="__codelineno-0-313"></a><span class="sd">        info: A string describing the type of variable being tagged (parsed or prepared).</span>
+</span><span id="__span-0-314"><a id="__codelineno-0-314" name="__codelineno-0-314"></a>
+</span><span id="__span-0-315"><a id="__codelineno-0-315" name="__codelineno-0-315"></a><span class="sd">    Raises:</span>
+</span><span id="__span-0-316"><a id="__codelineno-0-316" name="__codelineno-0-316"></a><span class="sd">        ValueError: If the name is not the name of a parsed or prepared variable.</span>
+</span><span id="__span-0-317"><a id="__codelineno-0-317" name="__codelineno-0-317"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-318"><a id="__codelineno-0-318" name="__codelineno-0-318"></a>
+</span><span id="__span-0-319"><a id="__codelineno-0-319" name="__codelineno-0-319"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_columns</span><span class="p">(</span><span class="n">df</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">])</span>
+</span><span id="__span-0-320"><a id="__codelineno-0-320" name="__codelineno-0-320"></a>    <span class="k">if</span> <span class="n">name</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">:</span>
+</span><span id="__span-0-321"><a id="__codelineno-0-321" name="__codelineno-0-321"></a>        <span class="k">return</span> <span class="n">df</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">name</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-322"><a id="__codelineno-0-322" name="__codelineno-0-322"></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-323"><a id="__codelineno-0-323" name="__codelineno-0-323"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> is not the name of a </span><span class="si">{</span><span class="n">info</span><span class="si">}</span><span class="s2"> variable.&quot;</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -3960,8 +3960,7 @@ <h3 id="logos.tag_utils.TagUtils.name_of" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/tag_utils.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-324">324</a></span>
-<span class="normal"><a href="#__codelineno-0-325">325</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-325">325</a></span>
 <span class="normal"><a href="#__codelineno-0-326">326</a></span>
 <span class="normal"><a href="#__codelineno-0-327">327</a></span>
 <span class="normal"><a href="#__codelineno-0-328">328</a></span>
@@ -3983,30 +3982,31 @@ <h3 id="logos.tag_utils.TagUtils.name_of" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-344">344</a></span>
 <span class="normal"><a href="#__codelineno-0-345">345</a></span>
 <span class="normal"><a href="#__codelineno-0-346">346</a></span>
-<span class="normal"><a href="#__codelineno-0-347">347</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-324"><a id="__codelineno-0-324" name="__codelineno-0-324"></a><span class="nd">@staticmethod</span>
-</span><span id="__span-0-325"><a id="__codelineno-0-325" name="__codelineno-0-325"></a><span class="k">def</span> <span class="nf">name_of</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">name_or_tag</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">info</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-</span><span id="__span-0-326"><a id="__codelineno-0-326" name="__codelineno-0-326"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-327"><a id="__codelineno-0-327" name="__codelineno-0-327"></a><span class="sd">    Determine the name of a parsed or prepared variable, given either itself or its tag.</span>
-</span><span id="__span-0-328"><a id="__codelineno-0-328" name="__codelineno-0-328"></a>
-</span><span id="__span-0-329"><a id="__codelineno-0-329" name="__codelineno-0-329"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-330"><a id="__codelineno-0-330" name="__codelineno-0-330"></a><span class="sd">        df: The dataframe containing the parsed or prepared variables.</span>
-</span><span id="__span-0-331"><a id="__codelineno-0-331" name="__codelineno-0-331"></a><span class="sd">        name_or_tag: The name or tag of the parsed or prepared variable.</span>
-</span><span id="__span-0-332"><a id="__codelineno-0-332" name="__codelineno-0-332"></a><span class="sd">        info: A string describing the type of variable in question (parsed or prepared).</span>
-</span><span id="__span-0-333"><a id="__codelineno-0-333" name="__codelineno-0-333"></a>
-</span><span id="__span-0-334"><a id="__codelineno-0-334" name="__codelineno-0-334"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-335"><a id="__codelineno-0-335" name="__codelineno-0-335"></a><span class="sd">        The name of the parsed or prepared variable.</span>
-</span><span id="__span-0-336"><a id="__codelineno-0-336" name="__codelineno-0-336"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-337"><a id="__codelineno-0-337" name="__codelineno-0-337"></a>
-</span><span id="__span-0-338"><a id="__codelineno-0-338" name="__codelineno-0-338"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_columns</span><span class="p">(</span><span class="n">df</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">])</span>
-</span><span id="__span-0-339"><a id="__codelineno-0-339" name="__codelineno-0-339"></a>    <span class="n">name_or_tag</span> <span class="o">=</span> <span class="n">name_or_tag</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
-</span><span id="__span-0-340"><a id="__codelineno-0-340" name="__codelineno-0-340"></a>    <span class="k">if</span> <span class="n">name_or_tag</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">:</span>
-</span><span id="__span-0-341"><a id="__codelineno-0-341" name="__codelineno-0-341"></a>        <span class="k">return</span> <span class="n">name_or_tag</span>
-</span><span id="__span-0-342"><a id="__codelineno-0-342" name="__codelineno-0-342"></a>    <span class="k">elif</span> <span class="n">name_or_tag</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">:</span>
-</span><span id="__span-0-343"><a id="__codelineno-0-343" name="__codelineno-0-343"></a>        <span class="k">return</span> <span class="n">df</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">df</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">name_or_tag</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-344"><a id="__codelineno-0-344" name="__codelineno-0-344"></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-345"><a id="__codelineno-0-345" name="__codelineno-0-345"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
-</span><span id="__span-0-346"><a id="__codelineno-0-346" name="__codelineno-0-346"></a>            <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name_or_tag</span><span class="si">}</span><span class="s2"> is not the name or tag of a </span><span class="si">{</span><span class="n">info</span><span class="si">}</span><span class="s2"> variable.&quot;</span>
-</span><span id="__span-0-347"><a id="__codelineno-0-347" name="__codelineno-0-347"></a>        <span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-347">347</a></span>
+<span class="normal"><a href="#__codelineno-0-348">348</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-325"><a id="__codelineno-0-325" name="__codelineno-0-325"></a><span class="nd">@staticmethod</span>
+</span><span id="__span-0-326"><a id="__codelineno-0-326" name="__codelineno-0-326"></a><span class="k">def</span> <span class="nf">name_of</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">name_or_tag</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">info</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-327"><a id="__codelineno-0-327" name="__codelineno-0-327"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-328"><a id="__codelineno-0-328" name="__codelineno-0-328"></a><span class="sd">    Determine the name of a parsed or prepared variable, given either itself or its tag.</span>
+</span><span id="__span-0-329"><a id="__codelineno-0-329" name="__codelineno-0-329"></a>
+</span><span id="__span-0-330"><a id="__codelineno-0-330" name="__codelineno-0-330"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-331"><a id="__codelineno-0-331" name="__codelineno-0-331"></a><span class="sd">        df: The dataframe containing the parsed or prepared variables.</span>
+</span><span id="__span-0-332"><a id="__codelineno-0-332" name="__codelineno-0-332"></a><span class="sd">        name_or_tag: The name or tag of the parsed or prepared variable.</span>
+</span><span id="__span-0-333"><a id="__codelineno-0-333" name="__codelineno-0-333"></a><span class="sd">        info: A string describing the type of variable in question (parsed or prepared).</span>
+</span><span id="__span-0-334"><a id="__codelineno-0-334" name="__codelineno-0-334"></a>
+</span><span id="__span-0-335"><a id="__codelineno-0-335" name="__codelineno-0-335"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-336"><a id="__codelineno-0-336" name="__codelineno-0-336"></a><span class="sd">        The name of the parsed or prepared variable.</span>
+</span><span id="__span-0-337"><a id="__codelineno-0-337" name="__codelineno-0-337"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-338"><a id="__codelineno-0-338" name="__codelineno-0-338"></a>
+</span><span id="__span-0-339"><a id="__codelineno-0-339" name="__codelineno-0-339"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_columns</span><span class="p">(</span><span class="n">df</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">])</span>
+</span><span id="__span-0-340"><a id="__codelineno-0-340" name="__codelineno-0-340"></a>    <span class="n">name_or_tag</span> <span class="o">=</span> <span class="n">name_or_tag</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
+</span><span id="__span-0-341"><a id="__codelineno-0-341" name="__codelineno-0-341"></a>    <span class="k">if</span> <span class="n">name_or_tag</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">:</span>
+</span><span id="__span-0-342"><a id="__codelineno-0-342" name="__codelineno-0-342"></a>        <span class="k">return</span> <span class="n">name_or_tag</span>
+</span><span id="__span-0-343"><a id="__codelineno-0-343" name="__codelineno-0-343"></a>    <span class="k">elif</span> <span class="n">name_or_tag</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">:</span>
+</span><span id="__span-0-344"><a id="__codelineno-0-344" name="__codelineno-0-344"></a>        <span class="k">return</span> <span class="n">df</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">df</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">name_or_tag</span><span class="p">,</span> <span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-345"><a id="__codelineno-0-345" name="__codelineno-0-345"></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-346"><a id="__codelineno-0-346" name="__codelineno-0-346"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+</span><span id="__span-0-347"><a id="__codelineno-0-347" name="__codelineno-0-347"></a>            <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name_or_tag</span><span class="si">}</span><span class="s2"> is not the name or tag of a </span><span class="si">{</span><span class="n">info</span><span class="si">}</span><span class="s2"> variable.&quot;</span>
+</span><span id="__span-0-348"><a id="__codelineno-0-348" name="__codelineno-0-348"></a>        <span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -4113,8 +4113,7 @@ <h3 id="logos.tag_utils.TagUtils.tag_of" class="doc doc-heading">
 
             <details class="quote">
               <summary>Source code in <code>src/logos/tag_utils.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-349">349</a></span>
-<span class="normal"><a href="#__codelineno-0-350">350</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-350">350</a></span>
 <span class="normal"><a href="#__codelineno-0-351">351</a></span>
 <span class="normal"><a href="#__codelineno-0-352">352</a></span>
 <span class="normal"><a href="#__codelineno-0-353">353</a></span>
@@ -4140,34 +4139,35 @@ <h3 id="logos.tag_utils.TagUtils.tag_of" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-373">373</a></span>
 <span class="normal"><a href="#__codelineno-0-374">374</a></span>
 <span class="normal"><a href="#__codelineno-0-375">375</a></span>
-<span class="normal"><a href="#__codelineno-0-376">376</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-349"><a id="__codelineno-0-349" name="__codelineno-0-349"></a><span class="nd">@staticmethod</span>
-</span><span id="__span-0-350"><a id="__codelineno-0-350" name="__codelineno-0-350"></a><span class="k">def</span> <span class="nf">tag_of</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">name_or_tag</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">info</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]:</span>
-</span><span id="__span-0-351"><a id="__codelineno-0-351" name="__codelineno-0-351"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-352"><a id="__codelineno-0-352" name="__codelineno-0-352"></a><span class="sd">    Determine the tag of a parsed or prepared variable, given either itself or its name.</span>
-</span><span id="__span-0-353"><a id="__codelineno-0-353" name="__codelineno-0-353"></a><span class="sd">    Retuirn None if the variable is None.</span>
-</span><span id="__span-0-354"><a id="__codelineno-0-354" name="__codelineno-0-354"></a>
-</span><span id="__span-0-355"><a id="__codelineno-0-355" name="__codelineno-0-355"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-356"><a id="__codelineno-0-356" name="__codelineno-0-356"></a><span class="sd">        df: The dataframe containing the parsed or prepared variables.</span>
-</span><span id="__span-0-357"><a id="__codelineno-0-357" name="__codelineno-0-357"></a><span class="sd">        name_or_tag: The name or tag of the parsed or prepared variable.</span>
-</span><span id="__span-0-358"><a id="__codelineno-0-358" name="__codelineno-0-358"></a><span class="sd">        info: A string describing the type of variable in question (parsed or prepared).</span>
-</span><span id="__span-0-359"><a id="__codelineno-0-359" name="__codelineno-0-359"></a>
-</span><span id="__span-0-360"><a id="__codelineno-0-360" name="__codelineno-0-360"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-361"><a id="__codelineno-0-361" name="__codelineno-0-361"></a><span class="sd">        The tag of the parsed or prepared variable.</span>
-</span><span id="__span-0-362"><a id="__codelineno-0-362" name="__codelineno-0-362"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-363"><a id="__codelineno-0-363" name="__codelineno-0-363"></a>
-</span><span id="__span-0-364"><a id="__codelineno-0-364" name="__codelineno-0-364"></a>    <span class="k">if</span> <span class="n">name_or_tag</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-365"><a id="__codelineno-0-365" name="__codelineno-0-365"></a>        <span class="k">return</span> <span class="kc">None</span>
-</span><span id="__span-0-366"><a id="__codelineno-0-366" name="__codelineno-0-366"></a>
-</span><span id="__span-0-367"><a id="__codelineno-0-367" name="__codelineno-0-367"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_columns</span><span class="p">(</span><span class="n">df</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">])</span>
-</span><span id="__span-0-368"><a id="__codelineno-0-368" name="__codelineno-0-368"></a>    <span class="n">name_or_tag</span> <span class="o">=</span> <span class="n">name_or_tag</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
-</span><span id="__span-0-369"><a id="__codelineno-0-369" name="__codelineno-0-369"></a>    <span class="k">if</span> <span class="n">name_or_tag</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">:</span>
-</span><span id="__span-0-370"><a id="__codelineno-0-370" name="__codelineno-0-370"></a>        <span class="k">return</span> <span class="n">name_or_tag</span>
-</span><span id="__span-0-371"><a id="__codelineno-0-371" name="__codelineno-0-371"></a>    <span class="k">elif</span> <span class="n">name_or_tag</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">:</span>
-</span><span id="__span-0-372"><a id="__codelineno-0-372" name="__codelineno-0-372"></a>        <span class="k">return</span> <span class="n">df</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">name_or_tag</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-373"><a id="__codelineno-0-373" name="__codelineno-0-373"></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-374"><a id="__codelineno-0-374" name="__codelineno-0-374"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
-</span><span id="__span-0-375"><a id="__codelineno-0-375" name="__codelineno-0-375"></a>            <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name_or_tag</span><span class="si">}</span><span class="s2"> is not the name or tag of a </span><span class="si">{</span><span class="n">info</span><span class="si">}</span><span class="s2"> variable.&quot;</span>
-</span><span id="__span-0-376"><a id="__codelineno-0-376" name="__codelineno-0-376"></a>        <span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-376">376</a></span>
+<span class="normal"><a href="#__codelineno-0-377">377</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-350"><a id="__codelineno-0-350" name="__codelineno-0-350"></a><span class="nd">@staticmethod</span>
+</span><span id="__span-0-351"><a id="__codelineno-0-351" name="__codelineno-0-351"></a><span class="k">def</span> <span class="nf">tag_of</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">name_or_tag</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">info</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]:</span>
+</span><span id="__span-0-352"><a id="__codelineno-0-352" name="__codelineno-0-352"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-353"><a id="__codelineno-0-353" name="__codelineno-0-353"></a><span class="sd">    Determine the tag of a parsed or prepared variable, given either itself or its name.</span>
+</span><span id="__span-0-354"><a id="__codelineno-0-354" name="__codelineno-0-354"></a><span class="sd">    Retuirn None if the variable is None.</span>
+</span><span id="__span-0-355"><a id="__codelineno-0-355" name="__codelineno-0-355"></a>
+</span><span id="__span-0-356"><a id="__codelineno-0-356" name="__codelineno-0-356"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-357"><a id="__codelineno-0-357" name="__codelineno-0-357"></a><span class="sd">        df: The dataframe containing the parsed or prepared variables.</span>
+</span><span id="__span-0-358"><a id="__codelineno-0-358" name="__codelineno-0-358"></a><span class="sd">        name_or_tag: The name or tag of the parsed or prepared variable.</span>
+</span><span id="__span-0-359"><a id="__codelineno-0-359" name="__codelineno-0-359"></a><span class="sd">        info: A string describing the type of variable in question (parsed or prepared).</span>
+</span><span id="__span-0-360"><a id="__codelineno-0-360" name="__codelineno-0-360"></a>
+</span><span id="__span-0-361"><a id="__codelineno-0-361" name="__codelineno-0-361"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-362"><a id="__codelineno-0-362" name="__codelineno-0-362"></a><span class="sd">        The tag of the parsed or prepared variable.</span>
+</span><span id="__span-0-363"><a id="__codelineno-0-363" name="__codelineno-0-363"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-364"><a id="__codelineno-0-364" name="__codelineno-0-364"></a>
+</span><span id="__span-0-365"><a id="__codelineno-0-365" name="__codelineno-0-365"></a>    <span class="k">if</span> <span class="n">name_or_tag</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-366"><a id="__codelineno-0-366" name="__codelineno-0-366"></a>        <span class="k">return</span> <span class="kc">None</span>
+</span><span id="__span-0-367"><a id="__codelineno-0-367" name="__codelineno-0-367"></a>
+</span><span id="__span-0-368"><a id="__codelineno-0-368" name="__codelineno-0-368"></a>    <span class="n">TagUtils</span><span class="o">.</span><span class="n">check_columns</span><span class="p">(</span><span class="n">df</span><span class="p">,</span> <span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">])</span>
+</span><span id="__span-0-369"><a id="__codelineno-0-369" name="__codelineno-0-369"></a>    <span class="n">name_or_tag</span> <span class="o">=</span> <span class="n">name_or_tag</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
+</span><span id="__span-0-370"><a id="__codelineno-0-370" name="__codelineno-0-370"></a>    <span class="k">if</span> <span class="n">name_or_tag</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;Tag&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">:</span>
+</span><span id="__span-0-371"><a id="__codelineno-0-371" name="__codelineno-0-371"></a>        <span class="k">return</span> <span class="n">name_or_tag</span>
+</span><span id="__span-0-372"><a id="__codelineno-0-372" name="__codelineno-0-372"></a>    <span class="k">elif</span> <span class="n">name_or_tag</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">:</span>
+</span><span id="__span-0-373"><a id="__codelineno-0-373" name="__codelineno-0-373"></a>        <span class="k">return</span> <span class="n">df</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">df</span><span class="p">[</span><span class="s2">&quot;Name&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="n">name_or_tag</span><span class="p">,</span> <span class="s2">&quot;Tag&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-374"><a id="__codelineno-0-374" name="__codelineno-0-374"></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-375"><a id="__codelineno-0-375" name="__codelineno-0-375"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+</span><span id="__span-0-376"><a id="__codelineno-0-376" name="__codelineno-0-376"></a>            <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name_or_tag</span><span class="si">}</span><span class="s2"> is not the name or tag of a </span><span class="si">{</span><span class="n">info</span><span class="si">}</span><span class="s2"> variable.&quot;</span>
+</span><span id="__span-0-377"><a id="__codelineno-0-377" name="__codelineno-0-377"></a>        <span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
diff --git a/search/search_index.json b/search/search_index.json
index 5a1e5b7..ea667ab 100644
--- a/search/search_index.json
+++ b/search/search_index.json
@@ -1 +1 @@
-{"config":{"lang":["en"],"separator":"[\\s\\-]+","pipeline":["stopWordFilter"]},"docs":[{"location":"","title":"LOGos","text":"<p>Utilizing system logs to perform causal analysis.</p>"},{"location":"#demo","title":"Demo","text":"<p>You can find a quick demo of the LOGos API at demo.ipynb. </p>"},{"location":"#documentation","title":"Documentation","text":"<p>To view the documentation, run <code>mkdocs serve</code> from the root of this repo and open the corresponding page. </p> <p>You might need to install the following packages: <code>pip install mkdocs-material mkdocs-gen-files mkdocs-literate-nav markdown_include pymdown-extensions markdown mkdocs-pymdownx Pygments mkdocs-jupyter mkdocstrings-python mkdocstrings mdx_include</code></p>"},{"location":"#openai-integration","title":"OpenAI integration","text":"<p>If you use the LLM-powered capabilites of LOGos, please add a <code>.env</code> file to the root of this repo and define <code>OPENAI_API_KEY</code> appropriately.</p>"},{"location":"reference/SUMMARY/","title":"SUMMARY","text":"<ul> <li>logos<ul> <li>aggimp<ul> <li>agg_funcs</li> <li>imp_funcs</li> </ul> </li> <li>aggregate_selector</li> <li>ate_calculator</li> <li>candidate_cause_ranker</li> <li>causal_discoverer</li> <li>causal_unit_suggester</li> <li>clustering_params</li> <li>drain</li> <li>edge_occurrence_tree</li> <li>edge_state_matrix</li> <li>graph_renderer</li> <li>interactive_causal_graph_refiner</li> <li>logos</li> <li>pickler</li> <li>printer</li> <li>pruner</li> <li>regression</li> <li>tag_utils</li> <li>types</li> <li>variable_name<ul> <li>parsed_variable_name</li> <li>prepared_variable_name</li> </ul> </li> </ul> </li> </ul>"},{"location":"reference/logos/","title":"Index","text":""},{"location":"reference/logos/aggregate_selector/","title":"AggregateSelector","text":""},{"location":"reference/logos/aggregate_selector/#logos.aggregate_selector.AggregateSelector","title":"<code>AggregateSelector</code>","text":"Source code in <code>src/logos/aggregate_selector.py</code> <pre><code>class AggregateSelector:\n    DEFAULT_AGGREGATES = {\n        \"num\": [\n            \"mean\",\n            \"max\",\n            \"min\",\n        ],\n        \"str\": [\n            \"last\",\n            \"mode\",\n            \"first\",\n        ],\n    }\n\n    def _entropy(col: pd.Series) -&gt; float:\n        \"\"\"\n        Calculates the entropy of a column.\n\n        Parameters:\n            col: The column for which to calculate the entropy.\n\n        Returns:\n            The entropy of `col`.\n        \"\"\"\n\n        rel_value_counts = col.value_counts(normalize=True)\n        if rel_value_counts.empty:\n            return 0\n        return -np.sum(rel_value_counts * np.log2(rel_value_counts))\n\n    def find_uninformative_aggregates(\n        prepared_log: pd.DataFrame, parsed_variables: pd.DataFrame, causal_unit_var: str\n    ) -&gt; list[str]:\n        \"\"\"\n        Find aggregates that are uninformative for each column in `prepared_log`.\n        Aggregates are uninformative unless they maximize the empirical entropy across causal units.\n\n        Parameters:\n            prepared_log: The prepared log.\n            parsed_variables: The parsed variables.\n            causal_unit_var: The name of the causal unit variable.\n\n        Returns:\n            A list of uninformative aggregates for `prepared_log`.\n        \"\"\"\n\n        drop_list = []\n\n        for row in parsed_variables.itertuples():\n            aggs = row.Aggregates\n            if len(aggs) == 0 or row.Name == causal_unit_var:\n                continue\n\n            vars = [f\"{row.Name}+{agg}\" for agg in aggs]\n            best_var = f\"{row.Name}+{AggregateSelector.DEFAULT_AGGREGATES[row.Type][0]}\"\n            max_entropy = -np.inf\n\n            for var in vars:\n                entropy = AggregateSelector._entropy(prepared_log[var])\n\n                if entropy &gt; max_entropy:\n                    best_var = var\n                    max_entropy = entropy\n\n            drop_list.extend([var for var in vars if var != best_var])\n\n        return drop_list\n</code></pre>"},{"location":"reference/logos/aggregate_selector/#logos.aggregate_selector.AggregateSelector._entropy","title":"<code>_entropy(col)</code>","text":"<p>Calculates the entropy of a column.</p> <p>Parameters:</p> Name Type Description Default <code>col</code> <code>Series</code> <p>The column for which to calculate the entropy.</p> required <p>Returns:</p> Type Description <code>float</code> <p>The entropy of <code>col</code>.</p> Source code in <code>src/logos/aggregate_selector.py</code> <pre><code>def _entropy(col: pd.Series) -&gt; float:\n    \"\"\"\n    Calculates the entropy of a column.\n\n    Parameters:\n        col: The column for which to calculate the entropy.\n\n    Returns:\n        The entropy of `col`.\n    \"\"\"\n\n    rel_value_counts = col.value_counts(normalize=True)\n    if rel_value_counts.empty:\n        return 0\n    return -np.sum(rel_value_counts * np.log2(rel_value_counts))\n</code></pre>"},{"location":"reference/logos/aggregate_selector/#logos.aggregate_selector.AggregateSelector.find_uninformative_aggregates","title":"<code>find_uninformative_aggregates(prepared_log, parsed_variables, causal_unit_var)</code>","text":"<p>Find aggregates that are uninformative for each column in <code>prepared_log</code>. Aggregates are uninformative unless they maximize the empirical entropy across causal units.</p> <p>Parameters:</p> Name Type Description Default <code>prepared_log</code> <code>DataFrame</code> <p>The prepared log.</p> required <code>parsed_variables</code> <code>DataFrame</code> <p>The parsed variables.</p> required <code>causal_unit_var</code> <code>str</code> <p>The name of the causal unit variable.</p> required <p>Returns:</p> Type Description <code>list[str]</code> <p>A list of uninformative aggregates for <code>prepared_log</code>.</p> Source code in <code>src/logos/aggregate_selector.py</code> <pre><code>def find_uninformative_aggregates(\n    prepared_log: pd.DataFrame, parsed_variables: pd.DataFrame, causal_unit_var: str\n) -&gt; list[str]:\n    \"\"\"\n    Find aggregates that are uninformative for each column in `prepared_log`.\n    Aggregates are uninformative unless they maximize the empirical entropy across causal units.\n\n    Parameters:\n        prepared_log: The prepared log.\n        parsed_variables: The parsed variables.\n        causal_unit_var: The name of the causal unit variable.\n\n    Returns:\n        A list of uninformative aggregates for `prepared_log`.\n    \"\"\"\n\n    drop_list = []\n\n    for row in parsed_variables.itertuples():\n        aggs = row.Aggregates\n        if len(aggs) == 0 or row.Name == causal_unit_var:\n            continue\n\n        vars = [f\"{row.Name}+{agg}\" for agg in aggs]\n        best_var = f\"{row.Name}+{AggregateSelector.DEFAULT_AGGREGATES[row.Type][0]}\"\n        max_entropy = -np.inf\n\n        for var in vars:\n            entropy = AggregateSelector._entropy(prepared_log[var])\n\n            if entropy &gt; max_entropy:\n                best_var = var\n                max_entropy = entropy\n\n        drop_list.extend([var for var in vars if var != best_var])\n\n    return drop_list\n</code></pre>"},{"location":"reference/logos/aggregate_selector/#logos.aggregate_selector.mean","title":"<code>mean(x)</code>","text":"<p>Calculates the mean of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the mean will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The mean of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def mean(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the mean of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the mean will be calculated.\n\n    Returns:\n        The mean of the series, or None if the series is all NA.\n    \"\"\"\n    return x.mean(skipna=True) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggregate_selector/#logos.aggregate_selector.min","title":"<code>min(x)</code>","text":"<p>Calculates the minimum of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the minimum will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The minimum of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def min(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the minimum of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the minimum will be calculated.\n\n    Returns:\n        The minimum of the series, or None if the series is all NA.\n    \"\"\"\n    return x.min(skipna=True) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggregate_selector/#logos.aggregate_selector.max","title":"<code>max(x)</code>","text":"<p>Calculates the maximum of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the maximum will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The maximum of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def max(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the maximum of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the maximum will be calculated.\n\n    Returns:\n        The maximum of the series, or None if the series is all NA.\n    \"\"\"\n    return x.max(skipna=True) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggregate_selector/#logos.aggregate_selector.median","title":"<code>median(x)</code>","text":"<p>Calculates the median of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the median will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The median of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def median(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the median of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the median will be calculated.\n\n    Returns:\n        The median of the series, or None if the series is all NA.\n    \"\"\"\n    return x.median(skipna=True) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggregate_selector/#logos.aggregate_selector.mode","title":"<code>mode(x)</code>","text":"<p>Calculates the mode of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the mode will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The mode of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def mode(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the mode of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the mode will be calculated.\n\n    Returns:\n        The mode of the series, or None if the series is all NA.\n    \"\"\"\n    return x.mode(dropna=True)[0] if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggregate_selector/#logos.aggregate_selector.std","title":"<code>std(x)</code>","text":"<p>Calculates the standard deviation of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the standard deviation will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The standard deviation of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def std(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the standard deviation of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the standard deviation will be calculated.\n\n    Returns:\n        The standard deviation of the series, or None if the series is all NA.\n    \"\"\"\n    return x.std(skipna=True) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggregate_selector/#logos.aggregate_selector.last","title":"<code>last(x)</code>","text":"<p>Returns the last non-NA value in a series.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the last non-NA value will be returned.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The last non-NA value of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def last(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Returns the last non-NA value in a series.\n\n    Parameters:\n        x: The series for which the last non-NA value will be returned.\n\n    Returns:\n        The last non-NA value of the series, or None if the series is all NA.\n    \"\"\"\n    return x.dropna().tail(1) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggregate_selector/#logos.aggregate_selector.first","title":"<code>first(x)</code>","text":"<p>Returns the first non-NA value in a series.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the first non-NA value will be returned.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The first non-NA value of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def first(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Returns the first non-NA value in a series.\n\n    Parameters:\n        x: The series for which the first non-NA value will be returned.\n\n    Returns:\n        The first non-NA value of the series, or None if the series is all NA.\n    \"\"\"\n    return x.dropna().head(1) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggregate_selector/#logos.aggregate_selector.sum","title":"<code>sum(x)</code>","text":"<p>Calculates the sum of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the sum will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The sum of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def sum(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the sum of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the sum will be calculated.\n\n    Returns:\n        The sum of the series, or None if the series is all NA.\n    \"\"\"\n    return x.sum(skipna=True) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/ate_calculator/","title":"ATECalculator","text":""},{"location":"reference/logos/ate_calculator/#logos.ate_calculator.ATECalculator","title":"<code>ATECalculator</code>","text":"<p>A class to calculate ATEs and determine the impact of adding/removing/reversing DAG edges on these calculations.</p> Source code in <code>src/logos/ate_calculator.py</code> <pre><code>class ATECalculator:\n    \"\"\"\n    A class to calculate ATEs and determine the impact of adding/removing/reversing DAG edges\n    on these calculations.\n    \"\"\"\n\n    @staticmethod\n    def get_ate_and_confidence(\n        data: pd.DataFrame,\n        vars: pd.DataFrame,\n        treatment: str,\n        outcome: str,\n        confounder: Optional[str] = None,\n        graph: Optional[nx.DiGraph] = None,\n        calculate_p_value: bool = True,\n        calculate_std_error: bool = True,\n        get_estimand: bool = False,\n    ) -&gt; dict[str, Any]:\n        \"\"\"\n        Calculate the ATE of `treatment` on `outcome`, alongside confidence measures.\n\n        Parameters:\n            treatment: The name or tag of the treatment variable.\n            outcome: The name or tag of the outcome variable.\n            confounder: The name or tag of a confounder variable. If specified, overrides the current partial\n                causal graph in favor of a three-node graph with `treatment`, `outcome` and `confounder`.\n            graph: The graph to be used for causal analysis. If not specified, a two-node graph with just\n                `treatment` and `outcome` is used.\n            calculate_p_value: Whether to calculate the P-value of the ATE.\n            calculate_std_error: Whether to calculate the standard error of the ATE.\n            get_estimand: Whether to return the estimand used to calculate the ATE, as part of the returned dictionary.\n\n        Returns:\n            A dictionary containing the ATE of `treatment` on `outcome`, alongside confidence measures. If\n            `get_estimand` is True, the estimand used to calculate the ATE is also returned.\n        \"\"\"\n\n        # If the user provided the tag of any variable, retrieve their names\n        treatment = TagUtils.name_of(vars, treatment, \"prepared\")\n        outcome = TagUtils.name_of(vars, outcome, \"prepared\")\n        if confounder is not None:\n            confounder = TagUtils.name_of(vars, confounder, \"prepared\")\n\n        # Should the effects be calculated based on the current partial causal graph,\n        # some other graph provided as a function parameter,\n        # or on an ad-hoc subset relevant for the question at hand?\n        if graph is None:\n            graph = nx.DiGraph()\n            graph.add_node(treatment)\n            graph.add_node(outcome)\n            graph.add_edge(treatment, outcome)\n\n            if confounder is not None:\n                graph.add_node(confounder)\n                graph.add_edge(confounder, outcome)\n                graph.add_edge(confounder, treatment)\n\n        # Use dowhy to get the ATE, P-value and standard error.\n        with open(\"/dev/null\", \"w+\") as f:\n            try:\n                with contextlib.redirect_stdout(f), contextlib.redirect_stderr(f):\n                    model = CausalModel(\n                        data=data[list(graph.nodes)],\n                        treatment=treatment,\n                        outcome=outcome,\n                        graph=nx.nx_pydot.to_pydot(graph).to_string(),\n                    )\n                    identified_estimand = model.identify_effect(\n                        proceed_when_unidentifiable=True\n                    )\n                    estimate = model.estimate_effect(\n                        identified_estimand,\n                        method_name=\"backdoor.linear_regression\",\n                        test_significance=True,\n                    )\n                    p_value = (\n                        estimate.test_stat_significance()[\"p_value\"].astype(float)[0]\n                        if calculate_p_value\n                        else None\n                    )\n                    stderr = (\n                        estimate.get_standard_error() if calculate_std_error else None\n                    )\n                    d = {\n                        \"ATE\": float(estimate.value),\n                        \"P-value\": p_value,\n                        \"Standard Error\": stderr,\n                    }\n                    if get_estimand:\n                        d[\"Estimand\"] = identified_estimand\n                    return d\n            except:\n                raise ValueError\n</code></pre>"},{"location":"reference/logos/ate_calculator/#logos.ate_calculator.ATECalculator.get_ate_and_confidence","title":"<code>get_ate_and_confidence(data, vars, treatment, outcome, confounder=None, graph=None, calculate_p_value=True, calculate_std_error=True, get_estimand=False)</code>  <code>staticmethod</code>","text":"<p>Calculate the ATE of <code>treatment</code> on <code>outcome</code>, alongside confidence measures.</p> <p>Parameters:</p> Name Type Description Default <code>treatment</code> <code>str</code> <p>The name or tag of the treatment variable.</p> required <code>outcome</code> <code>str</code> <p>The name or tag of the outcome variable.</p> required <code>confounder</code> <code>Optional[str]</code> <p>The name or tag of a confounder variable. If specified, overrides the current partial causal graph in favor of a three-node graph with <code>treatment</code>, <code>outcome</code> and <code>confounder</code>.</p> <code>None</code> <code>graph</code> <code>Optional[DiGraph]</code> <p>The graph to be used for causal analysis. If not specified, a two-node graph with just <code>treatment</code> and <code>outcome</code> is used.</p> <code>None</code> <code>calculate_p_value</code> <code>bool</code> <p>Whether to calculate the P-value of the ATE.</p> <code>True</code> <code>calculate_std_error</code> <code>bool</code> <p>Whether to calculate the standard error of the ATE.</p> <code>True</code> <code>get_estimand</code> <code>bool</code> <p>Whether to return the estimand used to calculate the ATE, as part of the returned dictionary.</p> <code>False</code> <p>Returns:</p> Type Description <code>dict[str, Any]</code> <p>A dictionary containing the ATE of <code>treatment</code> on <code>outcome</code>, alongside confidence measures. If</p> <code>dict[str, Any]</code> <p><code>get_estimand</code> is True, the estimand used to calculate the ATE is also returned.</p> Source code in <code>src/logos/ate_calculator.py</code> <pre><code>@staticmethod\ndef get_ate_and_confidence(\n    data: pd.DataFrame,\n    vars: pd.DataFrame,\n    treatment: str,\n    outcome: str,\n    confounder: Optional[str] = None,\n    graph: Optional[nx.DiGraph] = None,\n    calculate_p_value: bool = True,\n    calculate_std_error: bool = True,\n    get_estimand: bool = False,\n) -&gt; dict[str, Any]:\n    \"\"\"\n    Calculate the ATE of `treatment` on `outcome`, alongside confidence measures.\n\n    Parameters:\n        treatment: The name or tag of the treatment variable.\n        outcome: The name or tag of the outcome variable.\n        confounder: The name or tag of a confounder variable. If specified, overrides the current partial\n            causal graph in favor of a three-node graph with `treatment`, `outcome` and `confounder`.\n        graph: The graph to be used for causal analysis. If not specified, a two-node graph with just\n            `treatment` and `outcome` is used.\n        calculate_p_value: Whether to calculate the P-value of the ATE.\n        calculate_std_error: Whether to calculate the standard error of the ATE.\n        get_estimand: Whether to return the estimand used to calculate the ATE, as part of the returned dictionary.\n\n    Returns:\n        A dictionary containing the ATE of `treatment` on `outcome`, alongside confidence measures. If\n        `get_estimand` is True, the estimand used to calculate the ATE is also returned.\n    \"\"\"\n\n    # If the user provided the tag of any variable, retrieve their names\n    treatment = TagUtils.name_of(vars, treatment, \"prepared\")\n    outcome = TagUtils.name_of(vars, outcome, \"prepared\")\n    if confounder is not None:\n        confounder = TagUtils.name_of(vars, confounder, \"prepared\")\n\n    # Should the effects be calculated based on the current partial causal graph,\n    # some other graph provided as a function parameter,\n    # or on an ad-hoc subset relevant for the question at hand?\n    if graph is None:\n        graph = nx.DiGraph()\n        graph.add_node(treatment)\n        graph.add_node(outcome)\n        graph.add_edge(treatment, outcome)\n\n        if confounder is not None:\n            graph.add_node(confounder)\n            graph.add_edge(confounder, outcome)\n            graph.add_edge(confounder, treatment)\n\n    # Use dowhy to get the ATE, P-value and standard error.\n    with open(\"/dev/null\", \"w+\") as f:\n        try:\n            with contextlib.redirect_stdout(f), contextlib.redirect_stderr(f):\n                model = CausalModel(\n                    data=data[list(graph.nodes)],\n                    treatment=treatment,\n                    outcome=outcome,\n                    graph=nx.nx_pydot.to_pydot(graph).to_string(),\n                )\n                identified_estimand = model.identify_effect(\n                    proceed_when_unidentifiable=True\n                )\n                estimate = model.estimate_effect(\n                    identified_estimand,\n                    method_name=\"backdoor.linear_regression\",\n                    test_significance=True,\n                )\n                p_value = (\n                    estimate.test_stat_significance()[\"p_value\"].astype(float)[0]\n                    if calculate_p_value\n                    else None\n                )\n                stderr = (\n                    estimate.get_standard_error() if calculate_std_error else None\n                )\n                d = {\n                    \"ATE\": float(estimate.value),\n                    \"P-value\": p_value,\n                    \"Standard Error\": stderr,\n                }\n                if get_estimand:\n                    d[\"Estimand\"] = identified_estimand\n                return d\n        except:\n            raise ValueError\n</code></pre>"},{"location":"reference/logos/candidate_cause_ranker/","title":"CandidateCauseRanker","text":""},{"location":"reference/logos/candidate_cause_ranker/#logos.candidate_cause_ranker.CandidateCauseRanker","title":"<code>CandidateCauseRanker</code>","text":"Source code in <code>src/logos/candidate_cause_ranker.py</code> <pre><code>class CandidateCauseRanker:\n    COLUMN_ORDER = [\n        \"Candidate\",\n        \"Candidate Tag\",\n        \"Target Tag\",\n        \"Slope\",\n        \"P-value\",\n        \"Candidate-&gt;Target Edge Status\",\n        \"Target-&gt;Candidate Edge Status\",\n    ]\n\n    INTERNAL_COLUMN_ORDER = [\n        \"Candidate\",\n        \"Candidate Tag\",\n        \"Target Tag\",\n        \"Slope\",\n        \"P-value\",\n    ]\n\n    @staticmethod\n    def rank(\n        data: pd.DataFrame,\n        data_tags_df: pd.DataFrame = None,\n        target_name: Optional[str] = None,\n        ignore: Optional[list[str]] = None,\n        method: CandidateCauseRankerMethod = CandidateCauseRankerMethod.LOGOS,\n        prune_candidates: bool = True,\n        lasso_alpha: float = Pruner.LASSO_DEFAULT_ALPHA,\n        lasso_max_iter: int = Pruner.LASSO_DEFAULT_MAX_ITER,\n        model: str = \"gpt-4o-mini-2024-07-18\",\n        gpt_log_path: Optional[str] = None,\n    ) -&gt; Tuple[pd.DataFrame, list[str]]:\n        \"\"\"\n        Present the user with candidate causal graph neighbors for `target`. If no `target`\n        is specified, the most recent suggestion of `suggest_next_exploration()` is used, if any.\n        If `ignore` is specified, the variables in `ignore` are not considered as candidate causes.\n\n        Parameters:\n            data: The data based on which to explore candidate causes.\n            data_tags_df: A dataframe containing tags for the data.\n            target_name: The name of the target variable.\n            ignore: A list of variables to ignore.\n            method: The method to use for ranking candidate causes.\n            prune_candidates: Whether to prune the candidate causes using Lasso regression. Only\n                applies if `method` is `CandidateCauseRankerMethod.LOGOS`.\n            lasso_alpha: The alpha parameter to be used for Lasso regression. Only applies if\n                `method` is `CandidateCauseRankerMethod.LOGOS` and `prune_candidates` is True.\n            lasso_max_iter: The maximum number of iterations to be used for Lasso regression. Only\n                applies if `method` is `CandidateCauseRankerMethod.LOGOS` and `prune_candidates` is True.\n            model: The model to use for the langmodel method. Only applies if the method is\n                `CandidateCauseRankerMethod.LANGMODEL`.\n            gpt_log_path: The path to the log file for the prompt and reply. Only applies if the\n                method is `CandidateCauseRankerMethod.LANGMODEL`.\n\n        Returns:\n            results_df: A dataframe containing the candidate causal graph neighbors for `target`\n            pruned: A list of pruned candidate causes, if any.\n        \"\"\"\n        if ignore is None:\n            ignore = []\n        non_ignore = [col for col in data.columns if col not in ignore]\n\n        if method == CandidateCauseRankerMethod.LOGOS:\n            return CandidateCauseRanker._rank_logos(\n                data[non_ignore],\n                data_tags_df,\n                target_name,\n                prune_candidates,\n                lasso_alpha,\n                lasso_max_iter,\n            )\n        elif method == CandidateCauseRankerMethod.REGRESSION:\n            return CandidateCauseRanker._rank_regression(data[non_ignore], data_tags_df, target_name)\n        elif method == CandidateCauseRankerMethod.LANGMODEL:\n            return CandidateCauseRanker._rank_langmodel(\n                data[non_ignore], data_tags_df, target_name, model, gpt_log_path\n            )\n        else:\n            raise ValueError(f\"Unknown method: {method}\")\n\n    @staticmethod\n    def _rank_logos(\n        data: pd.DataFrame,\n        data_tags_df: pd.DataFrame = None,\n        target_name: Optional[str] = None,\n        prune_candidates: bool = True,\n        lasso_alpha: float = Pruner.LASSO_DEFAULT_ALPHA,\n        lasso_max_iter: int = Pruner.LASSO_DEFAULT_MAX_ITER,\n    ) -&gt; Tuple[pd.DataFrame, list[str]]:\n        \"\"\"\n        Implement `rank()` for the LOGOS method.\n\n        Parameters:\n            data: The data based on which to explore candidate causes.\n            data_tags_df: A dataframe containing tags for the data.\n            target_name: The name of the target variable.\n            prune_candidates: Whether to prune the candidate causes using Lasso regression.\n            lasso_alpha: The alpha parameter to be used for Lasso regression.\n            lasso_max_iter: The maximum number of iterations to be used for Lasso regression.\n\n        Returns:\n            results_df: A dataframe containing the candidate causal graph neighbors for `target`\n            pruned: A list of pruned candidate causes, if any.\n        \"\"\"\n\n        # Use Lasso to get a pruned list of neighbors\n        candidates = (\n            Pruner.prune_with_lasso(\n                data,\n                [target_name],\n                alpha=lasso_alpha,\n                max_iter=lasso_max_iter,\n            )\n            if prune_candidates\n            else [c for c in data.columns if c != target_name]\n        )\n        Printer.printv(f\"Candidates: {candidates}\")\n\n        # Stop if there are no candidates\n        if len(candidates) == 0:\n            print(\"No candidates found.\")\n            return pd.DataFrame(columns=CandidateCauseRanker.COLUMN_ORDER), pruned\n\n        # For each candidate, calculate the slope and p-value of a linear regression with target (in parallel)\n        num_processors = multiprocessing.cpu_count()\n        with multiprocessing.Pool(processes=num_processors) as pool:\n            results = pool.starmap(\n                Regression.ols,\n                [(col, data[col], data[target_name]) for col in candidates],\n            )\n\n        # Prepare return values.\n        result_df = (\n            pd.DataFrame(results)\n            .sort_values(by=\"P-value\", ascending=True)\n            .reset_index(drop=True)\n        )\n        result_df[\"Target Tag\"] = TagUtils.tag_of(data_tags_df, target_name, \"prepared\")\n        result_df[\"Candidate Tag\"] = result_df[\"Candidate\"].apply(\n            lambda x: TagUtils.tag_of(data_tags_df, x, \"prepared\")\n        )\n        result_df = result_df[CandidateCauseRanker.INTERNAL_COLUMN_ORDER]\n\n        pruned = set(data.columns) - set(candidates) - set([target_name])\n\n        return result_df, pruned\n\n    @staticmethod\n    def _rank_regression(\n        data: pd.DataFrame,\n        data_tags_df: pd.DataFrame = None,\n        target_name: Optional[str] = None,\n    ) -&gt; Tuple[pd.DataFrame, list[str]]:\n        \"\"\"\n        Implement `rank()` for the REGRESSION method.\n\n        Parameters:\n            data: The data based on which to explore candidate causes.\n            data_tags_df: A dataframe containing tags for the data.\n            target_name: The name of the target variable.\n\n        Returns:\n            results_df: A dataframe containing the candidate causal graph neighbors for `target`\n            pruned: A list of pruned candidate causes, if any. #TODO: Prune based on cutoff?\n        \"\"\"\n\n        candidates = [c for c in data.columns if c != target_name]\n        result_df = Regression.multi_ols(\n            candidates, data[candidates], data[target_name]\n        )\n        result_df = (\n            result_df.sort_values(by=\"Absolute Normalized Slope\", ascending=False)\n            .drop(columns=[\"Normalized Slope\", \"Absolute Normalized Slope\"])\n            .reset_index(drop=True)\n        )\n\n        result_df[\"Target Tag\"] = TagUtils.tag_of(data_tags_df, target_name, \"prepared\")\n        result_df[\"Candidate Tag\"] = result_df[\"Candidate\"].apply(\n            lambda x: TagUtils.tag_of(data_tags_df, x, \"prepared\")\n        )\n        result_df = result_df[CandidateCauseRanker.INTERNAL_COLUMN_ORDER]\n\n        return result_df, []\n\n    @staticmethod\n    def _rank_langmodel(\n        data: pd.DataFrame,\n        data_tags_df: pd.DataFrame = None,\n        target_name: Optional[str] = None,\n        model: str = \"gpt-4o-mini-2024-07-18\",\n        gpt_log_path: Optional[str] = None,\n    ) -&gt; Tuple[pd.DataFrame, list[str]]:\n        \"\"\"\n        Implement `rank()` for the LANGMODEL method.\n\n        Parameters:\n            data: The data based on which to explore candidate causes.\n            data_tags_df: A dataframe containing tags for the data.\n            target_name: The name of the target variable.\n            model: The model to use for the langmodel method.\n            gpt_log_path: The path to the log file for the prompt and reply.\n\n        Returns:\n            results_df: A dataframe containing the candidate causal graph neighbors for `target`\n            pruned: A list of pruned candidate causes, if any.\n        \"\"\"\n\n        client = OpenAI()\n\n        target_tag = TagUtils.tag_of(data_tags_df, target_name, \"prepared\")\n        num_samples_per_var = 3\n\n        if gpt_log_path == None:\n            gpt_log_path = f\"ranker-gpt-{datetime.now().strftime('%Y-%m-%d-%H-%M-%S')}.log\"\n        with open(gpt_log_path, \"w+\") as f:\n\n            # Define the messages to send to the model\n            messages = [\n                {\n                    \"role\": \"system\",\n                    \"content\": \"You are a helpful assistant for causal reasoning.\",\n                },\n                {\n                    \"role\": \"user\",\n                    \"content\": f\"\"\"Below is a list of variable names and some example distinct values for each. \"\"\"\n                    f\"\"\"The lists are not sorted in compatible ways, so that elements in the same position may not correspond to the same entity. \"\"\"\n                    f\"\"\"I want you to assess the likelihood of each of these variables as a cause for variable '{target_tag}' and return them as a ranked list. \"\"\"\n                    \"\"\"I understand that you may think this is speculative, but I want you to do your best to come up with such a list ALWAYS. \"\"\"\n                    \"\"\"I will interpret any results you give me knowing that you may not be sure about them. \"\"\"\n                    \"\"\"Only return the ranked answers, one per line, preceded by a number and a period. Rank as many of the given variables as you see fit,\"\"\"\n                    f\"\"\" except '{target_tag}' itself. Do not return any other text before or after the list.\"\"\"\n                    \"\"\"Here are the variables: \"\"\"\n                    f\"\"\"{', '.join([f'{TagUtils.tag_of(data_tags_df, v, \"prepared\")}: [{\", \".join(str(x) for x in data[v].unique().tolist()[:num_samples_per_var])}]' for v in data.columns])}\"\"\",\n                },\n            ]\n\n            reply = (\n                client.chat.completions.create(model=model, messages=messages)\n                .choices[0]\n                .message.content\n            )\n\n            # Log the messages and the reply\n            f.write(f\"{datetime.now()}\\n\")\n            f.write(\"Messages:\\n\")\n            for message in messages:\n                f.write(f\"{message['role']}: {message['content']}\\n\")\n            f.write(\"----------------\\n\")\n            f.write(f\"Reply: {reply}\\n\\n\")\n            f.write(\"================\\n\")\n            f.flush()\n            f.close()\n\n        # Combat hallucinations\n        reply_rows = reply.split(\"\\n\")\n        reply_rows = [row for row in reply_rows if row.strip() != \"\" and row[0].isdigit()]\n        possibly_candidate_tags = [\".\".join(row.split(\".\")[1:]).split(':')[0].strip() for row in reply_rows]\n        candidate_tags = [tag for tag in possibly_candidate_tags if tag in data_tags_df['Tag'].values]\n\n        d = {\n            \"Candidate Tag\": candidate_tags,\n            \"Slope\": [None for _ in range(len(candidate_tags))],\n            \"P-value\": [None for _ in range(len(candidate_tags))],\n        }\n        result_df = pd.DataFrame(d)\n        result_df[\"Target Tag\"] = TagUtils.tag_of(data_tags_df, target_name, \"prepared\")\n        result_df[\"Candidate\"] = result_df[\"Candidate Tag\"].apply(\n            lambda x: TagUtils.name_of(data_tags_df, x.split(':')[0], \"prepared\")\n        )\n        result_df = result_df[CandidateCauseRanker.INTERNAL_COLUMN_ORDER]\n\n        pruned = set(data.columns) - set(result_df[\"Candidate\"]) - set([target_name])\n\n        return result_df, pruned\n</code></pre>"},{"location":"reference/logos/candidate_cause_ranker/#logos.candidate_cause_ranker.CandidateCauseRanker.rank","title":"<code>rank(data, data_tags_df=None, target_name=None, ignore=None, method=CandidateCauseRankerMethod.LOGOS, prune_candidates=True, lasso_alpha=Pruner.LASSO_DEFAULT_ALPHA, lasso_max_iter=Pruner.LASSO_DEFAULT_MAX_ITER, model='gpt-4o-mini-2024-07-18', gpt_log_path=None)</code>  <code>staticmethod</code>","text":"<p>Present the user with candidate causal graph neighbors for <code>target</code>. If no <code>target</code> is specified, the most recent suggestion of <code>suggest_next_exploration()</code> is used, if any. If <code>ignore</code> is specified, the variables in <code>ignore</code> are not considered as candidate causes.</p> <p>Parameters:</p> Name Type Description Default <code>data</code> <code>DataFrame</code> <p>The data based on which to explore candidate causes.</p> required <code>data_tags_df</code> <code>DataFrame</code> <p>A dataframe containing tags for the data.</p> <code>None</code> <code>target_name</code> <code>Optional[str]</code> <p>The name of the target variable.</p> <code>None</code> <code>ignore</code> <code>Optional[list[str]]</code> <p>A list of variables to ignore.</p> <code>None</code> <code>method</code> <code>CandidateCauseRankerMethod</code> <p>The method to use for ranking candidate causes.</p> <code>LOGOS</code> <code>prune_candidates</code> <code>bool</code> <p>Whether to prune the candidate causes using Lasso regression. Only applies if <code>method</code> is <code>CandidateCauseRankerMethod.LOGOS</code>.</p> <code>True</code> <code>lasso_alpha</code> <code>float</code> <p>The alpha parameter to be used for Lasso regression. Only applies if <code>method</code> is <code>CandidateCauseRankerMethod.LOGOS</code> and <code>prune_candidates</code> is True.</p> <code>LASSO_DEFAULT_ALPHA</code> <code>lasso_max_iter</code> <code>int</code> <p>The maximum number of iterations to be used for Lasso regression. Only applies if <code>method</code> is <code>CandidateCauseRankerMethod.LOGOS</code> and <code>prune_candidates</code> is True.</p> <code>LASSO_DEFAULT_MAX_ITER</code> <code>model</code> <code>str</code> <p>The model to use for the langmodel method. Only applies if the method is <code>CandidateCauseRankerMethod.LANGMODEL</code>.</p> <code>'gpt-4o-mini-2024-07-18'</code> <code>gpt_log_path</code> <code>Optional[str]</code> <p>The path to the log file for the prompt and reply. Only applies if the method is <code>CandidateCauseRankerMethod.LANGMODEL</code>.</p> <code>None</code> <p>Returns:</p> Name Type Description <code>results_df</code> <code>DataFrame</code> <p>A dataframe containing the candidate causal graph neighbors for <code>target</code></p> <code>pruned</code> <code>list[str]</code> <p>A list of pruned candidate causes, if any.</p> Source code in <code>src/logos/candidate_cause_ranker.py</code> <pre><code>@staticmethod\ndef rank(\n    data: pd.DataFrame,\n    data_tags_df: pd.DataFrame = None,\n    target_name: Optional[str] = None,\n    ignore: Optional[list[str]] = None,\n    method: CandidateCauseRankerMethod = CandidateCauseRankerMethod.LOGOS,\n    prune_candidates: bool = True,\n    lasso_alpha: float = Pruner.LASSO_DEFAULT_ALPHA,\n    lasso_max_iter: int = Pruner.LASSO_DEFAULT_MAX_ITER,\n    model: str = \"gpt-4o-mini-2024-07-18\",\n    gpt_log_path: Optional[str] = None,\n) -&gt; Tuple[pd.DataFrame, list[str]]:\n    \"\"\"\n    Present the user with candidate causal graph neighbors for `target`. If no `target`\n    is specified, the most recent suggestion of `suggest_next_exploration()` is used, if any.\n    If `ignore` is specified, the variables in `ignore` are not considered as candidate causes.\n\n    Parameters:\n        data: The data based on which to explore candidate causes.\n        data_tags_df: A dataframe containing tags for the data.\n        target_name: The name of the target variable.\n        ignore: A list of variables to ignore.\n        method: The method to use for ranking candidate causes.\n        prune_candidates: Whether to prune the candidate causes using Lasso regression. Only\n            applies if `method` is `CandidateCauseRankerMethod.LOGOS`.\n        lasso_alpha: The alpha parameter to be used for Lasso regression. Only applies if\n            `method` is `CandidateCauseRankerMethod.LOGOS` and `prune_candidates` is True.\n        lasso_max_iter: The maximum number of iterations to be used for Lasso regression. Only\n            applies if `method` is `CandidateCauseRankerMethod.LOGOS` and `prune_candidates` is True.\n        model: The model to use for the langmodel method. Only applies if the method is\n            `CandidateCauseRankerMethod.LANGMODEL`.\n        gpt_log_path: The path to the log file for the prompt and reply. Only applies if the\n            method is `CandidateCauseRankerMethod.LANGMODEL`.\n\n    Returns:\n        results_df: A dataframe containing the candidate causal graph neighbors for `target`\n        pruned: A list of pruned candidate causes, if any.\n    \"\"\"\n    if ignore is None:\n        ignore = []\n    non_ignore = [col for col in data.columns if col not in ignore]\n\n    if method == CandidateCauseRankerMethod.LOGOS:\n        return CandidateCauseRanker._rank_logos(\n            data[non_ignore],\n            data_tags_df,\n            target_name,\n            prune_candidates,\n            lasso_alpha,\n            lasso_max_iter,\n        )\n    elif method == CandidateCauseRankerMethod.REGRESSION:\n        return CandidateCauseRanker._rank_regression(data[non_ignore], data_tags_df, target_name)\n    elif method == CandidateCauseRankerMethod.LANGMODEL:\n        return CandidateCauseRanker._rank_langmodel(\n            data[non_ignore], data_tags_df, target_name, model, gpt_log_path\n        )\n    else:\n        raise ValueError(f\"Unknown method: {method}\")\n</code></pre>"},{"location":"reference/logos/candidate_cause_ranker/#logos.candidate_cause_ranker.CandidateCauseRanker._rank_logos","title":"<code>_rank_logos(data, data_tags_df=None, target_name=None, prune_candidates=True, lasso_alpha=Pruner.LASSO_DEFAULT_ALPHA, lasso_max_iter=Pruner.LASSO_DEFAULT_MAX_ITER)</code>  <code>staticmethod</code>","text":"<p>Implement <code>rank()</code> for the LOGOS method.</p> <p>Parameters:</p> Name Type Description Default <code>data</code> <code>DataFrame</code> <p>The data based on which to explore candidate causes.</p> required <code>data_tags_df</code> <code>DataFrame</code> <p>A dataframe containing tags for the data.</p> <code>None</code> <code>target_name</code> <code>Optional[str]</code> <p>The name of the target variable.</p> <code>None</code> <code>prune_candidates</code> <code>bool</code> <p>Whether to prune the candidate causes using Lasso regression.</p> <code>True</code> <code>lasso_alpha</code> <code>float</code> <p>The alpha parameter to be used for Lasso regression.</p> <code>LASSO_DEFAULT_ALPHA</code> <code>lasso_max_iter</code> <code>int</code> <p>The maximum number of iterations to be used for Lasso regression.</p> <code>LASSO_DEFAULT_MAX_ITER</code> <p>Returns:</p> Name Type Description <code>results_df</code> <code>DataFrame</code> <p>A dataframe containing the candidate causal graph neighbors for <code>target</code></p> <code>pruned</code> <code>list[str]</code> <p>A list of pruned candidate causes, if any.</p> Source code in <code>src/logos/candidate_cause_ranker.py</code> <pre><code>@staticmethod\ndef _rank_logos(\n    data: pd.DataFrame,\n    data_tags_df: pd.DataFrame = None,\n    target_name: Optional[str] = None,\n    prune_candidates: bool = True,\n    lasso_alpha: float = Pruner.LASSO_DEFAULT_ALPHA,\n    lasso_max_iter: int = Pruner.LASSO_DEFAULT_MAX_ITER,\n) -&gt; Tuple[pd.DataFrame, list[str]]:\n    \"\"\"\n    Implement `rank()` for the LOGOS method.\n\n    Parameters:\n        data: The data based on which to explore candidate causes.\n        data_tags_df: A dataframe containing tags for the data.\n        target_name: The name of the target variable.\n        prune_candidates: Whether to prune the candidate causes using Lasso regression.\n        lasso_alpha: The alpha parameter to be used for Lasso regression.\n        lasso_max_iter: The maximum number of iterations to be used for Lasso regression.\n\n    Returns:\n        results_df: A dataframe containing the candidate causal graph neighbors for `target`\n        pruned: A list of pruned candidate causes, if any.\n    \"\"\"\n\n    # Use Lasso to get a pruned list of neighbors\n    candidates = (\n        Pruner.prune_with_lasso(\n            data,\n            [target_name],\n            alpha=lasso_alpha,\n            max_iter=lasso_max_iter,\n        )\n        if prune_candidates\n        else [c for c in data.columns if c != target_name]\n    )\n    Printer.printv(f\"Candidates: {candidates}\")\n\n    # Stop if there are no candidates\n    if len(candidates) == 0:\n        print(\"No candidates found.\")\n        return pd.DataFrame(columns=CandidateCauseRanker.COLUMN_ORDER), pruned\n\n    # For each candidate, calculate the slope and p-value of a linear regression with target (in parallel)\n    num_processors = multiprocessing.cpu_count()\n    with multiprocessing.Pool(processes=num_processors) as pool:\n        results = pool.starmap(\n            Regression.ols,\n            [(col, data[col], data[target_name]) for col in candidates],\n        )\n\n    # Prepare return values.\n    result_df = (\n        pd.DataFrame(results)\n        .sort_values(by=\"P-value\", ascending=True)\n        .reset_index(drop=True)\n    )\n    result_df[\"Target Tag\"] = TagUtils.tag_of(data_tags_df, target_name, \"prepared\")\n    result_df[\"Candidate Tag\"] = result_df[\"Candidate\"].apply(\n        lambda x: TagUtils.tag_of(data_tags_df, x, \"prepared\")\n    )\n    result_df = result_df[CandidateCauseRanker.INTERNAL_COLUMN_ORDER]\n\n    pruned = set(data.columns) - set(candidates) - set([target_name])\n\n    return result_df, pruned\n</code></pre>"},{"location":"reference/logos/candidate_cause_ranker/#logos.candidate_cause_ranker.CandidateCauseRanker._rank_regression","title":"<code>_rank_regression(data, data_tags_df=None, target_name=None)</code>  <code>staticmethod</code>","text":"<p>Implement <code>rank()</code> for the REGRESSION method.</p> <p>Parameters:</p> Name Type Description Default <code>data</code> <code>DataFrame</code> <p>The data based on which to explore candidate causes.</p> required <code>data_tags_df</code> <code>DataFrame</code> <p>A dataframe containing tags for the data.</p> <code>None</code> <code>target_name</code> <code>Optional[str]</code> <p>The name of the target variable.</p> <code>None</code> <p>Returns:</p> Name Type Description <code>results_df</code> <code>DataFrame</code> <p>A dataframe containing the candidate causal graph neighbors for <code>target</code></p> <code>pruned</code> <code>list[str]</code> <p>A list of pruned candidate causes, if any. #TODO: Prune based on cutoff?</p> Source code in <code>src/logos/candidate_cause_ranker.py</code> <pre><code>@staticmethod\ndef _rank_regression(\n    data: pd.DataFrame,\n    data_tags_df: pd.DataFrame = None,\n    target_name: Optional[str] = None,\n) -&gt; Tuple[pd.DataFrame, list[str]]:\n    \"\"\"\n    Implement `rank()` for the REGRESSION method.\n\n    Parameters:\n        data: The data based on which to explore candidate causes.\n        data_tags_df: A dataframe containing tags for the data.\n        target_name: The name of the target variable.\n\n    Returns:\n        results_df: A dataframe containing the candidate causal graph neighbors for `target`\n        pruned: A list of pruned candidate causes, if any. #TODO: Prune based on cutoff?\n    \"\"\"\n\n    candidates = [c for c in data.columns if c != target_name]\n    result_df = Regression.multi_ols(\n        candidates, data[candidates], data[target_name]\n    )\n    result_df = (\n        result_df.sort_values(by=\"Absolute Normalized Slope\", ascending=False)\n        .drop(columns=[\"Normalized Slope\", \"Absolute Normalized Slope\"])\n        .reset_index(drop=True)\n    )\n\n    result_df[\"Target Tag\"] = TagUtils.tag_of(data_tags_df, target_name, \"prepared\")\n    result_df[\"Candidate Tag\"] = result_df[\"Candidate\"].apply(\n        lambda x: TagUtils.tag_of(data_tags_df, x, \"prepared\")\n    )\n    result_df = result_df[CandidateCauseRanker.INTERNAL_COLUMN_ORDER]\n\n    return result_df, []\n</code></pre>"},{"location":"reference/logos/candidate_cause_ranker/#logos.candidate_cause_ranker.CandidateCauseRanker._rank_langmodel","title":"<code>_rank_langmodel(data, data_tags_df=None, target_name=None, model='gpt-4o-mini-2024-07-18', gpt_log_path=None)</code>  <code>staticmethod</code>","text":"<p>Implement <code>rank()</code> for the LANGMODEL method.</p> <p>Parameters:</p> Name Type Description Default <code>data</code> <code>DataFrame</code> <p>The data based on which to explore candidate causes.</p> required <code>data_tags_df</code> <code>DataFrame</code> <p>A dataframe containing tags for the data.</p> <code>None</code> <code>target_name</code> <code>Optional[str]</code> <p>The name of the target variable.</p> <code>None</code> <code>model</code> <code>str</code> <p>The model to use for the langmodel method.</p> <code>'gpt-4o-mini-2024-07-18'</code> <code>gpt_log_path</code> <code>Optional[str]</code> <p>The path to the log file for the prompt and reply.</p> <code>None</code> <p>Returns:</p> Name Type Description <code>results_df</code> <code>DataFrame</code> <p>A dataframe containing the candidate causal graph neighbors for <code>target</code></p> <code>pruned</code> <code>list[str]</code> <p>A list of pruned candidate causes, if any.</p> Source code in <code>src/logos/candidate_cause_ranker.py</code> <pre><code>@staticmethod\ndef _rank_langmodel(\n    data: pd.DataFrame,\n    data_tags_df: pd.DataFrame = None,\n    target_name: Optional[str] = None,\n    model: str = \"gpt-4o-mini-2024-07-18\",\n    gpt_log_path: Optional[str] = None,\n) -&gt; Tuple[pd.DataFrame, list[str]]:\n    \"\"\"\n    Implement `rank()` for the LANGMODEL method.\n\n    Parameters:\n        data: The data based on which to explore candidate causes.\n        data_tags_df: A dataframe containing tags for the data.\n        target_name: The name of the target variable.\n        model: The model to use for the langmodel method.\n        gpt_log_path: The path to the log file for the prompt and reply.\n\n    Returns:\n        results_df: A dataframe containing the candidate causal graph neighbors for `target`\n        pruned: A list of pruned candidate causes, if any.\n    \"\"\"\n\n    client = OpenAI()\n\n    target_tag = TagUtils.tag_of(data_tags_df, target_name, \"prepared\")\n    num_samples_per_var = 3\n\n    if gpt_log_path == None:\n        gpt_log_path = f\"ranker-gpt-{datetime.now().strftime('%Y-%m-%d-%H-%M-%S')}.log\"\n    with open(gpt_log_path, \"w+\") as f:\n\n        # Define the messages to send to the model\n        messages = [\n            {\n                \"role\": \"system\",\n                \"content\": \"You are a helpful assistant for causal reasoning.\",\n            },\n            {\n                \"role\": \"user\",\n                \"content\": f\"\"\"Below is a list of variable names and some example distinct values for each. \"\"\"\n                f\"\"\"The lists are not sorted in compatible ways, so that elements in the same position may not correspond to the same entity. \"\"\"\n                f\"\"\"I want you to assess the likelihood of each of these variables as a cause for variable '{target_tag}' and return them as a ranked list. \"\"\"\n                \"\"\"I understand that you may think this is speculative, but I want you to do your best to come up with such a list ALWAYS. \"\"\"\n                \"\"\"I will interpret any results you give me knowing that you may not be sure about them. \"\"\"\n                \"\"\"Only return the ranked answers, one per line, preceded by a number and a period. Rank as many of the given variables as you see fit,\"\"\"\n                f\"\"\" except '{target_tag}' itself. Do not return any other text before or after the list.\"\"\"\n                \"\"\"Here are the variables: \"\"\"\n                f\"\"\"{', '.join([f'{TagUtils.tag_of(data_tags_df, v, \"prepared\")}: [{\", \".join(str(x) for x in data[v].unique().tolist()[:num_samples_per_var])}]' for v in data.columns])}\"\"\",\n            },\n        ]\n\n        reply = (\n            client.chat.completions.create(model=model, messages=messages)\n            .choices[0]\n            .message.content\n        )\n\n        # Log the messages and the reply\n        f.write(f\"{datetime.now()}\\n\")\n        f.write(\"Messages:\\n\")\n        for message in messages:\n            f.write(f\"{message['role']}: {message['content']}\\n\")\n        f.write(\"----------------\\n\")\n        f.write(f\"Reply: {reply}\\n\\n\")\n        f.write(\"================\\n\")\n        f.flush()\n        f.close()\n\n    # Combat hallucinations\n    reply_rows = reply.split(\"\\n\")\n    reply_rows = [row for row in reply_rows if row.strip() != \"\" and row[0].isdigit()]\n    possibly_candidate_tags = [\".\".join(row.split(\".\")[1:]).split(':')[0].strip() for row in reply_rows]\n    candidate_tags = [tag for tag in possibly_candidate_tags if tag in data_tags_df['Tag'].values]\n\n    d = {\n        \"Candidate Tag\": candidate_tags,\n        \"Slope\": [None for _ in range(len(candidate_tags))],\n        \"P-value\": [None for _ in range(len(candidate_tags))],\n    }\n    result_df = pd.DataFrame(d)\n    result_df[\"Target Tag\"] = TagUtils.tag_of(data_tags_df, target_name, \"prepared\")\n    result_df[\"Candidate\"] = result_df[\"Candidate Tag\"].apply(\n        lambda x: TagUtils.name_of(data_tags_df, x.split(':')[0], \"prepared\")\n    )\n    result_df = result_df[CandidateCauseRanker.INTERNAL_COLUMN_ORDER]\n\n    pruned = set(data.columns) - set(result_df[\"Candidate\"]) - set([target_name])\n\n    return result_df, pruned\n</code></pre>"},{"location":"reference/logos/causal_discoverer/","title":"CausalDiscoverer","text":""},{"location":"reference/logos/causal_discoverer/#logos.causal_discoverer.CausalDiscoverer","title":"<code>CausalDiscoverer</code>","text":"<p>Provides various methods for automatic causal discovery based on a dataframe.</p> <p>Within LOGos, the expectation is that the passed dataframe will contain the prepared variables.</p> Source code in <code>src/logos/causal_discoverer.py</code> <pre><code>class CausalDiscoverer:\n    \"\"\"\n    Provides various methods for automatic causal discovery based on a dataframe.\n\n    Within LOGos, the expectation is that the passed dataframe will contain the prepared variables.\n    \"\"\"\n\n    @staticmethod\n    def _pgmpy_dag_to_digraph(dag: DAG) -&gt; nx.DiGraph:\n        \"\"\"\n        Converts a pgmpy DAG to a networkx DiGraph.\n\n        Parameters:\n            dag: The pgmpy DAG.\n\n        Returns:\n            The networkx DiGraph.\n        \"\"\"\n\n        return nx.DiGraph(dag.edges())\n\n    @staticmethod\n    def pc(df: pd.DataFrame, max_cond_vars: int = 3) -&gt; nx.DiGraph:\n        \"\"\"\n        Runs the PC algorithm on a dataframe.\n\n        Parameters:\n            df: The dataframe on which to run the PC algorithm.\n            max_cond_vars: The maximum number of conditioning variables to use.\n\n        Returns:\n            The causal graph learned by the PC algorithm.\n        \"\"\"\n\n        pc = PC(data=df)\n        model = pc.estimate(variant=\"parallel\", max_cond_vars=max_cond_vars)\n        return CausalDiscoverer._pgmpy_dag_to_digraph(model)\n\n    @staticmethod\n    def hill_climb(df: pd.DataFrame) -&gt; nx.DiGraph:\n        \"\"\"\n        Runs the hill climb algorithm on a dataframe.\n\n        Parameters:\n            df: The dataframe on which to run the hill climb algorithm.\n\n        Returns:\n            The causal graph learned by the hill climb algorithm.\n        \"\"\"\n\n        scoring_method = K2Score(data=df)\n        hcs = HillClimbSearch(data=df)\n        model = hcs.estimate(\n            scoring_method=scoring_method, max_indegree=4, max_iter=int(1e4)\n        )\n        return CausalDiscoverer._pgmpy_dag_to_digraph(model)\n\n    @staticmethod\n    def exhaustive(df: pd.DataFrame) -&gt; nx.DiGraph:\n        \"\"\"\n        Runs the exhaustive search algorithm on a dataframe.\n\n        Parameters:\n            df: The dataframe on which to run the exhaustive search algorithm.\n\n        Returns:\n            The causal graph learned by the exhaustive search algorithm.\n        \"\"\"\n\n        scoring_method = K2Score(data=df)\n        exh = ExhaustiveSearch(data=df, complete_samples_only=False)\n        model = exh.estimate()\n        return CausalDiscoverer._pgmpy_dag_to_digraph(model)\n\n    @staticmethod\n    def gpt(\n        data_df: pd.DataFrame,\n        model: str = \"gpt-3.5-turbo\",\n        vars_df: Optional[pd.DataFrame] = None,\n    ) -&gt; nx.DiGraph:\n        \"\"\"\n        Consults GPT to determine the causal graph of the variables in the dataframe.\n\n        Parameters:\n            data_df: The dataframe based on which to construct a causal graph.\n            model: The GPT model to use.\n            vars_df: The dataframe containing the variable names and tags.\n\n        Returns:\n            The causal graph learned by consulting GPT.\n        \"\"\"\n\n        # Open a file for logging, with the model and the timestamp in the name\n        log_file = open(\n            f\"/../../evaluation/gpt-logs/{model}-{datetime.now().strftime('%Y-%m-%d-%H-%M-%S')}.txt\",\n            \"w\",\n        )\n\n        client = OpenAI()\n        graph = nx.DiGraph()\n\n        for i in tqdm(\n            range(len(data_df.columns)), desc=\"Outer edge-finding loop using GPT...\"\n        ):\n            for j in range(i + 1, len(data_df.columns)):\n                var_a = data_df.columns[i]\n                var_b = data_df.columns[j]\n\n                example_rows = data_df[[var_a, var_b]].dropna().sample(3)\n                examples_a = \", \".join(str(x) for x in example_rows[var_a].tolist())\n                examples_b = \", \".join(str(x) for x in example_rows[var_b].tolist())\n\n                tag_a = (\n                    var_a\n                    if vars_df is None\n                    else TagUtils.get_tag(vars_df, var_a, \"prepared\")\n                )\n                tag_b = (\n                    var_b\n                    if vars_df is None\n                    else TagUtils.get_tag(vars_df, var_b, \"prepared\")\n                )\n\n                # Define the messages to send to the model\n                messages = [\n                    {\n                        \"role\": \"system\",\n                        \"content\": \"You are a helpful assistant for causal reasoning.\",\n                    },\n                    {\n                        \"role\": \"user\",\n                        \"content\": f\"\"\"Which cause-and-effect relationship is more likely? \"\"\"\n                        f\"\"\"A. changing {tag_a} causes a change in {tag_b}. \"\"\"\n                        f\"\"\"B. changing {tag_b} causes a change in {tag_a}. \"\"\"\n                        f\"\"\"C. Neither of the two. \"\"\"\n                        f\"\"\" Here are some example values of {tag_a} : [{examples_a}]\"\"\"\n                        f\"\"\" Here are the corresponding values of {tag_b} : [{examples_b}]\"\"\"\n                        \"\"\"Let's work this out in a step by step way to be sure that we have the right answer. \"\"\"\n                        \"\"\"Then provide your \ufb01nal answer within the tags &lt;Answer&gt;A/B/C&lt;/Answer&gt;.\"\"\",\n                    },\n                ]\n\n                reply = (\n                    client.chat.completions.create(model=model, messages=messages)\n                    .choices[0]\n                    .message.content\n                )\n\n                # Log the messages and the reply\n                log_file.write(f\"{datetime.now()}\\n\")\n                log_file.write(\"Messages:\\n\")\n                for message in messages:\n                    log_file.write(f\"{message['role']}: {message['content']}\\n\")\n                log_file.write(\"----------------\\n\")\n                log_file.write(f\"Reply: {reply}\\n\\n\")\n                log_file.write(\"================\\n\")\n                log_file.flush()\n\n                # Find the part of the reply that contains the answer\n                start_idx = reply.find(\"&lt;Answer&gt;\") + len(\"&lt;Answer&gt;\")\n                end_idx = reply.find(\"&lt;/Answer&gt;\")\n                answer = reply[start_idx:end_idx]\n\n                # Add the edge to the graph\n                if answer == \"A\":\n                    graph.add_edge(var_a, var_b)\n                elif answer == \"B\":\n                    graph.add_edge(var_b, var_a)\n        log_file.close()\n        return graph\n</code></pre>"},{"location":"reference/logos/causal_discoverer/#logos.causal_discoverer.CausalDiscoverer._pgmpy_dag_to_digraph","title":"<code>_pgmpy_dag_to_digraph(dag)</code>  <code>staticmethod</code>","text":"<p>Converts a pgmpy DAG to a networkx DiGraph.</p> <p>Parameters:</p> Name Type Description Default <code>dag</code> <code>DAG</code> <p>The pgmpy DAG.</p> required <p>Returns:</p> Type Description <code>DiGraph</code> <p>The networkx DiGraph.</p> Source code in <code>src/logos/causal_discoverer.py</code> <pre><code>@staticmethod\ndef _pgmpy_dag_to_digraph(dag: DAG) -&gt; nx.DiGraph:\n    \"\"\"\n    Converts a pgmpy DAG to a networkx DiGraph.\n\n    Parameters:\n        dag: The pgmpy DAG.\n\n    Returns:\n        The networkx DiGraph.\n    \"\"\"\n\n    return nx.DiGraph(dag.edges())\n</code></pre>"},{"location":"reference/logos/causal_discoverer/#logos.causal_discoverer.CausalDiscoverer.pc","title":"<code>pc(df, max_cond_vars=3)</code>  <code>staticmethod</code>","text":"<p>Runs the PC algorithm on a dataframe.</p> <p>Parameters:</p> Name Type Description Default <code>df</code> <code>DataFrame</code> <p>The dataframe on which to run the PC algorithm.</p> required <code>max_cond_vars</code> <code>int</code> <p>The maximum number of conditioning variables to use.</p> <code>3</code> <p>Returns:</p> Type Description <code>DiGraph</code> <p>The causal graph learned by the PC algorithm.</p> Source code in <code>src/logos/causal_discoverer.py</code> <pre><code>@staticmethod\ndef pc(df: pd.DataFrame, max_cond_vars: int = 3) -&gt; nx.DiGraph:\n    \"\"\"\n    Runs the PC algorithm on a dataframe.\n\n    Parameters:\n        df: The dataframe on which to run the PC algorithm.\n        max_cond_vars: The maximum number of conditioning variables to use.\n\n    Returns:\n        The causal graph learned by the PC algorithm.\n    \"\"\"\n\n    pc = PC(data=df)\n    model = pc.estimate(variant=\"parallel\", max_cond_vars=max_cond_vars)\n    return CausalDiscoverer._pgmpy_dag_to_digraph(model)\n</code></pre>"},{"location":"reference/logos/causal_discoverer/#logos.causal_discoverer.CausalDiscoverer.hill_climb","title":"<code>hill_climb(df)</code>  <code>staticmethod</code>","text":"<p>Runs the hill climb algorithm on a dataframe.</p> <p>Parameters:</p> Name Type Description Default <code>df</code> <code>DataFrame</code> <p>The dataframe on which to run the hill climb algorithm.</p> required <p>Returns:</p> Type Description <code>DiGraph</code> <p>The causal graph learned by the hill climb algorithm.</p> Source code in <code>src/logos/causal_discoverer.py</code> <pre><code>@staticmethod\ndef hill_climb(df: pd.DataFrame) -&gt; nx.DiGraph:\n    \"\"\"\n    Runs the hill climb algorithm on a dataframe.\n\n    Parameters:\n        df: The dataframe on which to run the hill climb algorithm.\n\n    Returns:\n        The causal graph learned by the hill climb algorithm.\n    \"\"\"\n\n    scoring_method = K2Score(data=df)\n    hcs = HillClimbSearch(data=df)\n    model = hcs.estimate(\n        scoring_method=scoring_method, max_indegree=4, max_iter=int(1e4)\n    )\n    return CausalDiscoverer._pgmpy_dag_to_digraph(model)\n</code></pre>"},{"location":"reference/logos/causal_discoverer/#logos.causal_discoverer.CausalDiscoverer.exhaustive","title":"<code>exhaustive(df)</code>  <code>staticmethod</code>","text":"<p>Runs the exhaustive search algorithm on a dataframe.</p> <p>Parameters:</p> Name Type Description Default <code>df</code> <code>DataFrame</code> <p>The dataframe on which to run the exhaustive search algorithm.</p> required <p>Returns:</p> Type Description <code>DiGraph</code> <p>The causal graph learned by the exhaustive search algorithm.</p> Source code in <code>src/logos/causal_discoverer.py</code> <pre><code>@staticmethod\ndef exhaustive(df: pd.DataFrame) -&gt; nx.DiGraph:\n    \"\"\"\n    Runs the exhaustive search algorithm on a dataframe.\n\n    Parameters:\n        df: The dataframe on which to run the exhaustive search algorithm.\n\n    Returns:\n        The causal graph learned by the exhaustive search algorithm.\n    \"\"\"\n\n    scoring_method = K2Score(data=df)\n    exh = ExhaustiveSearch(data=df, complete_samples_only=False)\n    model = exh.estimate()\n    return CausalDiscoverer._pgmpy_dag_to_digraph(model)\n</code></pre>"},{"location":"reference/logos/causal_discoverer/#logos.causal_discoverer.CausalDiscoverer.gpt","title":"<code>gpt(data_df, model='gpt-3.5-turbo', vars_df=None)</code>  <code>staticmethod</code>","text":"<p>Consults GPT to determine the causal graph of the variables in the dataframe.</p> <p>Parameters:</p> Name Type Description Default <code>data_df</code> <code>DataFrame</code> <p>The dataframe based on which to construct a causal graph.</p> required <code>model</code> <code>str</code> <p>The GPT model to use.</p> <code>'gpt-3.5-turbo'</code> <code>vars_df</code> <code>Optional[DataFrame]</code> <p>The dataframe containing the variable names and tags.</p> <code>None</code> <p>Returns:</p> Type Description <code>DiGraph</code> <p>The causal graph learned by consulting GPT.</p> Source code in <code>src/logos/causal_discoverer.py</code> <pre><code>@staticmethod\ndef gpt(\n    data_df: pd.DataFrame,\n    model: str = \"gpt-3.5-turbo\",\n    vars_df: Optional[pd.DataFrame] = None,\n) -&gt; nx.DiGraph:\n    \"\"\"\n    Consults GPT to determine the causal graph of the variables in the dataframe.\n\n    Parameters:\n        data_df: The dataframe based on which to construct a causal graph.\n        model: The GPT model to use.\n        vars_df: The dataframe containing the variable names and tags.\n\n    Returns:\n        The causal graph learned by consulting GPT.\n    \"\"\"\n\n    # Open a file for logging, with the model and the timestamp in the name\n    log_file = open(\n        f\"/../../evaluation/gpt-logs/{model}-{datetime.now().strftime('%Y-%m-%d-%H-%M-%S')}.txt\",\n        \"w\",\n    )\n\n    client = OpenAI()\n    graph = nx.DiGraph()\n\n    for i in tqdm(\n        range(len(data_df.columns)), desc=\"Outer edge-finding loop using GPT...\"\n    ):\n        for j in range(i + 1, len(data_df.columns)):\n            var_a = data_df.columns[i]\n            var_b = data_df.columns[j]\n\n            example_rows = data_df[[var_a, var_b]].dropna().sample(3)\n            examples_a = \", \".join(str(x) for x in example_rows[var_a].tolist())\n            examples_b = \", \".join(str(x) for x in example_rows[var_b].tolist())\n\n            tag_a = (\n                var_a\n                if vars_df is None\n                else TagUtils.get_tag(vars_df, var_a, \"prepared\")\n            )\n            tag_b = (\n                var_b\n                if vars_df is None\n                else TagUtils.get_tag(vars_df, var_b, \"prepared\")\n            )\n\n            # Define the messages to send to the model\n            messages = [\n                {\n                    \"role\": \"system\",\n                    \"content\": \"You are a helpful assistant for causal reasoning.\",\n                },\n                {\n                    \"role\": \"user\",\n                    \"content\": f\"\"\"Which cause-and-effect relationship is more likely? \"\"\"\n                    f\"\"\"A. changing {tag_a} causes a change in {tag_b}. \"\"\"\n                    f\"\"\"B. changing {tag_b} causes a change in {tag_a}. \"\"\"\n                    f\"\"\"C. Neither of the two. \"\"\"\n                    f\"\"\" Here are some example values of {tag_a} : [{examples_a}]\"\"\"\n                    f\"\"\" Here are the corresponding values of {tag_b} : [{examples_b}]\"\"\"\n                    \"\"\"Let's work this out in a step by step way to be sure that we have the right answer. \"\"\"\n                    \"\"\"Then provide your \ufb01nal answer within the tags &lt;Answer&gt;A/B/C&lt;/Answer&gt;.\"\"\",\n                },\n            ]\n\n            reply = (\n                client.chat.completions.create(model=model, messages=messages)\n                .choices[0]\n                .message.content\n            )\n\n            # Log the messages and the reply\n            log_file.write(f\"{datetime.now()}\\n\")\n            log_file.write(\"Messages:\\n\")\n            for message in messages:\n                log_file.write(f\"{message['role']}: {message['content']}\\n\")\n            log_file.write(\"----------------\\n\")\n            log_file.write(f\"Reply: {reply}\\n\\n\")\n            log_file.write(\"================\\n\")\n            log_file.flush()\n\n            # Find the part of the reply that contains the answer\n            start_idx = reply.find(\"&lt;Answer&gt;\") + len(\"&lt;Answer&gt;\")\n            end_idx = reply.find(\"&lt;/Answer&gt;\")\n            answer = reply[start_idx:end_idx]\n\n            # Add the edge to the graph\n            if answer == \"A\":\n                graph.add_edge(var_a, var_b)\n            elif answer == \"B\":\n                graph.add_edge(var_b, var_a)\n    log_file.close()\n    return graph\n</code></pre>"},{"location":"reference/logos/causal_unit_suggester/","title":"CausalUnitSuggester","text":""},{"location":"reference/logos/causal_unit_suggester/#logos.causal_unit_suggester.CausalUnitSuggester","title":"<code>CausalUnitSuggester</code>","text":"<p>This class is responsible for suggesting causal units to the user.</p> Source code in <code>src/logos/causal_unit_suggester.py</code> <pre><code>class CausalUnitSuggester:\n    \"\"\"\n    This class is responsible for suggesting causal units to the user.\n    \"\"\"\n\n    @staticmethod\n    def _discretize(col: pd.Series, col_type: str, bins: int = 0) -&gt; pd.Series:\n        \"\"\"\n        Discretize an unsorted `col` based on its type. If `col_type` is 'num', then\n        return labels for each of `bins` equi-depth bins. If `col_type` is 'str,\n        then return a unique label for each unique value. Nulls in `col` are assigned\n        to bin -1.\n\n        Parameters:\n            col: The column to discretize.\n            col_type: The type of the column.\n            bins: The number of bins to use when discretizing the column.\n\n        Returns:\n            A vector of length len(`col`) with the labels of each value in `col`.\n        \"\"\"\n        if col_type == \"num\":\n            return (\n                pd.qcut(col, bins, labels=False, duplicates=\"drop\")\n                .fillna(-1)\n                .astype(int)\n            )\n        elif col_type == \"str\":\n            return pd.factorize(col, use_na_sentinel=True)[0]\n        else:\n            raise ValueError(f\"Unknown column type: {col_type}\")\n\n    @staticmethod\n    def _get_all_discretizations(\n        col: pd.Series, col_type: str, k: int\n    ) -&gt; list[pd.Series]:\n        \"\"\"\n        Return a list of all possible discretizations of `col` based on its type.\n        If `col_type` is 'num', then return discretizations with `k`, `2k` and `10k` bins.\n        If `col_type` is 'str', then return a discretization with a unique label for\n        each unique value in `col`.\n\n        Parameters:\n            col: The column to discretize.\n            col_type: The type of the column.\n            k: A parameter indirectly controlling the number of bins to use when discretizing\n                a numeric column (see above).\n\n        Returns:\n            A list of all desired discretizations of `col`.\n        \"\"\"\n\n        if col_type == \"num\":\n            l = []\n            if len(col) &gt;= k:\n                l.append(CausalUnitSuggester._discretize(col, col_type, k))\n            if len(col) &gt;= 2 * k:\n                l.append(CausalUnitSuggester._discretize(col, col_type, 2 * k))\n            if len(col) &gt;= 10 * k:\n                l.append(CausalUnitSuggester._discretize(col, col_type, 10 * k))\n            return l\n        elif col_type == \"str\":\n            return [CausalUnitSuggester._discretize(col, col_type)]\n        else:\n            raise ValueError(f\"Unknown column type: {col_type}\")\n\n    @staticmethod\n    def _calculate_IUS(df: pd.DataFrame, discretization: pd.Series) -&gt; float:\n        \"\"\"\n        Calculate the Information Utilization Score of `df` if each row belongs\n        to the causal unit specified by `discretization`. The unit labelled -1\n        contails rows with null value for the causal unit column, so the corresponding\n        rows in `df` are ignored.\n\n        Parameters:\n            df: The DataFrame to calculate the Information Utilization Score of.\n            discretization: The causal unit of each row.\n\n        Returns:\n            The Information Utilization Score of `df`.\n        \"\"\"\n\n        grouped = df.groupby(discretization)  # TODO: handle nulls\n        ius = 0\n\n        for group_id, group_data in grouped:\n            if group_id == -1:\n                continue\n            columns_with_non_nulls = group_data.notna().any(axis=0).sum()\n            ius += columns_with_non_nulls * len(group_data)\n\n        return ius / (len(df.columns) * len(df))\n\n    @staticmethod\n    def suggest_causal_unit_defs(\n        data_df: pd.DataFrame,\n        var_df: pd.DataFrame,\n        min_causal_units: int = 4,\n        num_suggestions: int = 10,\n    ) -&gt; Optional[pd.DataFrame]:\n        \"\"\"\n        Suggest at most `num_suggestions` causal unit definitions for `data_df` based on ius\n        maximization, while returning at least `min_causal_units` causal units. `var_df` provides\n        information on the type of each variable.\n\n        Parameters:\n            data_df: The DataFrame to suggest causal unit definitions for.\n            var_df: A DataFrame with one row for each variable in `data_df` that includes variable type information.\n            min_causal_units: The minimum number of causal units that a suggested definition should create.\n            num_suggestions: The maximum number of causal unit definitions to suggest.\n\n        Returns:\n            A DataFrame with one row for each suggested causal unit definition, or `None` if no suggestions were made.\n        \"\"\"\n\n        list_of_suggestions = []\n\n        for col in data_df.columns:\n            discretizations = CausalUnitSuggester._get_all_discretizations(\n                data_df[col],\n                var_df[var_df[\"Name\"] == col][\"Type\"].values[0],\n                k=min_causal_units,\n            )\n            for disc in discretizations:\n                # Ensure that the unique values in disc, excluding -1 if it exists, are at least min_causal_units\n                if disc.max() &gt;= (min_causal_units - 1):\n                    list_of_suggestions.append(\n                        {\n                            \"Variable\": col,\n                            \"Type\": var_df[var_df[\"Name\"] == col][\"Type\"].values[0],\n                            \"Num Units\": disc.max() + 1,\n                            \"IUS\": CausalUnitSuggester._calculate_IUS(data_df, disc),\n                        }\n                    )\n\n        df_of_suggestions = pd.DataFrame(list_of_suggestions)\n        if len(df_of_suggestions) == 0:\n            return None\n        return df_of_suggestions.sort_values(by=[\"IUS\"], ascending=False).head(\n            num_suggestions\n        )\n</code></pre>"},{"location":"reference/logos/causal_unit_suggester/#logos.causal_unit_suggester.CausalUnitSuggester._discretize","title":"<code>_discretize(col, col_type, bins=0)</code>  <code>staticmethod</code>","text":"<p>Discretize an unsorted <code>col</code> based on its type. If <code>col_type</code> is 'num', then return labels for each of <code>bins</code> equi-depth bins. If <code>col_type</code> is 'str, then return a unique label for each unique value. Nulls in <code>col</code> are assigned to bin -1.</p> <p>Parameters:</p> Name Type Description Default <code>col</code> <code>Series</code> <p>The column to discretize.</p> required <code>col_type</code> <code>str</code> <p>The type of the column.</p> required <code>bins</code> <code>int</code> <p>The number of bins to use when discretizing the column.</p> <code>0</code> <p>Returns:</p> Type Description <code>Series</code> <p>A vector of length len(<code>col</code>) with the labels of each value in <code>col</code>.</p> Source code in <code>src/logos/causal_unit_suggester.py</code> <pre><code>@staticmethod\ndef _discretize(col: pd.Series, col_type: str, bins: int = 0) -&gt; pd.Series:\n    \"\"\"\n    Discretize an unsorted `col` based on its type. If `col_type` is 'num', then\n    return labels for each of `bins` equi-depth bins. If `col_type` is 'str,\n    then return a unique label for each unique value. Nulls in `col` are assigned\n    to bin -1.\n\n    Parameters:\n        col: The column to discretize.\n        col_type: The type of the column.\n        bins: The number of bins to use when discretizing the column.\n\n    Returns:\n        A vector of length len(`col`) with the labels of each value in `col`.\n    \"\"\"\n    if col_type == \"num\":\n        return (\n            pd.qcut(col, bins, labels=False, duplicates=\"drop\")\n            .fillna(-1)\n            .astype(int)\n        )\n    elif col_type == \"str\":\n        return pd.factorize(col, use_na_sentinel=True)[0]\n    else:\n        raise ValueError(f\"Unknown column type: {col_type}\")\n</code></pre>"},{"location":"reference/logos/causal_unit_suggester/#logos.causal_unit_suggester.CausalUnitSuggester._get_all_discretizations","title":"<code>_get_all_discretizations(col, col_type, k)</code>  <code>staticmethod</code>","text":"<p>Return a list of all possible discretizations of <code>col</code> based on its type. If <code>col_type</code> is 'num', then return discretizations with <code>k</code>, <code>2k</code> and <code>10k</code> bins. If <code>col_type</code> is 'str', then return a discretization with a unique label for each unique value in <code>col</code>.</p> <p>Parameters:</p> Name Type Description Default <code>col</code> <code>Series</code> <p>The column to discretize.</p> required <code>col_type</code> <code>str</code> <p>The type of the column.</p> required <code>k</code> <code>int</code> <p>A parameter indirectly controlling the number of bins to use when discretizing a numeric column (see above).</p> required <p>Returns:</p> Type Description <code>list[Series]</code> <p>A list of all desired discretizations of <code>col</code>.</p> Source code in <code>src/logos/causal_unit_suggester.py</code> <pre><code>@staticmethod\ndef _get_all_discretizations(\n    col: pd.Series, col_type: str, k: int\n) -&gt; list[pd.Series]:\n    \"\"\"\n    Return a list of all possible discretizations of `col` based on its type.\n    If `col_type` is 'num', then return discretizations with `k`, `2k` and `10k` bins.\n    If `col_type` is 'str', then return a discretization with a unique label for\n    each unique value in `col`.\n\n    Parameters:\n        col: The column to discretize.\n        col_type: The type of the column.\n        k: A parameter indirectly controlling the number of bins to use when discretizing\n            a numeric column (see above).\n\n    Returns:\n        A list of all desired discretizations of `col`.\n    \"\"\"\n\n    if col_type == \"num\":\n        l = []\n        if len(col) &gt;= k:\n            l.append(CausalUnitSuggester._discretize(col, col_type, k))\n        if len(col) &gt;= 2 * k:\n            l.append(CausalUnitSuggester._discretize(col, col_type, 2 * k))\n        if len(col) &gt;= 10 * k:\n            l.append(CausalUnitSuggester._discretize(col, col_type, 10 * k))\n        return l\n    elif col_type == \"str\":\n        return [CausalUnitSuggester._discretize(col, col_type)]\n    else:\n        raise ValueError(f\"Unknown column type: {col_type}\")\n</code></pre>"},{"location":"reference/logos/causal_unit_suggester/#logos.causal_unit_suggester.CausalUnitSuggester._calculate_IUS","title":"<code>_calculate_IUS(df, discretization)</code>  <code>staticmethod</code>","text":"<p>Calculate the Information Utilization Score of <code>df</code> if each row belongs to the causal unit specified by <code>discretization</code>. The unit labelled -1 contails rows with null value for the causal unit column, so the corresponding rows in <code>df</code> are ignored.</p> <p>Parameters:</p> Name Type Description Default <code>df</code> <code>DataFrame</code> <p>The DataFrame to calculate the Information Utilization Score of.</p> required <code>discretization</code> <code>Series</code> <p>The causal unit of each row.</p> required <p>Returns:</p> Type Description <code>float</code> <p>The Information Utilization Score of <code>df</code>.</p> Source code in <code>src/logos/causal_unit_suggester.py</code> <pre><code>@staticmethod\ndef _calculate_IUS(df: pd.DataFrame, discretization: pd.Series) -&gt; float:\n    \"\"\"\n    Calculate the Information Utilization Score of `df` if each row belongs\n    to the causal unit specified by `discretization`. The unit labelled -1\n    contails rows with null value for the causal unit column, so the corresponding\n    rows in `df` are ignored.\n\n    Parameters:\n        df: The DataFrame to calculate the Information Utilization Score of.\n        discretization: The causal unit of each row.\n\n    Returns:\n        The Information Utilization Score of `df`.\n    \"\"\"\n\n    grouped = df.groupby(discretization)  # TODO: handle nulls\n    ius = 0\n\n    for group_id, group_data in grouped:\n        if group_id == -1:\n            continue\n        columns_with_non_nulls = group_data.notna().any(axis=0).sum()\n        ius += columns_with_non_nulls * len(group_data)\n\n    return ius / (len(df.columns) * len(df))\n</code></pre>"},{"location":"reference/logos/causal_unit_suggester/#logos.causal_unit_suggester.CausalUnitSuggester.suggest_causal_unit_defs","title":"<code>suggest_causal_unit_defs(data_df, var_df, min_causal_units=4, num_suggestions=10)</code>  <code>staticmethod</code>","text":"<p>Suggest at most <code>num_suggestions</code> causal unit definitions for <code>data_df</code> based on ius maximization, while returning at least <code>min_causal_units</code> causal units. <code>var_df</code> provides information on the type of each variable.</p> <p>Parameters:</p> Name Type Description Default <code>data_df</code> <code>DataFrame</code> <p>The DataFrame to suggest causal unit definitions for.</p> required <code>var_df</code> <code>DataFrame</code> <p>A DataFrame with one row for each variable in <code>data_df</code> that includes variable type information.</p> required <code>min_causal_units</code> <code>int</code> <p>The minimum number of causal units that a suggested definition should create.</p> <code>4</code> <code>num_suggestions</code> <code>int</code> <p>The maximum number of causal unit definitions to suggest.</p> <code>10</code> <p>Returns:</p> Type Description <code>Optional[DataFrame]</code> <p>A DataFrame with one row for each suggested causal unit definition, or <code>None</code> if no suggestions were made.</p> Source code in <code>src/logos/causal_unit_suggester.py</code> <pre><code>@staticmethod\ndef suggest_causal_unit_defs(\n    data_df: pd.DataFrame,\n    var_df: pd.DataFrame,\n    min_causal_units: int = 4,\n    num_suggestions: int = 10,\n) -&gt; Optional[pd.DataFrame]:\n    \"\"\"\n    Suggest at most `num_suggestions` causal unit definitions for `data_df` based on ius\n    maximization, while returning at least `min_causal_units` causal units. `var_df` provides\n    information on the type of each variable.\n\n    Parameters:\n        data_df: The DataFrame to suggest causal unit definitions for.\n        var_df: A DataFrame with one row for each variable in `data_df` that includes variable type information.\n        min_causal_units: The minimum number of causal units that a suggested definition should create.\n        num_suggestions: The maximum number of causal unit definitions to suggest.\n\n    Returns:\n        A DataFrame with one row for each suggested causal unit definition, or `None` if no suggestions were made.\n    \"\"\"\n\n    list_of_suggestions = []\n\n    for col in data_df.columns:\n        discretizations = CausalUnitSuggester._get_all_discretizations(\n            data_df[col],\n            var_df[var_df[\"Name\"] == col][\"Type\"].values[0],\n            k=min_causal_units,\n        )\n        for disc in discretizations:\n            # Ensure that the unique values in disc, excluding -1 if it exists, are at least min_causal_units\n            if disc.max() &gt;= (min_causal_units - 1):\n                list_of_suggestions.append(\n                    {\n                        \"Variable\": col,\n                        \"Type\": var_df[var_df[\"Name\"] == col][\"Type\"].values[0],\n                        \"Num Units\": disc.max() + 1,\n                        \"IUS\": CausalUnitSuggester._calculate_IUS(data_df, disc),\n                    }\n                )\n\n    df_of_suggestions = pd.DataFrame(list_of_suggestions)\n    if len(df_of_suggestions) == 0:\n        return None\n    return df_of_suggestions.sort_values(by=[\"IUS\"], ascending=False).head(\n        num_suggestions\n    )\n</code></pre>"},{"location":"reference/logos/clustering_params/","title":"ClusteringParams","text":""},{"location":"reference/logos/clustering_params/#logos.clustering_params.ClusteringParams","title":"<code>ClusteringParams</code>","text":"<p>A class to conveniently hold all the parameters required by the clustering approach to challenging the ATE.</p> Source code in <code>src/logos/clustering_params.py</code> <pre><code>class ClusteringParams:\n    \"\"\"\n    A class to conveniently hold all the parameters required by the clustering\n    approach to challenging the ATE.\n    \"\"\"\n\n    def __init__(\n        self,\n        top_n: int = 10,\n        num_edges: int = 3,\n        ignore_ts: bool = True,\n        var_pruning_method: Optional[str] = None,\n        triangle_n: int = 6,\n        force: bool = False,\n        force_triangle: bool = False,\n        num_clusters: Optional[int] = None,\n        threshold: float = 0,\n    ) -&gt; None:\n        \"\"\"\n        Initializes a ClusteringParams object.\n\n        Parameters:\n            top_n: The number of top edges to identify.\n            num_edges: The maximum number of edges to use when enumerating DAGs.\n            ignore_ts: Whether to ignore timestamp variables.\n            var_pruning_method: The pruning method to use. Can be either \"lasso\" or \"triangle\".\n            triangle_n: The number of variables to use for the triangle method.\n            force: Whether to force recalculation.\n            force_triangle: Whether to force the triangle method to be recalculated, if selected.\n            num_clusters: The number of clusters to use. If None, will try to find the optimal number.\n            threshold: The threshold to use when finding outlier edges.\n\n        \"\"\"\n        self.top_n = top_n\n        self.num_edges = num_edges\n        self.ignore_ts = ignore_ts\n        self.var_pruning_method = var_pruning_method\n        self.triangle_n = triangle_n\n        self.force = force\n        self.force_triangle = force_triangle\n        self.num_clusters = num_clusters\n        self.threshold = threshold\n</code></pre>"},{"location":"reference/logos/clustering_params/#logos.clustering_params.ClusteringParams.__init__","title":"<code>__init__(top_n=10, num_edges=3, ignore_ts=True, var_pruning_method=None, triangle_n=6, force=False, force_triangle=False, num_clusters=None, threshold=0)</code>","text":"<p>Initializes a ClusteringParams object.</p> <p>Parameters:</p> Name Type Description Default <code>top_n</code> <code>int</code> <p>The number of top edges to identify.</p> <code>10</code> <code>num_edges</code> <code>int</code> <p>The maximum number of edges to use when enumerating DAGs.</p> <code>3</code> <code>ignore_ts</code> <code>bool</code> <p>Whether to ignore timestamp variables.</p> <code>True</code> <code>var_pruning_method</code> <code>Optional[str]</code> <p>The pruning method to use. Can be either \"lasso\" or \"triangle\".</p> <code>None</code> <code>triangle_n</code> <code>int</code> <p>The number of variables to use for the triangle method.</p> <code>6</code> <code>force</code> <code>bool</code> <p>Whether to force recalculation.</p> <code>False</code> <code>force_triangle</code> <code>bool</code> <p>Whether to force the triangle method to be recalculated, if selected.</p> <code>False</code> <code>num_clusters</code> <code>Optional[int]</code> <p>The number of clusters to use. If None, will try to find the optimal number.</p> <code>None</code> <code>threshold</code> <code>float</code> <p>The threshold to use when finding outlier edges.</p> <code>0</code> Source code in <code>src/logos/clustering_params.py</code> <pre><code>def __init__(\n    self,\n    top_n: int = 10,\n    num_edges: int = 3,\n    ignore_ts: bool = True,\n    var_pruning_method: Optional[str] = None,\n    triangle_n: int = 6,\n    force: bool = False,\n    force_triangle: bool = False,\n    num_clusters: Optional[int] = None,\n    threshold: float = 0,\n) -&gt; None:\n    \"\"\"\n    Initializes a ClusteringParams object.\n\n    Parameters:\n        top_n: The number of top edges to identify.\n        num_edges: The maximum number of edges to use when enumerating DAGs.\n        ignore_ts: Whether to ignore timestamp variables.\n        var_pruning_method: The pruning method to use. Can be either \"lasso\" or \"triangle\".\n        triangle_n: The number of variables to use for the triangle method.\n        force: Whether to force recalculation.\n        force_triangle: Whether to force the triangle method to be recalculated, if selected.\n        num_clusters: The number of clusters to use. If None, will try to find the optimal number.\n        threshold: The threshold to use when finding outlier edges.\n\n    \"\"\"\n    self.top_n = top_n\n    self.num_edges = num_edges\n    self.ignore_ts = ignore_ts\n    self.var_pruning_method = var_pruning_method\n    self.triangle_n = triangle_n\n    self.force = force\n    self.force_triangle = force_triangle\n    self.num_clusters = num_clusters\n    self.threshold = threshold\n</code></pre>"},{"location":"reference/logos/drain/","title":"Drain","text":"<p>Inspired by the LogPAI implementation of the Drain algorithm for log parsing,  available under the MIT license here: https://github.com/HelenGuohx/logbert/blob/main/logparser/Drain.py</p>"},{"location":"reference/logos/drain/#logos.drain.Cluster","title":"<code>Cluster</code>","text":"<p>A cluster in the Drain parse tree.</p> Source code in <code>src/logos/drain.py</code> <pre><code>class Cluster:\n    \"\"\"\n    A cluster in the Drain parse tree.\n    \"\"\"\n\n    def __init__(self, template: str = \"\", message_ids: list[int] = []):\n        \"\"\"\n        Parameters:\n            template : the template of log messages in this cluster\n            message_ids : the list of log message IDs in this cluster\n        \"\"\"\n\n        self.template = template\n        self.message_ids = message_ids\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Cluster.__init__","title":"<code>__init__(template='', message_ids=[])</code>","text":"<p>Parameters:</p> Name Type Description Default <code>template</code> <p>the template of log messages in this cluster</p> <code>''</code> <code>message_ids</code> <p>the list of log message IDs in this cluster</p> <code>[]</code> Source code in <code>src/logos/drain.py</code> <pre><code>def __init__(self, template: str = \"\", message_ids: list[int] = []):\n    \"\"\"\n    Parameters:\n        template : the template of log messages in this cluster\n        message_ids : the list of log message IDs in this cluster\n    \"\"\"\n\n    self.template = template\n    self.message_ids = message_ids\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Node","title":"<code>Node</code>","text":"<p>A node in the Drain parse tree.</p> Source code in <code>src/logos/drain.py</code> <pre><code>class Node:\n    \"\"\"\n    A node in the Drain parse tree.\n    \"\"\"\n\n    def __init__(self, children=None, depth=0, id=None):\n        \"\"\"\n        Parameters:\n            children : the dictionary of children nodes\n            depth : the depth of this node in the tree\n            id : the digit or token that this node represents\n        \"\"\"\n        if children is None:\n            children = dict()\n        self.children = children\n        self.depth = depth\n        self.id = id\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Node.__init__","title":"<code>__init__(children=None, depth=0, id=None)</code>","text":"<p>Parameters:</p> Name Type Description Default <code>children</code> <p>the dictionary of children nodes</p> <code>None</code> <code>depth</code> <p>the depth of this node in the tree</p> <code>0</code> <code>id</code> <p>the digit or token that this node represents</p> <code>None</code> Source code in <code>src/logos/drain.py</code> <pre><code>def __init__(self, children=None, depth=0, id=None):\n    \"\"\"\n    Parameters:\n        children : the dictionary of children nodes\n        depth : the depth of this node in the tree\n        id : the digit or token that this node represents\n    \"\"\"\n    if children is None:\n        children = dict()\n    self.children = children\n    self.depth = depth\n    self.id = id\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain","title":"<code>Drain</code>","text":"<p>A class implementing the Drain log parsing algorithm.</p> Source code in <code>src/logos/drain.py</code> <pre><code>class Drain:\n    \"\"\"\n    A class implementing the Drain log parsing algorithm.\n    \"\"\"\n\n    def __init__(\n        self,\n        indir: str = \".\",\n        depth: int = 4,\n        st: float = 0.4,\n        max_children: int = 100,\n        rex: dict = {},\n        skip_writeout: bool = False,\n        message_prefix: str = r\".*\",\n    ):\n        \"\"\"\n        Initialize a Drain-based parser.\n\n        Parameters:\n            indir: the input directory stores the input log file name\n            depth: depth of all leaf nodes\n            st: similarity threshold\n            max_children: max number of children of an internal node\n            rex: regular expressions used in preprocessing, provided as a dictionary from field name to field regex\n            skip_writeout: whether to skip writing out the parsed log file, templates and variables.\n            message_prefix: prefix that starts each message of the log file - lines are merged to their preceding line if they do not start with this prefix.\n        \"\"\"\n        self.indir = indir\n        self.depth = depth - 2\n        self.st = st\n        self.max_children = max_children\n        self.rex = rex\n        self.skip_writeout = skip_writeout\n        self.message_prefix = message_prefix\n\n    def parse(self, filename: str) -&gt; tuple[pd.DataFrame, pd.DataFrame, pd.DataFrame]:\n        \"\"\"\n        Parse a log file.\n\n        Parameters:\n            filename: The name of the log file to parse (without path).\n\n        Returns:\n            A tuple of three dataframes, containing the parsed log file, the parsed log templates,\n            and the parsed variables respectively.\n        \"\"\"\n\n        full_path = os.path.join(self.indir, filename)\n        print(f\"Parsing file: {full_path}\")\n        self.filename = filename\n        self.root = Node()\n        self.cluster_list = []\n        self.logdf = self._to_df(full_path)\n\n        tqdm.pandas(desc=\"Determining template for each line...\")\n        self.logdf.progress_apply(self._parse_message, axis=1)\n\n        return self._postprocess()\n\n    def _to_df(self, log_file: str) -&gt; pd.DataFrame:\n        \"\"\"\n        Transform a log file into a dataframe.\n\n        Parameters:\n            log_file: The path to the log file.\n\n        Returns:\n            A dataframe containing the log file's lines, tokenized and with regexes replaced.\n        \"\"\"\n\n        log_messages = []\n        linecount = 0\n\n        with open(log_file, \"r\") as f:\n            log_message = \"\"\n\n            for line in tqdm(f.readlines(), desc=\"Reading and tokenizing log lines...\"):\n                line = line.strip()\n\n                if re.match(self.message_prefix, line):\n                    if log_message:\n                        try:\n                            log_messages.append(self._preprocess(log_message))\n                            linecount += 1\n                        except Exception as e:\n                            raise ValueError\n                    log_message = line\n                else:\n                    log_message += \" \" + line\n\n            if log_message:\n                try:\n                    log_messages.append(self._preprocess(log_message))\n                    linecount += 1\n                except Exception as e:\n                    raise ValueError\n\n        logdf = pd.DataFrame(\n            log_messages, columns=[\"Message\", \"Tokenized\", \"Replaced by regex\"]\n        )\n        logdf[\"MsgId\"] = range(len(logdf))\n        return logdf\n\n    def _preprocess(self, msg: str) -&gt; tuple[str, list[str], list[str]]:\n        \"\"\"\n        Preprocess a message of a log file.\n\n        Parameters:\n            msg: The message to preprocess.\n\n        Returns:\n            A tuple containing the original message, the tokenized message, and a list of the values replaced by regexes.\n        \"\"\"\n\n        msg = msg.strip()\n\n        regex_matches = []\n        for i, rex in enumerate(self.rex.values()):\n            matches = re.findall(rex, msg)  ##### ASSUMPTION: only 1 match of interest\n            regex_matches.append(matches[0] if matches else \"\")\n            msg = re.sub(rex, \"&lt;*\" + str(i) + \"&gt;\", msg, count=1)\n\n        pattern = r'([=,\\{\\}\\[\\]\\(\\);\"\\'])'  # Add spaces around punctuation\n        msg = re.sub(pattern, r\" \\1 \", msg)\n        pattern = r\"(?&lt;=\\D):|:(?=\\D)\"  # Colons not in timestamps\n        msg = re.sub(pattern, \" : \", msg)\n\n        return (msg, msg.strip().split(), regex_matches)\n\n    def _parse_message(self, msg: pd.Series) -&gt; None:\n        \"\"\"\n        Parse a single log message and add it to the Drain parse tree in the appropriate cluster.\n\n        Parameters:\n            msg: The log message to parse.\n        \"\"\"\n\n        line_id = msg[\"MsgId\"]\n        tokenized = msg[\"Tokenized\"]\n        cluster = self._tree_search(self.root, tokenized)\n\n        if cluster is None:\n            new_cluster = Cluster(template=tokenized, message_ids=[line_id])\n            self.cluster_list.append(new_cluster)\n            self._add_cluster_to_tree(self.root, new_cluster)\n        else:\n            new_template = self._get_updated_template(tokenized, cluster.template)\n            cluster.message_ids.append(line_id)\n            if \" \".join(new_template) != \" \".join(cluster.template):\n                cluster.template = new_template\n\n    def _tree_search(self, root: Node, tokenized: list[str]) -&gt; Optional[Cluster]:\n        \"\"\"\n        Search the Drain parse tree for a cluster matching `tokenized`.\n\n        Parameters:\n            root: The root of the Drain parse tree.\n            tokenized: The tokenized log message to search for.\n\n        Returns:\n            The cluster in the Drain parse tree that matches `tokenized`,\n            or None if no such cluster exists.\n        \"\"\"\n\n        num_toks = len(tokenized)\n        if num_toks not in root.children:\n            return None\n\n        node = root.children[num_toks]\n\n        depth = 1\n        for token in tokenized:\n            if depth &gt;= self.depth or depth &gt; num_toks:\n                break\n            if token in node.children:\n                node = node.children[token]\n            elif \"&lt;*&gt;\" in node.children:\n                node = node.children[\"&lt;*&gt;\"]\n            else:\n                return None\n            depth += 1\n\n        cluster_list = node.children\n        returned_cluster = self._find_cluster(cluster_list, tokenized)\n\n        return returned_cluster\n\n    def _add_cluster_to_tree(self, root: Node, cluster: Cluster) -&gt; None:\n        \"\"\"\n        Add a cluster to the Drain parse tree.\n\n        Parameters:\n            root: The root of the Drain parse tree.\n            cluster: The cluster to add.\n        \"\"\"\n\n        # Add a node to the first layer of the tree representing the length of the log message.\n        length = len(cluster.template)\n        first_layer_node = None\n        if length not in root.children:\n            first_layer_node = Node(depth=1, id=length)\n            root.children[length] = first_layer_node\n        else:\n            first_layer_node = root.children[length]\n\n        # Traverse the tree to add the new cluster.\n        node = first_layer_node\n        depth = 1\n        for token in cluster.template:\n            # If out of depth, add current log cluster to the leaf node\n            if depth &gt;= self.depth or depth &gt; length:\n                if len(node.children) == 0:\n                    node.children = [cluster]\n                else:\n                    node.children.append(cluster)\n                break\n\n            # If token not matched in this layer of existing tree.\n            if token not in node.children:\n                if not any(char.isdigit() for char in token):\n                    if \"&lt;*&gt;\" in node.children:\n                        if len(node.children) &lt; self.max_children:\n                            new_node = Node(depth=depth + 1, id=token)\n                            node.children[token] = new_node\n                            node = new_node\n                        else:\n                            node = node.children[\"&lt;*&gt;\"]\n                    else:\n                        if len(node.children) + 1 &lt; self.max_children:\n                            new_node = Node(depth=depth + 1, id=token)\n                            node.children[token] = new_node\n                            node = new_node\n                        elif len(node.children) + 1 == self.max_children:\n                            new_node = Node(depth=depth + 1, id=\"&lt;*&gt;\")\n                            node.children[\"&lt;*&gt;\"] = new_node\n                            node = new_node\n                        else:\n                            node = node.children[\"&lt;*&gt;\"]\n                else:\n                    if \"&lt;*&gt;\" not in node.children:\n                        node.children[\"&lt;*&gt;\"] = Node(depth=depth + 1, id=\"&lt;*&gt;\")\n                    node = node.children[\"&lt;*&gt;\"]\n\n            # If the token is matched\n            else:\n                node = node.children[token]\n\n            depth += 1\n\n    def _similarity(self, seq1: list[str], seq2: list[str]) -&gt; tuple[float, int]:\n        \"\"\"\n        Determine the fraction of tokens in `seq1` that are identical to the corresponding token in `seq2`.\n        Also return the number of parameters in `seq1`.\n\n        Parameters:\n            seq1: The first sequence.\n            seq2: The second sequence.\n\n        Returns:\n            A tuple containing the fraction of identical tokens and the number of parameters in `seq1`.\n        \"\"\"\n        assert len(seq1) == len(seq2)\n        matches = 0\n        num_params = 0\n\n        for token1, token2 in zip(seq1, seq2):\n            if token1 == \"&lt;*&gt;\":\n                num_params += 1\n            if token1 == token2:\n                matches += 1\n\n        similarity = float(matches) / len(seq1)\n\n        return similarity, num_params\n\n    def _find_cluster(\n        self, cluster_list: list[Cluster], seq: list[str]\n    ) -&gt; Optional[Cluster]:\n        \"\"\"\n        Find the cluster in `cluster_list` that is most similar to `seq`.\n\n        Parameters:\n            cluster_list: The list of clusters to search.\n            seq: The sequence of tokens to compare to.\n\n        Returns:\n            The cluster in `cluster_list` that is most similar to `seq`,\n            or None if no cluster is sufficiently similar.\n        \"\"\"\n\n        max_similarity = -1\n        max_num_params = -1\n        max_cluster = None\n\n        for cluster in cluster_list:\n            similarity, num_params = self._similarity(cluster.template, seq)\n            if similarity &gt; max_similarity or (\n                similarity == max_similarity and num_params &gt; max_num_params\n            ):\n                max_similarity = similarity\n                max_num_params = num_params\n                max_cluster = cluster\n\n        if max_similarity &gt;= self.st:\n            return max_cluster\n        else:\n            return None\n\n    def _get_updated_template(self, template: list[str], msg: list[str]) -&gt; list[str]:\n        \"\"\"\n        Get the updated template from matching `msg` to `template`.\n\n        Parameters:\n            template: The template to match to.\n            msg: The message to match.\n\n        Returns:\n            The updated template.\n        \"\"\"\n\n        assert len(template) == len(msg)\n        updated_template = []\n\n        for i, word in enumerate(template):\n            if word == msg[i]:\n                updated_template.append(word)\n            else:\n                updated_template.append(\"&lt;*&gt;\")\n\n        return updated_template\n\n    @staticmethod\n    def _preceding_3(parsed_templates: pd.DataFrame, x: str) -&gt; list[str]:\n        \"\"\"\n        Get the 3 tokens preceding the variable `x` in the template.\n\n        Parameters:\n            parsed_templates: The dataframe containing information about the parsed templates.\n            x: The name of the variable.\n\n        Returns:\n            The 3 tokens preceding the variable `x` in the template.\n        \"\"\"\n\n        splitx = x.split(\"_\")\n        if len(splitx) != 2:\n            return []\n        id = splitx[0]\n        position = int(splitx[1])\n        start_position = max(0, position - 3)\n        return (\n            parsed_templates[parsed_templates[\"TemplateId\"] == id][\"TemplateText\"]\n            .values[0]\n            .split()[start_position:position]\n        )\n\n    def _postprocess(\n        self,\n    ) -&gt; tuple[pd.DataFrame, pd.DataFrame, pd.DataFrame]:\n        template_id_per_msg = [0] * self.logdf.shape[0]\n        parsed_templates_list = []\n\n        regex_tokens = [\"&lt;*\" + str(i) + \"&gt;\" for i in range(len(self.rex))]\n\n        # Process each cluster to determine template information.\n        for cluster in self.cluster_list:\n            d = {}\n\n            # Determine the template ID\n            d[\"TemplateText\"] = \" \".join(cluster.template)\n            d[\"TemplateId\"] = hashlib.md5(\n                d[\"TemplateText\"].encode(\"utf-8\")\n            ).hexdigest()[0:8]\n\n            # Determine the indices of the variables and regexes in the template.\n            d[\"VariableIndices\"] = [\n                i for i, x in enumerate(cluster.template) if x == \"&lt;*&gt;\"\n            ]\n            d[\"RegexIndices\"] = []\n            for i in regex_tokens:\n                try:\n                    d[\"RegexIndices\"].append(cluster.template.index(str(i)))\n                except:\n                    pass\n\n            # Update the template ID for each log message in the cluster.\n            for i, line_id in enumerate(cluster.message_ids):\n                self.logdf.loc[line_id, \"TemplateId\"] = d[\"TemplateId\"]\n\n                if i == 0:\n                    d[\"TemplateExample\"] = self.logdf.loc[line_id, \"Message\"]\n\n            parsed_templates_list.append(d.copy())\n\n        # Create a dataframe of the parsed templates.\n        self.parsed_templates = pd.DataFrame(parsed_templates_list)\n        template_occurences = dict(self.logdf[\"TemplateId\"].value_counts())\n        self.parsed_templates[\"Occurrences\"] = self.parsed_templates[\"TemplateId\"].map(\n            template_occurences\n        )\n\n        # Create columns for each variable (parsed or regex-derived) and extract them from each log message.\n        variable_columns = list(self.rex.keys())\n        variable_columns.extend(\n            [\n                str(i) + \"_\" + str(j)\n                for i in self.parsed_templates[\"TemplateId\"].values\n                for j in self.parsed_templates.loc[\n                    self.parsed_templates[\"TemplateId\"] == i, \"VariableIndices\"\n                ].values[0]\n            ]\n        )\n        par_df = pd.DataFrame(\n            columns=variable_columns, index=range(self.logdf.shape[0])\n        )\n        self.logdf = pd.concat((self.logdf, par_df), axis=1)\n        self._extract_variables()\n\n        # Create a dataframe of the parsed variables.\n        parsed_variables = pd.DataFrame()\n        parsed_variables[\"Name\"] = variable_columns\n        parsed_variables[\"Occurrences\"] = parsed_variables[\"Name\"].map(\n            lambda x: self.logdf[x].notna().sum()\n        )\n        parsed_variables[\"Preceding 3 tokens\"] = parsed_variables[\"Name\"].map(\n            lambda x: Drain._preceding_3(self.parsed_templates, x)\n        )\n        parsed_variables[\"Examples\"] = parsed_variables[\"Name\"].map(\n            lambda x: self.logdf[x].loc[self.logdf[x].notna()].unique()[:5].tolist()\n        )\n        parsed_variables[\"From regex\"] = parsed_variables[\"Name\"].map(\n            lambda x: True if x in self.rex.keys() else False\n        )\n\n        # Drop unnecessary columns from the parsed log.\n        to_drop = [\"MsgId\", \"Message\", \"Tokenized\", \"Replaced by regex\"]\n        to_drop.extend(\n            parsed_variables[parsed_variables[\"Occurrences\"] == 0][\"Name\"].tolist()\n        )\n        parsed_log = self.logdf.drop(columns=to_drop)\n        parsed_variables = (\n            parsed_variables[~parsed_variables.isin(to_drop)[\"Name\"]]\n            .reset_index()\n            .drop(columns=\"index\")\n        )\n\n        return parsed_log, self.parsed_templates, parsed_variables\n\n    def _extract_variables(self) -&gt; None:\n        \"\"\"\n        Extract the variables from the log messages.\n        \"\"\"\n\n        for row in tqdm(\n            self.parsed_templates.itertuples(),\n            desc=\"Extracting variables from each log message...\",\n            total=len(self.parsed_templates),\n        ):\n            template_id = row.TemplateId\n            variable_indices = row.VariableIndices\n\n            mask = self.logdf[\"TemplateId\"] == template_id\n            for i in variable_indices:\n                col_name = f\"{template_id}_{str(i)}\"\n                self.logdf.loc[mask, col_name] = self.logdf.loc[mask, \"Tokenized\"].str[\n                    i\n                ]\n\n            for i, col_name in enumerate(self.rex.keys()):\n                self.logdf.loc[mask, col_name] = self.logdf.loc[\n                    mask, \"Replaced by regex\"\n                ].str[i]\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain.__init__","title":"<code>__init__(indir='.', depth=4, st=0.4, max_children=100, rex={}, skip_writeout=False, message_prefix='.*')</code>","text":"<p>Initialize a Drain-based parser.</p> <p>Parameters:</p> Name Type Description Default <code>indir</code> <code>str</code> <p>the input directory stores the input log file name</p> <code>'.'</code> <code>depth</code> <code>int</code> <p>depth of all leaf nodes</p> <code>4</code> <code>st</code> <code>float</code> <p>similarity threshold</p> <code>0.4</code> <code>max_children</code> <code>int</code> <p>max number of children of an internal node</p> <code>100</code> <code>rex</code> <code>dict</code> <p>regular expressions used in preprocessing, provided as a dictionary from field name to field regex</p> <code>{}</code> <code>skip_writeout</code> <code>bool</code> <p>whether to skip writing out the parsed log file, templates and variables.</p> <code>False</code> <code>message_prefix</code> <code>str</code> <p>prefix that starts each message of the log file - lines are merged to their preceding line if they do not start with this prefix.</p> <code>'.*'</code> Source code in <code>src/logos/drain.py</code> <pre><code>def __init__(\n    self,\n    indir: str = \".\",\n    depth: int = 4,\n    st: float = 0.4,\n    max_children: int = 100,\n    rex: dict = {},\n    skip_writeout: bool = False,\n    message_prefix: str = r\".*\",\n):\n    \"\"\"\n    Initialize a Drain-based parser.\n\n    Parameters:\n        indir: the input directory stores the input log file name\n        depth: depth of all leaf nodes\n        st: similarity threshold\n        max_children: max number of children of an internal node\n        rex: regular expressions used in preprocessing, provided as a dictionary from field name to field regex\n        skip_writeout: whether to skip writing out the parsed log file, templates and variables.\n        message_prefix: prefix that starts each message of the log file - lines are merged to their preceding line if they do not start with this prefix.\n    \"\"\"\n    self.indir = indir\n    self.depth = depth - 2\n    self.st = st\n    self.max_children = max_children\n    self.rex = rex\n    self.skip_writeout = skip_writeout\n    self.message_prefix = message_prefix\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain.parse","title":"<code>parse(filename)</code>","text":"<p>Parse a log file.</p> <p>Parameters:</p> Name Type Description Default <code>filename</code> <code>str</code> <p>The name of the log file to parse (without path).</p> required <p>Returns:</p> Type Description <code>DataFrame</code> <p>A tuple of three dataframes, containing the parsed log file, the parsed log templates,</p> <code>DataFrame</code> <p>and the parsed variables respectively.</p> Source code in <code>src/logos/drain.py</code> <pre><code>def parse(self, filename: str) -&gt; tuple[pd.DataFrame, pd.DataFrame, pd.DataFrame]:\n    \"\"\"\n    Parse a log file.\n\n    Parameters:\n        filename: The name of the log file to parse (without path).\n\n    Returns:\n        A tuple of three dataframes, containing the parsed log file, the parsed log templates,\n        and the parsed variables respectively.\n    \"\"\"\n\n    full_path = os.path.join(self.indir, filename)\n    print(f\"Parsing file: {full_path}\")\n    self.filename = filename\n    self.root = Node()\n    self.cluster_list = []\n    self.logdf = self._to_df(full_path)\n\n    tqdm.pandas(desc=\"Determining template for each line...\")\n    self.logdf.progress_apply(self._parse_message, axis=1)\n\n    return self._postprocess()\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain._to_df","title":"<code>_to_df(log_file)</code>","text":"<p>Transform a log file into a dataframe.</p> <p>Parameters:</p> Name Type Description Default <code>log_file</code> <code>str</code> <p>The path to the log file.</p> required <p>Returns:</p> Type Description <code>DataFrame</code> <p>A dataframe containing the log file's lines, tokenized and with regexes replaced.</p> Source code in <code>src/logos/drain.py</code> <pre><code>def _to_df(self, log_file: str) -&gt; pd.DataFrame:\n    \"\"\"\n    Transform a log file into a dataframe.\n\n    Parameters:\n        log_file: The path to the log file.\n\n    Returns:\n        A dataframe containing the log file's lines, tokenized and with regexes replaced.\n    \"\"\"\n\n    log_messages = []\n    linecount = 0\n\n    with open(log_file, \"r\") as f:\n        log_message = \"\"\n\n        for line in tqdm(f.readlines(), desc=\"Reading and tokenizing log lines...\"):\n            line = line.strip()\n\n            if re.match(self.message_prefix, line):\n                if log_message:\n                    try:\n                        log_messages.append(self._preprocess(log_message))\n                        linecount += 1\n                    except Exception as e:\n                        raise ValueError\n                log_message = line\n            else:\n                log_message += \" \" + line\n\n        if log_message:\n            try:\n                log_messages.append(self._preprocess(log_message))\n                linecount += 1\n            except Exception as e:\n                raise ValueError\n\n    logdf = pd.DataFrame(\n        log_messages, columns=[\"Message\", \"Tokenized\", \"Replaced by regex\"]\n    )\n    logdf[\"MsgId\"] = range(len(logdf))\n    return logdf\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain._preprocess","title":"<code>_preprocess(msg)</code>","text":"<p>Preprocess a message of a log file.</p> <p>Parameters:</p> Name Type Description Default <code>msg</code> <code>str</code> <p>The message to preprocess.</p> required <p>Returns:</p> Type Description <code>tuple[str, list[str], list[str]]</code> <p>A tuple containing the original message, the tokenized message, and a list of the values replaced by regexes.</p> Source code in <code>src/logos/drain.py</code> <pre><code>def _preprocess(self, msg: str) -&gt; tuple[str, list[str], list[str]]:\n    \"\"\"\n    Preprocess a message of a log file.\n\n    Parameters:\n        msg: The message to preprocess.\n\n    Returns:\n        A tuple containing the original message, the tokenized message, and a list of the values replaced by regexes.\n    \"\"\"\n\n    msg = msg.strip()\n\n    regex_matches = []\n    for i, rex in enumerate(self.rex.values()):\n        matches = re.findall(rex, msg)  ##### ASSUMPTION: only 1 match of interest\n        regex_matches.append(matches[0] if matches else \"\")\n        msg = re.sub(rex, \"&lt;*\" + str(i) + \"&gt;\", msg, count=1)\n\n    pattern = r'([=,\\{\\}\\[\\]\\(\\);\"\\'])'  # Add spaces around punctuation\n    msg = re.sub(pattern, r\" \\1 \", msg)\n    pattern = r\"(?&lt;=\\D):|:(?=\\D)\"  # Colons not in timestamps\n    msg = re.sub(pattern, \" : \", msg)\n\n    return (msg, msg.strip().split(), regex_matches)\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain._parse_message","title":"<code>_parse_message(msg)</code>","text":"<p>Parse a single log message and add it to the Drain parse tree in the appropriate cluster.</p> <p>Parameters:</p> Name Type Description Default <code>msg</code> <code>Series</code> <p>The log message to parse.</p> required Source code in <code>src/logos/drain.py</code> <pre><code>def _parse_message(self, msg: pd.Series) -&gt; None:\n    \"\"\"\n    Parse a single log message and add it to the Drain parse tree in the appropriate cluster.\n\n    Parameters:\n        msg: The log message to parse.\n    \"\"\"\n\n    line_id = msg[\"MsgId\"]\n    tokenized = msg[\"Tokenized\"]\n    cluster = self._tree_search(self.root, tokenized)\n\n    if cluster is None:\n        new_cluster = Cluster(template=tokenized, message_ids=[line_id])\n        self.cluster_list.append(new_cluster)\n        self._add_cluster_to_tree(self.root, new_cluster)\n    else:\n        new_template = self._get_updated_template(tokenized, cluster.template)\n        cluster.message_ids.append(line_id)\n        if \" \".join(new_template) != \" \".join(cluster.template):\n            cluster.template = new_template\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain._tree_search","title":"<code>_tree_search(root, tokenized)</code>","text":"<p>Search the Drain parse tree for a cluster matching <code>tokenized</code>.</p> <p>Parameters:</p> Name Type Description Default <code>root</code> <code>Node</code> <p>The root of the Drain parse tree.</p> required <code>tokenized</code> <code>list[str]</code> <p>The tokenized log message to search for.</p> required <p>Returns:</p> Type Description <code>Optional[Cluster]</code> <p>The cluster in the Drain parse tree that matches <code>tokenized</code>,</p> <code>Optional[Cluster]</code> <p>or None if no such cluster exists.</p> Source code in <code>src/logos/drain.py</code> <pre><code>def _tree_search(self, root: Node, tokenized: list[str]) -&gt; Optional[Cluster]:\n    \"\"\"\n    Search the Drain parse tree for a cluster matching `tokenized`.\n\n    Parameters:\n        root: The root of the Drain parse tree.\n        tokenized: The tokenized log message to search for.\n\n    Returns:\n        The cluster in the Drain parse tree that matches `tokenized`,\n        or None if no such cluster exists.\n    \"\"\"\n\n    num_toks = len(tokenized)\n    if num_toks not in root.children:\n        return None\n\n    node = root.children[num_toks]\n\n    depth = 1\n    for token in tokenized:\n        if depth &gt;= self.depth or depth &gt; num_toks:\n            break\n        if token in node.children:\n            node = node.children[token]\n        elif \"&lt;*&gt;\" in node.children:\n            node = node.children[\"&lt;*&gt;\"]\n        else:\n            return None\n        depth += 1\n\n    cluster_list = node.children\n    returned_cluster = self._find_cluster(cluster_list, tokenized)\n\n    return returned_cluster\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain._add_cluster_to_tree","title":"<code>_add_cluster_to_tree(root, cluster)</code>","text":"<p>Add a cluster to the Drain parse tree.</p> <p>Parameters:</p> Name Type Description Default <code>root</code> <code>Node</code> <p>The root of the Drain parse tree.</p> required <code>cluster</code> <code>Cluster</code> <p>The cluster to add.</p> required Source code in <code>src/logos/drain.py</code> <pre><code>def _add_cluster_to_tree(self, root: Node, cluster: Cluster) -&gt; None:\n    \"\"\"\n    Add a cluster to the Drain parse tree.\n\n    Parameters:\n        root: The root of the Drain parse tree.\n        cluster: The cluster to add.\n    \"\"\"\n\n    # Add a node to the first layer of the tree representing the length of the log message.\n    length = len(cluster.template)\n    first_layer_node = None\n    if length not in root.children:\n        first_layer_node = Node(depth=1, id=length)\n        root.children[length] = first_layer_node\n    else:\n        first_layer_node = root.children[length]\n\n    # Traverse the tree to add the new cluster.\n    node = first_layer_node\n    depth = 1\n    for token in cluster.template:\n        # If out of depth, add current log cluster to the leaf node\n        if depth &gt;= self.depth or depth &gt; length:\n            if len(node.children) == 0:\n                node.children = [cluster]\n            else:\n                node.children.append(cluster)\n            break\n\n        # If token not matched in this layer of existing tree.\n        if token not in node.children:\n            if not any(char.isdigit() for char in token):\n                if \"&lt;*&gt;\" in node.children:\n                    if len(node.children) &lt; self.max_children:\n                        new_node = Node(depth=depth + 1, id=token)\n                        node.children[token] = new_node\n                        node = new_node\n                    else:\n                        node = node.children[\"&lt;*&gt;\"]\n                else:\n                    if len(node.children) + 1 &lt; self.max_children:\n                        new_node = Node(depth=depth + 1, id=token)\n                        node.children[token] = new_node\n                        node = new_node\n                    elif len(node.children) + 1 == self.max_children:\n                        new_node = Node(depth=depth + 1, id=\"&lt;*&gt;\")\n                        node.children[\"&lt;*&gt;\"] = new_node\n                        node = new_node\n                    else:\n                        node = node.children[\"&lt;*&gt;\"]\n            else:\n                if \"&lt;*&gt;\" not in node.children:\n                    node.children[\"&lt;*&gt;\"] = Node(depth=depth + 1, id=\"&lt;*&gt;\")\n                node = node.children[\"&lt;*&gt;\"]\n\n        # If the token is matched\n        else:\n            node = node.children[token]\n\n        depth += 1\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain._similarity","title":"<code>_similarity(seq1, seq2)</code>","text":"<p>Determine the fraction of tokens in <code>seq1</code> that are identical to the corresponding token in <code>seq2</code>. Also return the number of parameters in <code>seq1</code>.</p> <p>Parameters:</p> Name Type Description Default <code>seq1</code> <code>list[str]</code> <p>The first sequence.</p> required <code>seq2</code> <code>list[str]</code> <p>The second sequence.</p> required <p>Returns:</p> Type Description <code>tuple[float, int]</code> <p>A tuple containing the fraction of identical tokens and the number of parameters in <code>seq1</code>.</p> Source code in <code>src/logos/drain.py</code> <pre><code>def _similarity(self, seq1: list[str], seq2: list[str]) -&gt; tuple[float, int]:\n    \"\"\"\n    Determine the fraction of tokens in `seq1` that are identical to the corresponding token in `seq2`.\n    Also return the number of parameters in `seq1`.\n\n    Parameters:\n        seq1: The first sequence.\n        seq2: The second sequence.\n\n    Returns:\n        A tuple containing the fraction of identical tokens and the number of parameters in `seq1`.\n    \"\"\"\n    assert len(seq1) == len(seq2)\n    matches = 0\n    num_params = 0\n\n    for token1, token2 in zip(seq1, seq2):\n        if token1 == \"&lt;*&gt;\":\n            num_params += 1\n        if token1 == token2:\n            matches += 1\n\n    similarity = float(matches) / len(seq1)\n\n    return similarity, num_params\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain._find_cluster","title":"<code>_find_cluster(cluster_list, seq)</code>","text":"<p>Find the cluster in <code>cluster_list</code> that is most similar to <code>seq</code>.</p> <p>Parameters:</p> Name Type Description Default <code>cluster_list</code> <code>list[Cluster]</code> <p>The list of clusters to search.</p> required <code>seq</code> <code>list[str]</code> <p>The sequence of tokens to compare to.</p> required <p>Returns:</p> Type Description <code>Optional[Cluster]</code> <p>The cluster in <code>cluster_list</code> that is most similar to <code>seq</code>,</p> <code>Optional[Cluster]</code> <p>or None if no cluster is sufficiently similar.</p> Source code in <code>src/logos/drain.py</code> <pre><code>def _find_cluster(\n    self, cluster_list: list[Cluster], seq: list[str]\n) -&gt; Optional[Cluster]:\n    \"\"\"\n    Find the cluster in `cluster_list` that is most similar to `seq`.\n\n    Parameters:\n        cluster_list: The list of clusters to search.\n        seq: The sequence of tokens to compare to.\n\n    Returns:\n        The cluster in `cluster_list` that is most similar to `seq`,\n        or None if no cluster is sufficiently similar.\n    \"\"\"\n\n    max_similarity = -1\n    max_num_params = -1\n    max_cluster = None\n\n    for cluster in cluster_list:\n        similarity, num_params = self._similarity(cluster.template, seq)\n        if similarity &gt; max_similarity or (\n            similarity == max_similarity and num_params &gt; max_num_params\n        ):\n            max_similarity = similarity\n            max_num_params = num_params\n            max_cluster = cluster\n\n    if max_similarity &gt;= self.st:\n        return max_cluster\n    else:\n        return None\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain._get_updated_template","title":"<code>_get_updated_template(template, msg)</code>","text":"<p>Get the updated template from matching <code>msg</code> to <code>template</code>.</p> <p>Parameters:</p> Name Type Description Default <code>template</code> <code>list[str]</code> <p>The template to match to.</p> required <code>msg</code> <code>list[str]</code> <p>The message to match.</p> required <p>Returns:</p> Type Description <code>list[str]</code> <p>The updated template.</p> Source code in <code>src/logos/drain.py</code> <pre><code>def _get_updated_template(self, template: list[str], msg: list[str]) -&gt; list[str]:\n    \"\"\"\n    Get the updated template from matching `msg` to `template`.\n\n    Parameters:\n        template: The template to match to.\n        msg: The message to match.\n\n    Returns:\n        The updated template.\n    \"\"\"\n\n    assert len(template) == len(msg)\n    updated_template = []\n\n    for i, word in enumerate(template):\n        if word == msg[i]:\n            updated_template.append(word)\n        else:\n            updated_template.append(\"&lt;*&gt;\")\n\n    return updated_template\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain._preceding_3","title":"<code>_preceding_3(parsed_templates, x)</code>  <code>staticmethod</code>","text":"<p>Get the 3 tokens preceding the variable <code>x</code> in the template.</p> <p>Parameters:</p> Name Type Description Default <code>parsed_templates</code> <code>DataFrame</code> <p>The dataframe containing information about the parsed templates.</p> required <code>x</code> <code>str</code> <p>The name of the variable.</p> required <p>Returns:</p> Type Description <code>list[str]</code> <p>The 3 tokens preceding the variable <code>x</code> in the template.</p> Source code in <code>src/logos/drain.py</code> <pre><code>@staticmethod\ndef _preceding_3(parsed_templates: pd.DataFrame, x: str) -&gt; list[str]:\n    \"\"\"\n    Get the 3 tokens preceding the variable `x` in the template.\n\n    Parameters:\n        parsed_templates: The dataframe containing information about the parsed templates.\n        x: The name of the variable.\n\n    Returns:\n        The 3 tokens preceding the variable `x` in the template.\n    \"\"\"\n\n    splitx = x.split(\"_\")\n    if len(splitx) != 2:\n        return []\n    id = splitx[0]\n    position = int(splitx[1])\n    start_position = max(0, position - 3)\n    return (\n        parsed_templates[parsed_templates[\"TemplateId\"] == id][\"TemplateText\"]\n        .values[0]\n        .split()[start_position:position]\n    )\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain._extract_variables","title":"<code>_extract_variables()</code>","text":"<p>Extract the variables from the log messages.</p> Source code in <code>src/logos/drain.py</code> <pre><code>def _extract_variables(self) -&gt; None:\n    \"\"\"\n    Extract the variables from the log messages.\n    \"\"\"\n\n    for row in tqdm(\n        self.parsed_templates.itertuples(),\n        desc=\"Extracting variables from each log message...\",\n        total=len(self.parsed_templates),\n    ):\n        template_id = row.TemplateId\n        variable_indices = row.VariableIndices\n\n        mask = self.logdf[\"TemplateId\"] == template_id\n        for i in variable_indices:\n            col_name = f\"{template_id}_{str(i)}\"\n            self.logdf.loc[mask, col_name] = self.logdf.loc[mask, \"Tokenized\"].str[\n                i\n            ]\n\n        for i, col_name in enumerate(self.rex.keys()):\n            self.logdf.loc[mask, col_name] = self.logdf.loc[\n                mask, \"Replaced by regex\"\n            ].str[i]\n</code></pre>"},{"location":"reference/logos/edge_occurrence_tree/","title":"EdgeOccurrenceTree","text":""},{"location":"reference/logos/edge_occurrence_tree/#logos.edge_occurrence_tree.EdgeOccurrenceTree","title":"<code>EdgeOccurrenceTree</code>","text":"<p>A tree of DAGs based on the ATE cluster they belong to.</p> Source code in <code>src/logos/edge_occurrence_tree.py</code> <pre><code>class EdgeOccurrenceTree:\n    \"\"\"\n    A tree of DAGs based on the ATE cluster they belong to.\n    \"\"\"\n\n    def __init__(self, cluster_id: Optional[str] = None) -&gt; None:\n        \"\"\"\n        Initialize a tree node with a specific cluster id.\n\n        Parameters:\n            cluster_id: The cluster id of the DAGs that belong to this node.\n        \"\"\"\n\n        self.cluster_id = cluster_id\n        self.left = None\n        self.right = None\n\n    @staticmethod\n    def build_tree(linked: np.ndarray, leaves: list[int]) -&gt; tuple[Self, int]:\n        \"\"\"\n        Build a tree from a linkage matrix.\n\n        Parameters:\n            linked: The linkage matrix.\n            leaves: The list of leaf nodes.\n\n        Returns:\n            A tuple containing the root of the tree, and the index of the next cluster to be merged.\n        \"\"\"\n\n        # Base case: if there is only one cluster, return it as a leaf.\n        if len(leaves) == 1:\n            return EdgeOccurrenceTree(cluster_id=leaves[0]), -1\n\n        # Otherwise, build the tree recursively.\n        root = EdgeOccurrenceTree()\n        curr = root\n        i = len(linked) - 1\n        while i &gt; -1:\n            # Linked contains 4 elements: cluster1, cluster2, distance, num_observations\n            # They represent the clusters that were merged, the distance between them, and\n            # the number of observations in the new cluster.\n            c1, c2, _, _ = linked[i]\n\n            if c1 not in leaves and c2 not in leaves:\n                curr.left, i = EdgeOccurrenceTree.build_tree(linked[:i], leaves)\n                curr.right, i = EdgeOccurrenceTree.build_tree(linked[:i], leaves)\n                break\n            if c1 in leaves:\n                curr.left = EdgeOccurrenceTree(leaves.index(c1))\n                curr.right = EdgeOccurrenceTree()\n                curr = curr.right\n            if c2 in leaves:\n                curr.right = EdgeOccurrenceTree(leaves.index(c2))\n                break\n            i -= 1\n        root = EdgeOccurrenceTree._cleanup_tree(root)\n        return root, i\n\n    @staticmethod\n    def _cleanup_tree(root: Optional[Self]) -&gt; Self:\n        \"\"\"\n        Clean up the tree by removing nodes that have only one child, and nodes that have no\n        children and are not leaves.\n\n        Parameters:\n            root: The root of the tree.\n\n        Returns:\n            The root of the cleaned up tree.\n        \"\"\"\n\n        if root is None:\n            return None\n\n        # Recursively clean up left and right subtrees\n        root.left = EdgeOccurrenceTree._cleanup_tree(root.left)\n        root.right = EdgeOccurrenceTree._cleanup_tree(root.right)\n\n        # If the current node has only one child, replace the node with its child\n        if root.left is None and root.right is not None:\n            return root.right\n        elif root.left is not None and root.right is None:\n            return root.left\n\n        # If the current node has no left and right child and is not a leaf, remove the node\n        if root.left is None and root.right is None and root.cluster_id is None:\n            return None\n\n        return root\n\n    def print_tree(self, depth: int = 0) -&gt; None:\n        \"\"\"\n        Print the tree in a readable format.\n\n        Parameters:\n            depth: The depth of the current node in the tree.\n        \"\"\"\n\n        prefix = \"\"\n        for _ in range(depth):\n            prefix += \"-\"\n        if self.cluster_id is not None:\n            print(prefix + str(self.cluster_id))\n        else:\n            print(prefix + \"node\")\n        if self.left:\n            self.left.print_tree(depth + 1)\n        if self.right:\n            self.right.print_tree(depth + 1)\n\n    def assign_dags_to_nodes(self, cluster_mapping: dict[nx.DiGraph, int]) -&gt; None:\n        \"\"\"\n        Assign each DAG to the node it belongs to, based on `cluster_mapping`.\n\n        Parameters:\n            cluster_mapping: A dictionary mapping DAGs to cluster id's.\n        \"\"\"\n        self.num_dags = 0\n\n        # If leaf, assign DAGs and set count.\n        if self.cluster_id is not None:\n            self.dags = [\n                key\n                for key in cluster_mapping.keys()\n                if cluster_mapping[key] == self.cluster_id\n            ]\n            self.num_dags = len(self.dags)\n\n        # Otherwise, recurse for children and retireve counts.\n        if self.left:\n            self.left.assign_dags_to_nodes(cluster_mapping)\n            self.num_dags += self.left.num_dags\n        if self.right:\n            self.right.assign_dags_to_nodes(cluster_mapping)\n            self.num_dags += self.right.num_dags\n\n    def count_edge_occurrences(\n        self, treatment: str, outcome: str, dag: nx.DiGraph\n    ) -&gt; None:\n        \"\"\"\n        Recursively count the number of times each edge occurs amongst the DAGs\n        assigned to all the children of this node, omitting the edge from treatment -&gt; outcome,\n        since this always exists. If a DAG is passed in, ignore the edges in that DAG as well.\n\n        Parameters:\n            treatment: The treatment variable.\n            outcome: The outcome variable.\n            dag: The optional dag structure to ignore.\n        \"\"\"\n        self.edge_counts: Types.EdgeCountDict = defaultdict(int)\n\n        # If leaf, actually compute count.\n        if self.cluster_id is not None:\n            edges_to_ignore = [(treatment, outcome)]\n            if dag:\n                edges_to_ignore.extend(dag.edges)\n            for graph in self.dags:\n                for edge in graph.edges:\n                    if edge not in edges_to_ignore:\n                        self.edge_counts[edge] += 1\n\n        # Otherwise, derive counts from children.\n        if self.left:\n            self.left.count_edge_occurrences(treatment, outcome, dag)\n            for key in self.left.edge_counts.keys():\n                self.edge_counts[key] += self.left.edge_counts[key]\n        if self.right:\n            self.right.count_edge_occurrences(treatment, outcome, dag)\n            for key in self.right.edge_counts.keys():\n                self.edge_counts[key] += self.right.edge_counts[key]\n\n        # Compute statistics.\n        freq_counts = list(self.edge_counts.values())\n        if len(freq_counts) == 0:\n            self.mean = None\n            self.std_dev = None\n        else:\n            self.mean = np.mean(freq_counts)\n            self.std_dev = np.std(freq_counts)\n\n    def calculate_edge_expectancy(\n        self, totals: tuple[int, Types.EdgeCountDict] = None\n    ) -&gt; None:\n        \"\"\"\n        For each edge at each node, calculate what percent over or under\n        expectancy the edge is at in relationship to its parent.\n\n        Parameters:\n            totals: A tuple containing the total number of DAGs and the mapping from\n                edges to their counts for the parent of this node.\n        \"\"\"\n        # At root node, calculate expectancy\n        if totals is None:\n            totals = (self.num_dags, self.edge_counts)\n\n        # Otherwise, calculate expectancy based on parent.\n        total_dags, total_edges = totals\n        self.percent_expectancy = defaultdict(float)\n\n        for edge in self.edge_counts.keys():\n            expected = self.num_dags / total_dags * total_edges[edge]\n            self.percent_expectancy[edge] = (\n                self.edge_counts[edge] - expected\n            ) / expected\n\n        # Recurse for children.\n        if self.left:\n            self.left.calculate_edge_expectancy((self.num_dags, self.edge_counts))\n        if self.right:\n            self.right.calculate_edge_expectancy((self.num_dags, self.edge_counts))\n\n    def find_outliers_in_tree(self, threshold: float = 0) -&gt; None:\n        \"\"\"\n        Find outlier edges, based on the percent expectancy of each edge. Define an outlier as an\n        edge that is below expectancy on one side of the tree, and above on the other side, and\n        optionally, over some threshold on both sides.\n\n        Parameters:\n            threshold: The threshold for an edge to be considered an outlier.\n        \"\"\"\n\n        # If able to compare, find outliers.\n        if self.left and self.right:\n            self.left.outliers = {}\n            self.right.outliers = {}\n            edges = set(self.left.edge_counts.keys()).union(\n                set(self.right.edge_counts.keys())\n            )\n            for edge in edges:\n                if (\n                    np.sign(self.left.percent_expectancy[edge])\n                    != np.sign(self.right.percent_expectancy[edge])\n                    and abs(self.left.percent_expectancy[edge]) &gt; threshold\n                    and abs(self.right.percent_expectancy[edge]) &gt; threshold\n                ):\n                    self.left.outliers[edge] = self.left.percent_expectancy[edge]\n                    self.right.outliers[edge] = self.right.percent_expectancy[edge]\n\n        # Recurse for children.\n        if self.left:\n            self.left.find_outliers_in_tree(threshold)\n        if self.right:\n            self.right.find_outliers_in_tree(threshold)\n\n    def find_outliers_per_cluster(\n        self,\n        dag: nx.DiGraph,\n    ) -&gt; tuple[Types.EdgeCountDict, dict[Types.Edge, float]]:\n        \"\"\"\n        Collect the edge counts and outliers found earlier into appropriate dictionaries\n        per cluster.\n\n        Parameters:\n            dag: The DAG to ignore when collecting outliers.\n\n        Returns:\n            A tuple containing the following: a dictionary mapping cluster id's to edge counts,\n            and a dictionary mapping cluster id's to outlier edges.\n        \"\"\"\n\n        cluster_edge_count = {}\n        cluster_outliers = {}\n\n        # If leaf, add to cluster counts.\n        if self.cluster_id is not None:\n            cluster_edge_count[self.cluster_id] = self.edge_counts\n            edges_to_ignore = dag.edges if dag is not None else []\n            cluster_outliers[self.cluster_id] = {\n                edge: self.outliers[edge]\n                for edge in self.outliers\n                if edge not in edges_to_ignore\n            }\n\n        # Otherwise, recurse for children.\n        if self.left:\n            lec, lo = self.left.find_outliers_per_cluster(dag)\n            cluster_edge_count.update(lec)\n            cluster_outliers.update(lo)\n        if self.right:\n            rec, ro = self.right.find_outliers_per_cluster(dag)\n            cluster_edge_count.update(rec)\n            cluster_outliers.update(ro)\n\n        return cluster_edge_count, cluster_outliers\n</code></pre>"},{"location":"reference/logos/edge_occurrence_tree/#logos.edge_occurrence_tree.EdgeOccurrenceTree.__init__","title":"<code>__init__(cluster_id=None)</code>","text":"<p>Initialize a tree node with a specific cluster id.</p> <p>Parameters:</p> Name Type Description Default <code>cluster_id</code> <code>Optional[str]</code> <p>The cluster id of the DAGs that belong to this node.</p> <code>None</code> Source code in <code>src/logos/edge_occurrence_tree.py</code> <pre><code>def __init__(self, cluster_id: Optional[str] = None) -&gt; None:\n    \"\"\"\n    Initialize a tree node with a specific cluster id.\n\n    Parameters:\n        cluster_id: The cluster id of the DAGs that belong to this node.\n    \"\"\"\n\n    self.cluster_id = cluster_id\n    self.left = None\n    self.right = None\n</code></pre>"},{"location":"reference/logos/edge_occurrence_tree/#logos.edge_occurrence_tree.EdgeOccurrenceTree.build_tree","title":"<code>build_tree(linked, leaves)</code>  <code>staticmethod</code>","text":"<p>Build a tree from a linkage matrix.</p> <p>Parameters:</p> Name Type Description Default <code>linked</code> <code>ndarray</code> <p>The linkage matrix.</p> required <code>leaves</code> <code>list[int]</code> <p>The list of leaf nodes.</p> required <p>Returns:</p> Type Description <code>tuple[Self, int]</code> <p>A tuple containing the root of the tree, and the index of the next cluster to be merged.</p> Source code in <code>src/logos/edge_occurrence_tree.py</code> <pre><code>@staticmethod\ndef build_tree(linked: np.ndarray, leaves: list[int]) -&gt; tuple[Self, int]:\n    \"\"\"\n    Build a tree from a linkage matrix.\n\n    Parameters:\n        linked: The linkage matrix.\n        leaves: The list of leaf nodes.\n\n    Returns:\n        A tuple containing the root of the tree, and the index of the next cluster to be merged.\n    \"\"\"\n\n    # Base case: if there is only one cluster, return it as a leaf.\n    if len(leaves) == 1:\n        return EdgeOccurrenceTree(cluster_id=leaves[0]), -1\n\n    # Otherwise, build the tree recursively.\n    root = EdgeOccurrenceTree()\n    curr = root\n    i = len(linked) - 1\n    while i &gt; -1:\n        # Linked contains 4 elements: cluster1, cluster2, distance, num_observations\n        # They represent the clusters that were merged, the distance between them, and\n        # the number of observations in the new cluster.\n        c1, c2, _, _ = linked[i]\n\n        if c1 not in leaves and c2 not in leaves:\n            curr.left, i = EdgeOccurrenceTree.build_tree(linked[:i], leaves)\n            curr.right, i = EdgeOccurrenceTree.build_tree(linked[:i], leaves)\n            break\n        if c1 in leaves:\n            curr.left = EdgeOccurrenceTree(leaves.index(c1))\n            curr.right = EdgeOccurrenceTree()\n            curr = curr.right\n        if c2 in leaves:\n            curr.right = EdgeOccurrenceTree(leaves.index(c2))\n            break\n        i -= 1\n    root = EdgeOccurrenceTree._cleanup_tree(root)\n    return root, i\n</code></pre>"},{"location":"reference/logos/edge_occurrence_tree/#logos.edge_occurrence_tree.EdgeOccurrenceTree._cleanup_tree","title":"<code>_cleanup_tree(root)</code>  <code>staticmethod</code>","text":"<p>Clean up the tree by removing nodes that have only one child, and nodes that have no children and are not leaves.</p> <p>Parameters:</p> Name Type Description Default <code>root</code> <code>Optional[Self]</code> <p>The root of the tree.</p> required <p>Returns:</p> Type Description <code>Self</code> <p>The root of the cleaned up tree.</p> Source code in <code>src/logos/edge_occurrence_tree.py</code> <pre><code>@staticmethod\ndef _cleanup_tree(root: Optional[Self]) -&gt; Self:\n    \"\"\"\n    Clean up the tree by removing nodes that have only one child, and nodes that have no\n    children and are not leaves.\n\n    Parameters:\n        root: The root of the tree.\n\n    Returns:\n        The root of the cleaned up tree.\n    \"\"\"\n\n    if root is None:\n        return None\n\n    # Recursively clean up left and right subtrees\n    root.left = EdgeOccurrenceTree._cleanup_tree(root.left)\n    root.right = EdgeOccurrenceTree._cleanup_tree(root.right)\n\n    # If the current node has only one child, replace the node with its child\n    if root.left is None and root.right is not None:\n        return root.right\n    elif root.left is not None and root.right is None:\n        return root.left\n\n    # If the current node has no left and right child and is not a leaf, remove the node\n    if root.left is None and root.right is None and root.cluster_id is None:\n        return None\n\n    return root\n</code></pre>"},{"location":"reference/logos/edge_occurrence_tree/#logos.edge_occurrence_tree.EdgeOccurrenceTree.print_tree","title":"<code>print_tree(depth=0)</code>","text":"<p>Print the tree in a readable format.</p> <p>Parameters:</p> Name Type Description Default <code>depth</code> <code>int</code> <p>The depth of the current node in the tree.</p> <code>0</code> Source code in <code>src/logos/edge_occurrence_tree.py</code> <pre><code>def print_tree(self, depth: int = 0) -&gt; None:\n    \"\"\"\n    Print the tree in a readable format.\n\n    Parameters:\n        depth: The depth of the current node in the tree.\n    \"\"\"\n\n    prefix = \"\"\n    for _ in range(depth):\n        prefix += \"-\"\n    if self.cluster_id is not None:\n        print(prefix + str(self.cluster_id))\n    else:\n        print(prefix + \"node\")\n    if self.left:\n        self.left.print_tree(depth + 1)\n    if self.right:\n        self.right.print_tree(depth + 1)\n</code></pre>"},{"location":"reference/logos/edge_occurrence_tree/#logos.edge_occurrence_tree.EdgeOccurrenceTree.assign_dags_to_nodes","title":"<code>assign_dags_to_nodes(cluster_mapping)</code>","text":"<p>Assign each DAG to the node it belongs to, based on <code>cluster_mapping</code>.</p> <p>Parameters:</p> Name Type Description Default <code>cluster_mapping</code> <code>dict[DiGraph, int]</code> <p>A dictionary mapping DAGs to cluster id's.</p> required Source code in <code>src/logos/edge_occurrence_tree.py</code> <pre><code>def assign_dags_to_nodes(self, cluster_mapping: dict[nx.DiGraph, int]) -&gt; None:\n    \"\"\"\n    Assign each DAG to the node it belongs to, based on `cluster_mapping`.\n\n    Parameters:\n        cluster_mapping: A dictionary mapping DAGs to cluster id's.\n    \"\"\"\n    self.num_dags = 0\n\n    # If leaf, assign DAGs and set count.\n    if self.cluster_id is not None:\n        self.dags = [\n            key\n            for key in cluster_mapping.keys()\n            if cluster_mapping[key] == self.cluster_id\n        ]\n        self.num_dags = len(self.dags)\n\n    # Otherwise, recurse for children and retireve counts.\n    if self.left:\n        self.left.assign_dags_to_nodes(cluster_mapping)\n        self.num_dags += self.left.num_dags\n    if self.right:\n        self.right.assign_dags_to_nodes(cluster_mapping)\n        self.num_dags += self.right.num_dags\n</code></pre>"},{"location":"reference/logos/edge_occurrence_tree/#logos.edge_occurrence_tree.EdgeOccurrenceTree.count_edge_occurrences","title":"<code>count_edge_occurrences(treatment, outcome, dag)</code>","text":"<p>Recursively count the number of times each edge occurs amongst the DAGs assigned to all the children of this node, omitting the edge from treatment -&gt; outcome, since this always exists. If a DAG is passed in, ignore the edges in that DAG as well.</p> <p>Parameters:</p> Name Type Description Default <code>treatment</code> <code>str</code> <p>The treatment variable.</p> required <code>outcome</code> <code>str</code> <p>The outcome variable.</p> required <code>dag</code> <code>DiGraph</code> <p>The optional dag structure to ignore.</p> required Source code in <code>src/logos/edge_occurrence_tree.py</code> <pre><code>def count_edge_occurrences(\n    self, treatment: str, outcome: str, dag: nx.DiGraph\n) -&gt; None:\n    \"\"\"\n    Recursively count the number of times each edge occurs amongst the DAGs\n    assigned to all the children of this node, omitting the edge from treatment -&gt; outcome,\n    since this always exists. If a DAG is passed in, ignore the edges in that DAG as well.\n\n    Parameters:\n        treatment: The treatment variable.\n        outcome: The outcome variable.\n        dag: The optional dag structure to ignore.\n    \"\"\"\n    self.edge_counts: Types.EdgeCountDict = defaultdict(int)\n\n    # If leaf, actually compute count.\n    if self.cluster_id is not None:\n        edges_to_ignore = [(treatment, outcome)]\n        if dag:\n            edges_to_ignore.extend(dag.edges)\n        for graph in self.dags:\n            for edge in graph.edges:\n                if edge not in edges_to_ignore:\n                    self.edge_counts[edge] += 1\n\n    # Otherwise, derive counts from children.\n    if self.left:\n        self.left.count_edge_occurrences(treatment, outcome, dag)\n        for key in self.left.edge_counts.keys():\n            self.edge_counts[key] += self.left.edge_counts[key]\n    if self.right:\n        self.right.count_edge_occurrences(treatment, outcome, dag)\n        for key in self.right.edge_counts.keys():\n            self.edge_counts[key] += self.right.edge_counts[key]\n\n    # Compute statistics.\n    freq_counts = list(self.edge_counts.values())\n    if len(freq_counts) == 0:\n        self.mean = None\n        self.std_dev = None\n    else:\n        self.mean = np.mean(freq_counts)\n        self.std_dev = np.std(freq_counts)\n</code></pre>"},{"location":"reference/logos/edge_occurrence_tree/#logos.edge_occurrence_tree.EdgeOccurrenceTree.calculate_edge_expectancy","title":"<code>calculate_edge_expectancy(totals=None)</code>","text":"<p>For each edge at each node, calculate what percent over or under expectancy the edge is at in relationship to its parent.</p> <p>Parameters:</p> Name Type Description Default <code>totals</code> <code>tuple[int, EdgeCountDict]</code> <p>A tuple containing the total number of DAGs and the mapping from edges to their counts for the parent of this node.</p> <code>None</code> Source code in <code>src/logos/edge_occurrence_tree.py</code> <pre><code>def calculate_edge_expectancy(\n    self, totals: tuple[int, Types.EdgeCountDict] = None\n) -&gt; None:\n    \"\"\"\n    For each edge at each node, calculate what percent over or under\n    expectancy the edge is at in relationship to its parent.\n\n    Parameters:\n        totals: A tuple containing the total number of DAGs and the mapping from\n            edges to their counts for the parent of this node.\n    \"\"\"\n    # At root node, calculate expectancy\n    if totals is None:\n        totals = (self.num_dags, self.edge_counts)\n\n    # Otherwise, calculate expectancy based on parent.\n    total_dags, total_edges = totals\n    self.percent_expectancy = defaultdict(float)\n\n    for edge in self.edge_counts.keys():\n        expected = self.num_dags / total_dags * total_edges[edge]\n        self.percent_expectancy[edge] = (\n            self.edge_counts[edge] - expected\n        ) / expected\n\n    # Recurse for children.\n    if self.left:\n        self.left.calculate_edge_expectancy((self.num_dags, self.edge_counts))\n    if self.right:\n        self.right.calculate_edge_expectancy((self.num_dags, self.edge_counts))\n</code></pre>"},{"location":"reference/logos/edge_occurrence_tree/#logos.edge_occurrence_tree.EdgeOccurrenceTree.find_outliers_in_tree","title":"<code>find_outliers_in_tree(threshold=0)</code>","text":"<p>Find outlier edges, based on the percent expectancy of each edge. Define an outlier as an edge that is below expectancy on one side of the tree, and above on the other side, and optionally, over some threshold on both sides.</p> <p>Parameters:</p> Name Type Description Default <code>threshold</code> <code>float</code> <p>The threshold for an edge to be considered an outlier.</p> <code>0</code> Source code in <code>src/logos/edge_occurrence_tree.py</code> <pre><code>def find_outliers_in_tree(self, threshold: float = 0) -&gt; None:\n    \"\"\"\n    Find outlier edges, based on the percent expectancy of each edge. Define an outlier as an\n    edge that is below expectancy on one side of the tree, and above on the other side, and\n    optionally, over some threshold on both sides.\n\n    Parameters:\n        threshold: The threshold for an edge to be considered an outlier.\n    \"\"\"\n\n    # If able to compare, find outliers.\n    if self.left and self.right:\n        self.left.outliers = {}\n        self.right.outliers = {}\n        edges = set(self.left.edge_counts.keys()).union(\n            set(self.right.edge_counts.keys())\n        )\n        for edge in edges:\n            if (\n                np.sign(self.left.percent_expectancy[edge])\n                != np.sign(self.right.percent_expectancy[edge])\n                and abs(self.left.percent_expectancy[edge]) &gt; threshold\n                and abs(self.right.percent_expectancy[edge]) &gt; threshold\n            ):\n                self.left.outliers[edge] = self.left.percent_expectancy[edge]\n                self.right.outliers[edge] = self.right.percent_expectancy[edge]\n\n    # Recurse for children.\n    if self.left:\n        self.left.find_outliers_in_tree(threshold)\n    if self.right:\n        self.right.find_outliers_in_tree(threshold)\n</code></pre>"},{"location":"reference/logos/edge_occurrence_tree/#logos.edge_occurrence_tree.EdgeOccurrenceTree.find_outliers_per_cluster","title":"<code>find_outliers_per_cluster(dag)</code>","text":"<p>Collect the edge counts and outliers found earlier into appropriate dictionaries per cluster.</p> <p>Parameters:</p> Name Type Description Default <code>dag</code> <code>DiGraph</code> <p>The DAG to ignore when collecting outliers.</p> required <p>Returns:</p> Type Description <code>EdgeCountDict</code> <p>A tuple containing the following: a dictionary mapping cluster id's to edge counts,</p> <code>dict[Edge, float]</code> <p>and a dictionary mapping cluster id's to outlier edges.</p> Source code in <code>src/logos/edge_occurrence_tree.py</code> <pre><code>def find_outliers_per_cluster(\n    self,\n    dag: nx.DiGraph,\n) -&gt; tuple[Types.EdgeCountDict, dict[Types.Edge, float]]:\n    \"\"\"\n    Collect the edge counts and outliers found earlier into appropriate dictionaries\n    per cluster.\n\n    Parameters:\n        dag: The DAG to ignore when collecting outliers.\n\n    Returns:\n        A tuple containing the following: a dictionary mapping cluster id's to edge counts,\n        and a dictionary mapping cluster id's to outlier edges.\n    \"\"\"\n\n    cluster_edge_count = {}\n    cluster_outliers = {}\n\n    # If leaf, add to cluster counts.\n    if self.cluster_id is not None:\n        cluster_edge_count[self.cluster_id] = self.edge_counts\n        edges_to_ignore = dag.edges if dag is not None else []\n        cluster_outliers[self.cluster_id] = {\n            edge: self.outliers[edge]\n            for edge in self.outliers\n            if edge not in edges_to_ignore\n        }\n\n    # Otherwise, recurse for children.\n    if self.left:\n        lec, lo = self.left.find_outliers_per_cluster(dag)\n        cluster_edge_count.update(lec)\n        cluster_outliers.update(lo)\n    if self.right:\n        rec, ro = self.right.find_outliers_per_cluster(dag)\n        cluster_edge_count.update(rec)\n        cluster_outliers.update(ro)\n\n    return cluster_edge_count, cluster_outliers\n</code></pre>"},{"location":"reference/logos/edge_state_matrix/","title":"EdgeStateMatrix","text":""},{"location":"reference/logos/edge_state_matrix/#logos.edge_state_matrix.EdgeStateMatrix","title":"<code>EdgeStateMatrix</code>","text":"<p>A class for managing an edge state matrix.</p> <p>An edge state matrix is square, with the entry (i,j) representing the state of the directed edge between nodes i and j. The state of an edge is one of:      0: The existence of the state is undecided.     -1: The edge does not exist.      1: The edge exists.</p> <p>Self-edges are not allowed. The presence of an edge implies the absence of its inverse.</p> Source code in <code>src/logos/edge_state_matrix.py</code> <pre><code>class EdgeStateMatrix:\n    \"\"\"\n    A class for managing an edge state matrix.\n\n    An edge state matrix is square, with the entry (i,j) representing the state\n    of the directed edge between nodes i and j. The state of an edge is one of:\n         0: The existence of the state is undecided.\n        -1: The edge does not exist.\n         1: The edge exists.\n\n    Self-edges are not allowed. The presence of an edge implies the absence of\n    its inverse.\n    \"\"\"\n\n    def __init__(self, variables: list[str]) -&gt; None:\n        \"\"\"\n        Initialize the edge state matrix to the right dimensions and mark self-edges\n        as rejected and all other edges as undecided.\n\n        Parameters:\n            variables: The variables to initialize the edge state matrix based on. This\n                list must include variable NAMES, not tags.\n        \"\"\"\n\n        n = len(variables)\n        self._variables = variables\n        self._m = np.zeros((n, n))\n        for i in range(n):\n            self._m[i, i] = -1\n\n    @property\n    def m(self) -&gt; np.ndarray:\n        \"\"\"\n        Returns the edge state matrix.\n        \"\"\"\n        return self._m\n\n    @property\n    def n(self) -&gt; int:\n        \"\"\"\n        Returns the number of nodes.\n        \"\"\"\n        return self._m.shape[0]\n\n    def clear_and_set_from_graph(self, graph: nx.DiGraph) -&gt; None:\n        \"\"\"\n        Clear the edge state matrix and then set it based on the provided graph.\n        In particular, mark all edges in the graph as accepted and all others as rejected.\n\n        Parameters:\n            graph: The graph to use to set the edge states.\n        \"\"\"\n\n        self._m = np.zeros((self.n, self.n))\n        for edge in graph.edges:\n            print(\"Marking edge as accepted: \", edge)\n            self._m[self.idx(edge[0]), self.idx(edge[1])] = 1\n\n        self._m[self._m == 0] = -1\n\n    def clear_and_set_from_matrix(self, m: np.ndarray) -&gt; None:\n        \"\"\"\n        Clear the edge state matrix and then set it based on the provided matrix.\n\n        Parameters:\n            m: The matrix to use to set the edge states.\n        \"\"\"\n\n        self._m = m\n\n    def idx(self, var: str) -&gt; int:\n        \"\"\"\n        Retrieve the index of a variable in the edge state matrix.\n\n        Parameters:\n            var: The name or tag of the variable.\n\n        Returns:\n            The index of the variable in the edge state matrix.\n        \"\"\"\n        return self._variables.index(var)\n\n    def get_edge_state(self, src: str, dst: str) -&gt; str:\n        \"\"\"\n        Get the state of a specific edge.\n\n        Parameters:\n            src: The name or tag of the source variable.\n            dst: The name or tag of the destination variable.\n\n        Returns:\n            The state of the edge (Accepted, Rejected, or Undecided).\n        \"\"\"\n        src_idx = self.idx(src)\n        dst_idx = self.idx(dst)\n        return self.edge_state_to_str(self._m[src_idx][dst_idx])\n\n    def edge_state_to_str(self, state: int) -&gt; str:\n        \"\"\"\n        Translate between edge value and its interpretation.\n\n        Parameters:\n            state: The state of the edge represented as an integer.\n\n        Returns:\n            The state of the edge (Accepted, Rejected, or Undecided).\n        \"\"\"\n        if state == 0:\n            return \"Undecided\"\n        elif state == -1:\n            return \"Rejected\"\n        elif state == 1:\n            return \"Accepted\"\n        else:\n            raise ValueError(f\"Invalid edge state {state}\")\n\n    def mark_edge(self, src: str, dst: str, state: str) -&gt; list[str]:\n        \"\"\"\n        Mark an edge as being in a specified state.\n\n        Parameters:\n            src: The name or tag of the source variable.\n            dst: The name or tag of the destination variable.\n            state: The state to mark the edge with (Accepted, Rejected, or Undecided).\n\n        Returns:\n            A list of variables that were removed from the partial causal graph as a result\n            of this edge being marked as Accepted.\n\n        Throws:\n            ValueError: If `state` is not one of \"Accepted\", \"Rejected\", or \"Undecided\".\n        \"\"\"\n\n        src_idx = self.idx(src)\n        dst_idx = self.idx(dst)\n\n        if state == \"Accepted\":\n            self._m[src_idx][dst_idx] = 1\n            self._m[dst_idx][src_idx] = -1\n            return self._reject_other_variants(src, dst)\n        elif state == \"Rejected\":\n            self._m[src_idx][dst_idx] = -1\n            return []\n        elif state == \"Undecided\":\n            self._m[src_idx][dst_idx] = 0\n            return []\n        else:\n            raise ValueError(f\"Invalid edge state {state}\")\n\n    def _reject_other_variants(self, src: str, dst: str) -&gt; list[str]:\n        \"\"\"\n        Mark any edges that touch a variable different from `src` and `dst`, but sharing\n        the same base variable as `src` or `dst`, as rejected. Also remove any such variables\n        from the partial causal graph.\n\n        Parameters:\n            src: The name or tag of the source variable.\n            dst: The name or tag of the destination variable.\n\n        Returns:\n            A list of variables that were removed from the partial causal graph as a result\n            of this edge being marked as Accepted.\n        \"\"\"\n\n        src_base = PreparedVariableName(src).base_var()\n        dst_base = PreparedVariableName(dst).base_var()\n\n        l = []\n        for var in self._variables:\n            var_base = PreparedVariableName(var).base_var()\n            if (var_base == src_base and var != src) or (\n                var_base == dst_base and var != dst\n            ):\n                self._m[self.idx(var), :] = -1\n                self._m[:, self.idx(var)] = -1\n                l.append(var)\n\n        return l \n\n    @staticmethod\n    def enumerate_with_max_edges(n: int, max_edges: int) -&gt; list[np.ndarray]:\n        \"\"\"\n        Enumerate all edge state matrices of dimension `n` with at most `max_edges` accepted edges.\n\n        Parameters:\n            n: The dimension of the edge state matrices.\n            max_edges: The maximum number of edges to allow in the edge state matrices.\n\n        Returns:\n            A list of edge state matrices.\n        \"\"\"\n        valid_matrices = {0: [np.full(shape=(n, n), fill_value=-1)]}\n\n        # Enumerate all valid matrices with k edges\n        for k in range(1, max_edges + 1):\n            valid_matrices[k] = []\n\n            # For each valid matrix with k-1 edges...\n            for m in valid_matrices[k - 1]:\n                # ...add a new edge in every possible way\n                for i in range(n):\n                    for j in range(i + 1, n):\n                        if m[i, j] &lt; 0 and m[j, i] &lt; 0:\n                            forward = m.copy()\n                            forward[i, j] = 1\n                            valid_matrices[k].append(forward)\n                            backward = m.copy()\n                            backward[j, i] = 1\n                            valid_matrices[k].append(backward)\n\n        # Flatten the collection of matrices into a single list\n        returned_matrices = []\n        for k in range(1, max_edges + 1):\n            returned_matrices.extend(valid_matrices[k])\n\n        return returned_matrices\n</code></pre>"},{"location":"reference/logos/edge_state_matrix/#logos.edge_state_matrix.EdgeStateMatrix.m","title":"<code>m: np.ndarray</code>  <code>property</code>","text":"<p>Returns the edge state matrix.</p>"},{"location":"reference/logos/edge_state_matrix/#logos.edge_state_matrix.EdgeStateMatrix.n","title":"<code>n: int</code>  <code>property</code>","text":"<p>Returns the number of nodes.</p>"},{"location":"reference/logos/edge_state_matrix/#logos.edge_state_matrix.EdgeStateMatrix.__init__","title":"<code>__init__(variables)</code>","text":"<p>Initialize the edge state matrix to the right dimensions and mark self-edges as rejected and all other edges as undecided.</p> <p>Parameters:</p> Name Type Description Default <code>variables</code> <code>list[str]</code> <p>The variables to initialize the edge state matrix based on. This list must include variable NAMES, not tags.</p> required Source code in <code>src/logos/edge_state_matrix.py</code> <pre><code>def __init__(self, variables: list[str]) -&gt; None:\n    \"\"\"\n    Initialize the edge state matrix to the right dimensions and mark self-edges\n    as rejected and all other edges as undecided.\n\n    Parameters:\n        variables: The variables to initialize the edge state matrix based on. This\n            list must include variable NAMES, not tags.\n    \"\"\"\n\n    n = len(variables)\n    self._variables = variables\n    self._m = np.zeros((n, n))\n    for i in range(n):\n        self._m[i, i] = -1\n</code></pre>"},{"location":"reference/logos/edge_state_matrix/#logos.edge_state_matrix.EdgeStateMatrix.clear_and_set_from_graph","title":"<code>clear_and_set_from_graph(graph)</code>","text":"<p>Clear the edge state matrix and then set it based on the provided graph. In particular, mark all edges in the graph as accepted and all others as rejected.</p> <p>Parameters:</p> Name Type Description Default <code>graph</code> <code>DiGraph</code> <p>The graph to use to set the edge states.</p> required Source code in <code>src/logos/edge_state_matrix.py</code> <pre><code>def clear_and_set_from_graph(self, graph: nx.DiGraph) -&gt; None:\n    \"\"\"\n    Clear the edge state matrix and then set it based on the provided graph.\n    In particular, mark all edges in the graph as accepted and all others as rejected.\n\n    Parameters:\n        graph: The graph to use to set the edge states.\n    \"\"\"\n\n    self._m = np.zeros((self.n, self.n))\n    for edge in graph.edges:\n        print(\"Marking edge as accepted: \", edge)\n        self._m[self.idx(edge[0]), self.idx(edge[1])] = 1\n\n    self._m[self._m == 0] = -1\n</code></pre>"},{"location":"reference/logos/edge_state_matrix/#logos.edge_state_matrix.EdgeStateMatrix.clear_and_set_from_matrix","title":"<code>clear_and_set_from_matrix(m)</code>","text":"<p>Clear the edge state matrix and then set it based on the provided matrix.</p> <p>Parameters:</p> Name Type Description Default <code>m</code> <code>ndarray</code> <p>The matrix to use to set the edge states.</p> required Source code in <code>src/logos/edge_state_matrix.py</code> <pre><code>def clear_and_set_from_matrix(self, m: np.ndarray) -&gt; None:\n    \"\"\"\n    Clear the edge state matrix and then set it based on the provided matrix.\n\n    Parameters:\n        m: The matrix to use to set the edge states.\n    \"\"\"\n\n    self._m = m\n</code></pre>"},{"location":"reference/logos/edge_state_matrix/#logos.edge_state_matrix.EdgeStateMatrix.idx","title":"<code>idx(var)</code>","text":"<p>Retrieve the index of a variable in the edge state matrix.</p> <p>Parameters:</p> Name Type Description Default <code>var</code> <code>str</code> <p>The name or tag of the variable.</p> required <p>Returns:</p> Type Description <code>int</code> <p>The index of the variable in the edge state matrix.</p> Source code in <code>src/logos/edge_state_matrix.py</code> <pre><code>def idx(self, var: str) -&gt; int:\n    \"\"\"\n    Retrieve the index of a variable in the edge state matrix.\n\n    Parameters:\n        var: The name or tag of the variable.\n\n    Returns:\n        The index of the variable in the edge state matrix.\n    \"\"\"\n    return self._variables.index(var)\n</code></pre>"},{"location":"reference/logos/edge_state_matrix/#logos.edge_state_matrix.EdgeStateMatrix.get_edge_state","title":"<code>get_edge_state(src, dst)</code>","text":"<p>Get the state of a specific edge.</p> <p>Parameters:</p> Name Type Description Default <code>src</code> <code>str</code> <p>The name or tag of the source variable.</p> required <code>dst</code> <code>str</code> <p>The name or tag of the destination variable.</p> required <p>Returns:</p> Type Description <code>str</code> <p>The state of the edge (Accepted, Rejected, or Undecided).</p> Source code in <code>src/logos/edge_state_matrix.py</code> <pre><code>def get_edge_state(self, src: str, dst: str) -&gt; str:\n    \"\"\"\n    Get the state of a specific edge.\n\n    Parameters:\n        src: The name or tag of the source variable.\n        dst: The name or tag of the destination variable.\n\n    Returns:\n        The state of the edge (Accepted, Rejected, or Undecided).\n    \"\"\"\n    src_idx = self.idx(src)\n    dst_idx = self.idx(dst)\n    return self.edge_state_to_str(self._m[src_idx][dst_idx])\n</code></pre>"},{"location":"reference/logos/edge_state_matrix/#logos.edge_state_matrix.EdgeStateMatrix.edge_state_to_str","title":"<code>edge_state_to_str(state)</code>","text":"<p>Translate between edge value and its interpretation.</p> <p>Parameters:</p> Name Type Description Default <code>state</code> <code>int</code> <p>The state of the edge represented as an integer.</p> required <p>Returns:</p> Type Description <code>str</code> <p>The state of the edge (Accepted, Rejected, or Undecided).</p> Source code in <code>src/logos/edge_state_matrix.py</code> <pre><code>def edge_state_to_str(self, state: int) -&gt; str:\n    \"\"\"\n    Translate between edge value and its interpretation.\n\n    Parameters:\n        state: The state of the edge represented as an integer.\n\n    Returns:\n        The state of the edge (Accepted, Rejected, or Undecided).\n    \"\"\"\n    if state == 0:\n        return \"Undecided\"\n    elif state == -1:\n        return \"Rejected\"\n    elif state == 1:\n        return \"Accepted\"\n    else:\n        raise ValueError(f\"Invalid edge state {state}\")\n</code></pre>"},{"location":"reference/logos/edge_state_matrix/#logos.edge_state_matrix.EdgeStateMatrix.mark_edge","title":"<code>mark_edge(src, dst, state)</code>","text":"<p>Mark an edge as being in a specified state.</p> <p>Parameters:</p> Name Type Description Default <code>src</code> <code>str</code> <p>The name or tag of the source variable.</p> required <code>dst</code> <code>str</code> <p>The name or tag of the destination variable.</p> required <code>state</code> <code>str</code> <p>The state to mark the edge with (Accepted, Rejected, or Undecided).</p> required <p>Returns:</p> Type Description <code>list[str]</code> <p>A list of variables that were removed from the partial causal graph as a result</p> <code>list[str]</code> <p>of this edge being marked as Accepted.</p> Throws <p>ValueError: If <code>state</code> is not one of \"Accepted\", \"Rejected\", or \"Undecided\".</p> Source code in <code>src/logos/edge_state_matrix.py</code> <pre><code>def mark_edge(self, src: str, dst: str, state: str) -&gt; list[str]:\n    \"\"\"\n    Mark an edge as being in a specified state.\n\n    Parameters:\n        src: The name or tag of the source variable.\n        dst: The name or tag of the destination variable.\n        state: The state to mark the edge with (Accepted, Rejected, or Undecided).\n\n    Returns:\n        A list of variables that were removed from the partial causal graph as a result\n        of this edge being marked as Accepted.\n\n    Throws:\n        ValueError: If `state` is not one of \"Accepted\", \"Rejected\", or \"Undecided\".\n    \"\"\"\n\n    src_idx = self.idx(src)\n    dst_idx = self.idx(dst)\n\n    if state == \"Accepted\":\n        self._m[src_idx][dst_idx] = 1\n        self._m[dst_idx][src_idx] = -1\n        return self._reject_other_variants(src, dst)\n    elif state == \"Rejected\":\n        self._m[src_idx][dst_idx] = -1\n        return []\n    elif state == \"Undecided\":\n        self._m[src_idx][dst_idx] = 0\n        return []\n    else:\n        raise ValueError(f\"Invalid edge state {state}\")\n</code></pre>"},{"location":"reference/logos/edge_state_matrix/#logos.edge_state_matrix.EdgeStateMatrix._reject_other_variants","title":"<code>_reject_other_variants(src, dst)</code>","text":"<p>Mark any edges that touch a variable different from <code>src</code> and <code>dst</code>, but sharing the same base variable as <code>src</code> or <code>dst</code>, as rejected. Also remove any such variables from the partial causal graph.</p> <p>Parameters:</p> Name Type Description Default <code>src</code> <code>str</code> <p>The name or tag of the source variable.</p> required <code>dst</code> <code>str</code> <p>The name or tag of the destination variable.</p> required <p>Returns:</p> Type Description <code>list[str]</code> <p>A list of variables that were removed from the partial causal graph as a result</p> <code>list[str]</code> <p>of this edge being marked as Accepted.</p> Source code in <code>src/logos/edge_state_matrix.py</code> <pre><code>def _reject_other_variants(self, src: str, dst: str) -&gt; list[str]:\n    \"\"\"\n    Mark any edges that touch a variable different from `src` and `dst`, but sharing\n    the same base variable as `src` or `dst`, as rejected. Also remove any such variables\n    from the partial causal graph.\n\n    Parameters:\n        src: The name or tag of the source variable.\n        dst: The name or tag of the destination variable.\n\n    Returns:\n        A list of variables that were removed from the partial causal graph as a result\n        of this edge being marked as Accepted.\n    \"\"\"\n\n    src_base = PreparedVariableName(src).base_var()\n    dst_base = PreparedVariableName(dst).base_var()\n\n    l = []\n    for var in self._variables:\n        var_base = PreparedVariableName(var).base_var()\n        if (var_base == src_base and var != src) or (\n            var_base == dst_base and var != dst\n        ):\n            self._m[self.idx(var), :] = -1\n            self._m[:, self.idx(var)] = -1\n            l.append(var)\n\n    return l \n</code></pre>"},{"location":"reference/logos/edge_state_matrix/#logos.edge_state_matrix.EdgeStateMatrix.enumerate_with_max_edges","title":"<code>enumerate_with_max_edges(n, max_edges)</code>  <code>staticmethod</code>","text":"<p>Enumerate all edge state matrices of dimension <code>n</code> with at most <code>max_edges</code> accepted edges.</p> <p>Parameters:</p> Name Type Description Default <code>n</code> <code>int</code> <p>The dimension of the edge state matrices.</p> required <code>max_edges</code> <code>int</code> <p>The maximum number of edges to allow in the edge state matrices.</p> required <p>Returns:</p> Type Description <code>list[ndarray]</code> <p>A list of edge state matrices.</p> Source code in <code>src/logos/edge_state_matrix.py</code> <pre><code>@staticmethod\ndef enumerate_with_max_edges(n: int, max_edges: int) -&gt; list[np.ndarray]:\n    \"\"\"\n    Enumerate all edge state matrices of dimension `n` with at most `max_edges` accepted edges.\n\n    Parameters:\n        n: The dimension of the edge state matrices.\n        max_edges: The maximum number of edges to allow in the edge state matrices.\n\n    Returns:\n        A list of edge state matrices.\n    \"\"\"\n    valid_matrices = {0: [np.full(shape=(n, n), fill_value=-1)]}\n\n    # Enumerate all valid matrices with k edges\n    for k in range(1, max_edges + 1):\n        valid_matrices[k] = []\n\n        # For each valid matrix with k-1 edges...\n        for m in valid_matrices[k - 1]:\n            # ...add a new edge in every possible way\n            for i in range(n):\n                for j in range(i + 1, n):\n                    if m[i, j] &lt; 0 and m[j, i] &lt; 0:\n                        forward = m.copy()\n                        forward[i, j] = 1\n                        valid_matrices[k].append(forward)\n                        backward = m.copy()\n                        backward[j, i] = 1\n                        valid_matrices[k].append(backward)\n\n    # Flatten the collection of matrices into a single list\n    returned_matrices = []\n    for k in range(1, max_edges + 1):\n        returned_matrices.extend(valid_matrices[k])\n\n    return returned_matrices\n</code></pre>"},{"location":"reference/logos/graph_renderer/","title":"GraphRenderer","text":""},{"location":"reference/logos/graph_renderer/#logos.graph_renderer.GraphRenderer","title":"<code>GraphRenderer</code>","text":"<p>Render a digraph with appropriate margins and node tags.</p> Source code in <code>src/logos/graph_renderer.py</code> <pre><code>class GraphRenderer:\n    \"\"\"\n    Render a digraph with appropriate margins and node tags.\n    \"\"\"\n\n    @staticmethod\n    def draw_graph(graph: nx.DiGraph, var_info: pd.DataFrame) -&gt; str:\n        \"\"\"\n        Draw a graph with appropriate margins and node tags.\n\n        Parameters:\n            graph: The graph to be drawn.\n            var_info: A dataframe containing the tags of the variables in the\n                graph.\n\n        Returns:\n            A base64-encoded string representation of the graph.\n        \"\"\"\n        if graph.number_of_nodes() == 0:\n            return \"\"\n\n        pos = nx.spring_layout(graph)\n        nx.draw(\n            graph,\n            pos,\n            edgelist=graph.edges(),\n            with_labels=False,\n            width=2.0,\n            node_color=\"#d3d3d3\",\n            edge_color=[graph[u][v].get(\"color\", \"#7f9aba\") for u, v in graph.edges()],\n        )\n        node_labels = {\n            n: (\n                n\n                if len(var_info.loc[var_info[\"Name\"] == n, \"Tag\"].values) == 0\n                else var_info.loc[var_info[\"Name\"] == n, \"Tag\"].values[0]\n            )\n            for n in list(graph.nodes)\n        }\n        text = nx.draw_networkx_labels(graph, pos, labels=node_labels, font_size=12)\n        for _, t in text.items():\n            t.set_rotation(30)\n\n        # Fix margins\n        x_values, y_values = zip(*pos.values())\n        x_max, x_min = max(x_values), min(x_values)\n        y_max, y_min = max(y_values), min(y_values)\n        if x_max != x_min:\n            x_margin = (x_max - x_min) * 0.3\n            plt.xlim(x_min - x_margin, x_max + x_margin)\n        if y_max != y_min:\n            y_margin = (y_max - y_min) * 0.3\n            plt.ylim(y_min - y_margin, y_max + y_margin)\n\n        buffer = BytesIO()\n        plt.savefig(buffer, format=\"png\")\n        plt.clf()\n        img_str = base64.b64encode(buffer.getvalue()).decode(\"utf-8\")\n        plt.close()\n\n        return img_str\n\n    @staticmethod\n    def save_graph(graph: nx.DiGraph, var_info: pd.DataFrame, filename: str) -&gt; None:\n        \"\"\"\n        Save the graph to a file as a png image.\n\n        Parameters:\n            graph: The graph to be saved.\n            var_info: A dataframe containing the tags of the variables in the\n                graph.\n            filename: The name of the file to which the graph should be saved.\n        \"\"\"\n        img_str = GraphRenderer.draw_graph(graph, var_info)\n        with open(filename, \"wb\") as f:\n            f.write(base64.b64decode(img_str))\n\n    @staticmethod\n    def graph_string_to_html(graph: str) -&gt; HTML:\n        \"\"\"\n        Convert the string representation of the rgaph to an HTML object\n\n        Parameters:\n            graph: The graph to be displayed.\n        \"\"\"\n        return HTML('&lt;img src=\"data:image/png;base64,{}\" style=\"max-width: 100%; height: auto;\"&gt;'.format(graph))\n\n    @staticmethod\n    def display_graph(graph: nx.DiGraph, var_info: pd.DataFrame) -&gt; None:\n        \"\"\"\n        Display the graph.\n\n        Parameters:\n            graph: The graph to be displayed.\n            var_info: A dataframe containing the tags of the variables in the\n                graph.\n        \"\"\"\n        display(\n            GraphRenderer.graph_string_to_html(\n                GraphRenderer.draw_graph(graph, var_info)\n            )\n        )\n</code></pre>"},{"location":"reference/logos/graph_renderer/#logos.graph_renderer.GraphRenderer.draw_graph","title":"<code>draw_graph(graph, var_info)</code>  <code>staticmethod</code>","text":"<p>Draw a graph with appropriate margins and node tags.</p> <p>Parameters:</p> Name Type Description Default <code>graph</code> <code>DiGraph</code> <p>The graph to be drawn.</p> required <code>var_info</code> <code>DataFrame</code> <p>A dataframe containing the tags of the variables in the graph.</p> required <p>Returns:</p> Type Description <code>str</code> <p>A base64-encoded string representation of the graph.</p> Source code in <code>src/logos/graph_renderer.py</code> <pre><code>@staticmethod\ndef draw_graph(graph: nx.DiGraph, var_info: pd.DataFrame) -&gt; str:\n    \"\"\"\n    Draw a graph with appropriate margins and node tags.\n\n    Parameters:\n        graph: The graph to be drawn.\n        var_info: A dataframe containing the tags of the variables in the\n            graph.\n\n    Returns:\n        A base64-encoded string representation of the graph.\n    \"\"\"\n    if graph.number_of_nodes() == 0:\n        return \"\"\n\n    pos = nx.spring_layout(graph)\n    nx.draw(\n        graph,\n        pos,\n        edgelist=graph.edges(),\n        with_labels=False,\n        width=2.0,\n        node_color=\"#d3d3d3\",\n        edge_color=[graph[u][v].get(\"color\", \"#7f9aba\") for u, v in graph.edges()],\n    )\n    node_labels = {\n        n: (\n            n\n            if len(var_info.loc[var_info[\"Name\"] == n, \"Tag\"].values) == 0\n            else var_info.loc[var_info[\"Name\"] == n, \"Tag\"].values[0]\n        )\n        for n in list(graph.nodes)\n    }\n    text = nx.draw_networkx_labels(graph, pos, labels=node_labels, font_size=12)\n    for _, t in text.items():\n        t.set_rotation(30)\n\n    # Fix margins\n    x_values, y_values = zip(*pos.values())\n    x_max, x_min = max(x_values), min(x_values)\n    y_max, y_min = max(y_values), min(y_values)\n    if x_max != x_min:\n        x_margin = (x_max - x_min) * 0.3\n        plt.xlim(x_min - x_margin, x_max + x_margin)\n    if y_max != y_min:\n        y_margin = (y_max - y_min) * 0.3\n        plt.ylim(y_min - y_margin, y_max + y_margin)\n\n    buffer = BytesIO()\n    plt.savefig(buffer, format=\"png\")\n    plt.clf()\n    img_str = base64.b64encode(buffer.getvalue()).decode(\"utf-8\")\n    plt.close()\n\n    return img_str\n</code></pre>"},{"location":"reference/logos/graph_renderer/#logos.graph_renderer.GraphRenderer.save_graph","title":"<code>save_graph(graph, var_info, filename)</code>  <code>staticmethod</code>","text":"<p>Save the graph to a file as a png image.</p> <p>Parameters:</p> Name Type Description Default <code>graph</code> <code>DiGraph</code> <p>The graph to be saved.</p> required <code>var_info</code> <code>DataFrame</code> <p>A dataframe containing the tags of the variables in the graph.</p> required <code>filename</code> <code>str</code> <p>The name of the file to which the graph should be saved.</p> required Source code in <code>src/logos/graph_renderer.py</code> <pre><code>@staticmethod\ndef save_graph(graph: nx.DiGraph, var_info: pd.DataFrame, filename: str) -&gt; None:\n    \"\"\"\n    Save the graph to a file as a png image.\n\n    Parameters:\n        graph: The graph to be saved.\n        var_info: A dataframe containing the tags of the variables in the\n            graph.\n        filename: The name of the file to which the graph should be saved.\n    \"\"\"\n    img_str = GraphRenderer.draw_graph(graph, var_info)\n    with open(filename, \"wb\") as f:\n        f.write(base64.b64decode(img_str))\n</code></pre>"},{"location":"reference/logos/graph_renderer/#logos.graph_renderer.GraphRenderer.graph_string_to_html","title":"<code>graph_string_to_html(graph)</code>  <code>staticmethod</code>","text":"<p>Convert the string representation of the rgaph to an HTML object</p> <p>Parameters:</p> Name Type Description Default <code>graph</code> <code>str</code> <p>The graph to be displayed.</p> required Source code in <code>src/logos/graph_renderer.py</code> <pre><code>@staticmethod\ndef graph_string_to_html(graph: str) -&gt; HTML:\n    \"\"\"\n    Convert the string representation of the rgaph to an HTML object\n\n    Parameters:\n        graph: The graph to be displayed.\n    \"\"\"\n    return HTML('&lt;img src=\"data:image/png;base64,{}\" style=\"max-width: 100%; height: auto;\"&gt;'.format(graph))\n</code></pre>"},{"location":"reference/logos/graph_renderer/#logos.graph_renderer.GraphRenderer.display_graph","title":"<code>display_graph(graph, var_info)</code>  <code>staticmethod</code>","text":"<p>Display the graph.</p> <p>Parameters:</p> Name Type Description Default <code>graph</code> <code>DiGraph</code> <p>The graph to be displayed.</p> required <code>var_info</code> <code>DataFrame</code> <p>A dataframe containing the tags of the variables in the graph.</p> required Source code in <code>src/logos/graph_renderer.py</code> <pre><code>@staticmethod\ndef display_graph(graph: nx.DiGraph, var_info: pd.DataFrame) -&gt; None:\n    \"\"\"\n    Display the graph.\n\n    Parameters:\n        graph: The graph to be displayed.\n        var_info: A dataframe containing the tags of the variables in the\n            graph.\n    \"\"\"\n    display(\n        GraphRenderer.graph_string_to_html(\n            GraphRenderer.draw_graph(graph, var_info)\n        )\n    )\n</code></pre>"},{"location":"reference/logos/interactive_causal_graph_refiner/","title":"InteractiveCausalGraphRefiner","text":""},{"location":"reference/logos/interactive_causal_graph_refiner/#logos.interactive_causal_graph_refiner.InteractiveCausalGraphRefiner","title":"<code>InteractiveCausalGraphRefiner</code>","text":"Source code in <code>src/logos/interactive_causal_graph_refiner.py</code> <pre><code>class InteractiveCausalGraphRefiner:\n\n    @staticmethod\n    def get_suggestion(\n        data: pd.DataFrame,\n        method: InteractiveCausalGraphRefinerMethod,\n        eccs: Optional[ECCS] = None,\n        treatment_name: Optional[str] = None,\n        outcome_name: Optional[str] = None,\n        graph: Optional[nx.DiGraph] = None,\n        model: Optional[str] = None,\n        gpt_log_path: Optional[str] = None,\n        data_tags: Optional[pd.DataFrame] = None,\n    ) -&gt; Edge:\n        \"\"\"\n        Get the next edge for which the user should porduce a judgment, in the\n        process of refining a causal graph.\n\n        Parameters:\n            data: The dataframe containing the data.\n            method: The method to use for suggesting the next edge.\n            eccs: The ECCS object to use for suggesting the next edge. Only applies\n                if `method` is `InteractiveCausalGraphRefinerMethod.LOGOS`.\n            treatment_name: The name of the treatment variable. Only applies if\n                `method` is `InteractiveCausalGraphRefinerMethod.LOGOS` or\n                `InteractiveCausalGraphRefinerMethod.LANGMODEL`.\n            outcome_name: The name of the outcome variable. Only applies if\n                `method` is `InteractiveCausalGraphRefinerMethod.LOGOS` or\n                `InteractiveCausalGraphRefinerMethod.LANGMODEL`.\n            graph: The graph to use for suggesting the next edge. Only applies if\n                `method` is `InteractiveCausalGraphRefinerMethod.REGRESSION` or\n                `InteractiveCausalGraphRefinerMethod.LANGMODEL`.\n            model: The model to use for suggesting the next edge. Only applies if\n                `method` is not `InteractiveCausalGraphRefinerMethod.LANGMODEL`.\n            gpt_log_path: The path to the GPT log file. Only applies if `method` is\n                `InteractiveCausalGraphRefinerMethod.LANGMODEL`.\n            data_tags: The dataframe containing the data tags. Only applies if `method`\n                is `InteractiveCausalGraphRefinerMethod.LANGMODEL`.\n\n        Returns:\n            The next edge for which the user should produce a judgment.\n        \"\"\"\n        if method == InteractiveCausalGraphRefinerMethod.LOGOS:\n            return InteractiveCausalGraphRefiner._get_suggestion_logos(\n                eccs, treatment_name, outcome_name\n            )\n        elif method == InteractiveCausalGraphRefinerMethod.REGRESSION:\n            return InteractiveCausalGraphRefiner._get_suggestion_regression(data, graph)\n        elif method == InteractiveCausalGraphRefinerMethod.LANGMODEL:\n            return InteractiveCausalGraphRefiner._get_suggestion_langmodel(\n                data,\n                data_tags,\n                treatment_name,\n                outcome_name,\n                graph,\n                model,\n                gpt_log_path,\n            )\n        else:\n            raise ValueError(f\"Unknown method: {method}\")\n\n    @staticmethod\n    def _get_suggestion_logos(\n        eccs: ECCS, treatment_name: str, outcome_name: str\n    ) -&gt; Edge:\n        \"\"\"\n        Implement `get_suggestion()` for the `LOGOS` method.\n\n        Parameters:\n            eccs: The ECCS object to use for suggesting the next edge.\n            treatment_name: The name of the treatment variable.\n            outcome_name: The name of the outcome variable.\n\n        Returns:\n            The next edge for which the user should produce a judgment.\n        \"\"\"\n        eccs.set_treatment(treatment_name)\n        eccs.set_outcome(outcome_name)\n        edge_edits, _, _ = eccs.suggest_best_single_adjustment_set_change(\n            max_results=1, use_optimized=True\n        )\n        return edge_edits[0].edge if (edge_edits and len(edge_edits) &gt; 0) else None\n\n    most_recent_graph = None\n    cache = []\n\n    @classmethod\n    def _get_suggestion_regression(cls, data: pd.DataFrame, graph: nx.DiGraph) -&gt; Edge:\n        \"\"\"\n        Implement `get_suggestion()` for the `REGRESSION` method.\n\n        Parameters:\n            data: The dataframe containing the data.\n            graph: The graph to use for suggesting the next edge.\n        \"\"\"\n        if graph != cls.most_recent_graph:\n            cls.most_recent_graph = graph\n            cls.cache = []\n        if len(cls.cache) &gt; 0:\n            return cls.cache.pop(0)\n\n        l = []\n\n        data, _ = Regression.get_normalized_copy(data)\n\n        for v in graph.nodes:\n            for w in set(data.columns) - set(graph.neighbors(v)) - set([v]):\n                d = Regression.ols(w, data[w], data[v])\n                abs_slope = abs(d[\"Slope\"])\n                l.append((Edge((w, v)), abs_slope))\n\n        l.sort(key=lambda x: x[1], reverse=True)\n        cls.cache = [row[0] for row in l[1:]]\n\n        return l[0][0]\n\n    @classmethod\n    def _get_suggestion_langmodel(\n        cls,\n        data: pd.DataFrame,\n        data_tags: pd.DataFrame,\n        treatment_name: str,\n        outcome_name: str,\n        graph: nx.DiGraph,\n        model: str = \"gpt-4o-mini-2024-07-18\",\n        gpt_log_path: Optional[str] = None,\n    ) -&gt; Edge:\n        \"\"\"\n        Implement `get_suggestion()` for the `LANGMODEL` method.\n\n        Parameters:\n            data: The dataframe containing the data.\n            treatment_name: The name of the treatment variable.\n            outcome_name: The name of the outcome variable.\n            graph: The graph to use for suggesting the next edge.\n            model: The model to use for suggesting the next edge.\n            gpt_log_path: The path to the GPT log file.\n            data_tags: The dataframe containing the data tags.\n        \"\"\"\n        if graph != cls.most_recent_graph:\n            cls.most_recent_graph = graph\n            cls.cache = []\n        if len(cls.cache) &gt; 0:\n            return cls.cache.pop(0)\n\n        client = OpenAI()\n\n        treatment_tag = TagUtils.tag_of(data_tags, treatment_name, \"prepared\")\n        outcome_tag = TagUtils.tag_of(data_tags, outcome_name, \"prepared\")\n\n        num_samples_per_var = 3\n\n        if gpt_log_path == None:\n            gpt_log_path = (\n                f\"ranker-gpt-{datetime.now().strftime('%Y-%m-%d-%H-%M-%S')}.log\"\n            )\n        with open(gpt_log_path, \"w+\") as f:\n\n            # Define the messages to send to the model\n            messages = [\n                {\n                    \"role\": \"system\",\n                    \"content\": \"You are a helpful assistant for causal reasoning.\",\n                },\n                {\n                    \"role\": \"user\",\n                    \"content\": f\"\"\"Below is a list of variable names and some example distinct values for each. \"\"\"\n                    f\"\"\"The lists are not sorted in compatible ways, so that elements in the same position may not correspond to the same entity. \"\"\"\n                    f\"\"\"{', '.join([f'{TagUtils.tag_of(data_tags, v, \"prepared\")}: [{\", \".join(str(x) for x in data[v].unique().tolist()[:num_samples_per_var])}]' for v in data.columns])}\"\"\"\n                    \"\"\"\\n\\n\"\"\"\n                    \"\"\"I have constructed a partial causal graph over these variables. Here is the list of directed edges: \"\"\"\n                    f\"\"\"[{', '.join([f'({TagUtils.tag_of(data_tags, u, \"prepared\")}, {TagUtils.tag_of(data_tags, v, \"prepared\")})' for u, v in graph.edges])}]\"\"\"\n                    \"\"\"\\n\\n\"\"\"\n                    f\"\"\"I plan to use this causal graph to calculate the ATE of {treatment_tag} on {outcome_tag}. \"\"\"\n                    \"\"\"However, I'm not sure of its correctness nor completeness. \"\"\"\n                    \"\"\"I want you to rank pairs of variables from this collection of variables, based on how important it is for me to either add or remove an edge between them in the graph\"\"\"\n                    \"\"\" for the accuracy of my ATE calculation. \"\"\"\n                    \"\"\"I understand that you may think this is speculative, but I want you to do your best to come up with such a ranked list ALWAYS. \"\"\"\n                    \"\"\"I will interpret any results you give me knowing that you may not be sure about them. \"\"\"\n                    \"\"\"Only return the ranked answers, one per line, preceded by a number and a period. Separate each variable in a pair with a comma. \"\"\"\n                    \"\"\"Do not return any other text before or after the list.\"\"\",\n                },\n            ]\n\n            reply = (\n                client.chat.completions.create(model=model, messages=messages)\n                .choices[0]\n                .message.content\n            )\n\n            # Log the messages and the reply\n            f.write(f\"{datetime.now()}\\n\")\n            f.write(\"Messages:\\n\")\n            for message in messages:\n                f.write(f\"{message['role']}: {message['content']}\\n\")\n            f.write(\"----------------\\n\")\n            f.write(f\"Reply: {reply}\\n\\n\")\n            f.write(\"================\\n\")\n            f.flush()\n            f.close()\n\n        # Combat hallucinations\n        reply_rows = reply.split(\"\\n\")\n        reply_rows = [\n            row for row in reply_rows if row.strip() != \"\" and row[0].isdigit()\n        ]\n        possibly_ranked_edges = [\n            [v.strip() for v in \".\".join(row.split(\".\")[1:]).strip().split(\",\")]\n            for row in reply_rows\n        ]\n        print(possibly_ranked_edges)\n        ranked_edges = []\n        tags = data_tags[\"Tag\"].values\n        for edge in possibly_ranked_edges:\n            if len(edge) != 2:\n                continue\n\n            left = None\n            right = None\n\n            if edge[0] in tags:\n                left = edge[0]\n            elif f\"{edge[0]} mean\" in tags:\n                left = f\"{edge[0]} mean\"\n\n            if edge[1] in tags:\n                right = edge[1]\n            elif f\"{edge[1]} mean\" in tags:\n                right = f\"{edge[1]} mean\"\n\n            if left is not None and right is not None:\n                ranked_edges.append(Edge((left, right)))\n\n        cls.cache = ranked_edges[1:]\n        return ranked_edges[0]\n</code></pre>"},{"location":"reference/logos/interactive_causal_graph_refiner/#logos.interactive_causal_graph_refiner.InteractiveCausalGraphRefiner.get_suggestion","title":"<code>get_suggestion(data, method, eccs=None, treatment_name=None, outcome_name=None, graph=None, model=None, gpt_log_path=None, data_tags=None)</code>  <code>staticmethod</code>","text":"<p>Get the next edge for which the user should porduce a judgment, in the process of refining a causal graph.</p> <p>Parameters:</p> Name Type Description Default <code>data</code> <code>DataFrame</code> <p>The dataframe containing the data.</p> required <code>method</code> <code>InteractiveCausalGraphRefinerMethod</code> <p>The method to use for suggesting the next edge.</p> required <code>eccs</code> <code>Optional[ECCS]</code> <p>The ECCS object to use for suggesting the next edge. Only applies if <code>method</code> is <code>InteractiveCausalGraphRefinerMethod.LOGOS</code>.</p> <code>None</code> <code>treatment_name</code> <code>Optional[str]</code> <p>The name of the treatment variable. Only applies if <code>method</code> is <code>InteractiveCausalGraphRefinerMethod.LOGOS</code> or <code>InteractiveCausalGraphRefinerMethod.LANGMODEL</code>.</p> <code>None</code> <code>outcome_name</code> <code>Optional[str]</code> <p>The name of the outcome variable. Only applies if <code>method</code> is <code>InteractiveCausalGraphRefinerMethod.LOGOS</code> or <code>InteractiveCausalGraphRefinerMethod.LANGMODEL</code>.</p> <code>None</code> <code>graph</code> <code>Optional[DiGraph]</code> <p>The graph to use for suggesting the next edge. Only applies if <code>method</code> is <code>InteractiveCausalGraphRefinerMethod.REGRESSION</code> or <code>InteractiveCausalGraphRefinerMethod.LANGMODEL</code>.</p> <code>None</code> <code>model</code> <code>Optional[str]</code> <p>The model to use for suggesting the next edge. Only applies if <code>method</code> is not <code>InteractiveCausalGraphRefinerMethod.LANGMODEL</code>.</p> <code>None</code> <code>gpt_log_path</code> <code>Optional[str]</code> <p>The path to the GPT log file. Only applies if <code>method</code> is <code>InteractiveCausalGraphRefinerMethod.LANGMODEL</code>.</p> <code>None</code> <code>data_tags</code> <code>Optional[DataFrame]</code> <p>The dataframe containing the data tags. Only applies if <code>method</code> is <code>InteractiveCausalGraphRefinerMethod.LANGMODEL</code>.</p> <code>None</code> <p>Returns:</p> Type Description <code>Edge</code> <p>The next edge for which the user should produce a judgment.</p> Source code in <code>src/logos/interactive_causal_graph_refiner.py</code> <pre><code>@staticmethod\ndef get_suggestion(\n    data: pd.DataFrame,\n    method: InteractiveCausalGraphRefinerMethod,\n    eccs: Optional[ECCS] = None,\n    treatment_name: Optional[str] = None,\n    outcome_name: Optional[str] = None,\n    graph: Optional[nx.DiGraph] = None,\n    model: Optional[str] = None,\n    gpt_log_path: Optional[str] = None,\n    data_tags: Optional[pd.DataFrame] = None,\n) -&gt; Edge:\n    \"\"\"\n    Get the next edge for which the user should porduce a judgment, in the\n    process of refining a causal graph.\n\n    Parameters:\n        data: The dataframe containing the data.\n        method: The method to use for suggesting the next edge.\n        eccs: The ECCS object to use for suggesting the next edge. Only applies\n            if `method` is `InteractiveCausalGraphRefinerMethod.LOGOS`.\n        treatment_name: The name of the treatment variable. Only applies if\n            `method` is `InteractiveCausalGraphRefinerMethod.LOGOS` or\n            `InteractiveCausalGraphRefinerMethod.LANGMODEL`.\n        outcome_name: The name of the outcome variable. Only applies if\n            `method` is `InteractiveCausalGraphRefinerMethod.LOGOS` or\n            `InteractiveCausalGraphRefinerMethod.LANGMODEL`.\n        graph: The graph to use for suggesting the next edge. Only applies if\n            `method` is `InteractiveCausalGraphRefinerMethod.REGRESSION` or\n            `InteractiveCausalGraphRefinerMethod.LANGMODEL`.\n        model: The model to use for suggesting the next edge. Only applies if\n            `method` is not `InteractiveCausalGraphRefinerMethod.LANGMODEL`.\n        gpt_log_path: The path to the GPT log file. Only applies if `method` is\n            `InteractiveCausalGraphRefinerMethod.LANGMODEL`.\n        data_tags: The dataframe containing the data tags. Only applies if `method`\n            is `InteractiveCausalGraphRefinerMethod.LANGMODEL`.\n\n    Returns:\n        The next edge for which the user should produce a judgment.\n    \"\"\"\n    if method == InteractiveCausalGraphRefinerMethod.LOGOS:\n        return InteractiveCausalGraphRefiner._get_suggestion_logos(\n            eccs, treatment_name, outcome_name\n        )\n    elif method == InteractiveCausalGraphRefinerMethod.REGRESSION:\n        return InteractiveCausalGraphRefiner._get_suggestion_regression(data, graph)\n    elif method == InteractiveCausalGraphRefinerMethod.LANGMODEL:\n        return InteractiveCausalGraphRefiner._get_suggestion_langmodel(\n            data,\n            data_tags,\n            treatment_name,\n            outcome_name,\n            graph,\n            model,\n            gpt_log_path,\n        )\n    else:\n        raise ValueError(f\"Unknown method: {method}\")\n</code></pre>"},{"location":"reference/logos/interactive_causal_graph_refiner/#logos.interactive_causal_graph_refiner.InteractiveCausalGraphRefiner._get_suggestion_logos","title":"<code>_get_suggestion_logos(eccs, treatment_name, outcome_name)</code>  <code>staticmethod</code>","text":"<p>Implement <code>get_suggestion()</code> for the <code>LOGOS</code> method.</p> <p>Parameters:</p> Name Type Description Default <code>eccs</code> <code>ECCS</code> <p>The ECCS object to use for suggesting the next edge.</p> required <code>treatment_name</code> <code>str</code> <p>The name of the treatment variable.</p> required <code>outcome_name</code> <code>str</code> <p>The name of the outcome variable.</p> required <p>Returns:</p> Type Description <code>Edge</code> <p>The next edge for which the user should produce a judgment.</p> Source code in <code>src/logos/interactive_causal_graph_refiner.py</code> <pre><code>@staticmethod\ndef _get_suggestion_logos(\n    eccs: ECCS, treatment_name: str, outcome_name: str\n) -&gt; Edge:\n    \"\"\"\n    Implement `get_suggestion()` for the `LOGOS` method.\n\n    Parameters:\n        eccs: The ECCS object to use for suggesting the next edge.\n        treatment_name: The name of the treatment variable.\n        outcome_name: The name of the outcome variable.\n\n    Returns:\n        The next edge for which the user should produce a judgment.\n    \"\"\"\n    eccs.set_treatment(treatment_name)\n    eccs.set_outcome(outcome_name)\n    edge_edits, _, _ = eccs.suggest_best_single_adjustment_set_change(\n        max_results=1, use_optimized=True\n    )\n    return edge_edits[0].edge if (edge_edits and len(edge_edits) &gt; 0) else None\n</code></pre>"},{"location":"reference/logos/interactive_causal_graph_refiner/#logos.interactive_causal_graph_refiner.InteractiveCausalGraphRefiner._get_suggestion_regression","title":"<code>_get_suggestion_regression(data, graph)</code>  <code>classmethod</code>","text":"<p>Implement <code>get_suggestion()</code> for the <code>REGRESSION</code> method.</p> <p>Parameters:</p> Name Type Description Default <code>data</code> <code>DataFrame</code> <p>The dataframe containing the data.</p> required <code>graph</code> <code>DiGraph</code> <p>The graph to use for suggesting the next edge.</p> required Source code in <code>src/logos/interactive_causal_graph_refiner.py</code> <pre><code>@classmethod\ndef _get_suggestion_regression(cls, data: pd.DataFrame, graph: nx.DiGraph) -&gt; Edge:\n    \"\"\"\n    Implement `get_suggestion()` for the `REGRESSION` method.\n\n    Parameters:\n        data: The dataframe containing the data.\n        graph: The graph to use for suggesting the next edge.\n    \"\"\"\n    if graph != cls.most_recent_graph:\n        cls.most_recent_graph = graph\n        cls.cache = []\n    if len(cls.cache) &gt; 0:\n        return cls.cache.pop(0)\n\n    l = []\n\n    data, _ = Regression.get_normalized_copy(data)\n\n    for v in graph.nodes:\n        for w in set(data.columns) - set(graph.neighbors(v)) - set([v]):\n            d = Regression.ols(w, data[w], data[v])\n            abs_slope = abs(d[\"Slope\"])\n            l.append((Edge((w, v)), abs_slope))\n\n    l.sort(key=lambda x: x[1], reverse=True)\n    cls.cache = [row[0] for row in l[1:]]\n\n    return l[0][0]\n</code></pre>"},{"location":"reference/logos/interactive_causal_graph_refiner/#logos.interactive_causal_graph_refiner.InteractiveCausalGraphRefiner._get_suggestion_langmodel","title":"<code>_get_suggestion_langmodel(data, data_tags, treatment_name, outcome_name, graph, model='gpt-4o-mini-2024-07-18', gpt_log_path=None)</code>  <code>classmethod</code>","text":"<p>Implement <code>get_suggestion()</code> for the <code>LANGMODEL</code> method.</p> <p>Parameters:</p> Name Type Description Default <code>data</code> <code>DataFrame</code> <p>The dataframe containing the data.</p> required <code>treatment_name</code> <code>str</code> <p>The name of the treatment variable.</p> required <code>outcome_name</code> <code>str</code> <p>The name of the outcome variable.</p> required <code>graph</code> <code>DiGraph</code> <p>The graph to use for suggesting the next edge.</p> required <code>model</code> <code>str</code> <p>The model to use for suggesting the next edge.</p> <code>'gpt-4o-mini-2024-07-18'</code> <code>gpt_log_path</code> <code>Optional[str]</code> <p>The path to the GPT log file.</p> <code>None</code> <code>data_tags</code> <code>DataFrame</code> <p>The dataframe containing the data tags.</p> required Source code in <code>src/logos/interactive_causal_graph_refiner.py</code> <pre><code>@classmethod\ndef _get_suggestion_langmodel(\n    cls,\n    data: pd.DataFrame,\n    data_tags: pd.DataFrame,\n    treatment_name: str,\n    outcome_name: str,\n    graph: nx.DiGraph,\n    model: str = \"gpt-4o-mini-2024-07-18\",\n    gpt_log_path: Optional[str] = None,\n) -&gt; Edge:\n    \"\"\"\n    Implement `get_suggestion()` for the `LANGMODEL` method.\n\n    Parameters:\n        data: The dataframe containing the data.\n        treatment_name: The name of the treatment variable.\n        outcome_name: The name of the outcome variable.\n        graph: The graph to use for suggesting the next edge.\n        model: The model to use for suggesting the next edge.\n        gpt_log_path: The path to the GPT log file.\n        data_tags: The dataframe containing the data tags.\n    \"\"\"\n    if graph != cls.most_recent_graph:\n        cls.most_recent_graph = graph\n        cls.cache = []\n    if len(cls.cache) &gt; 0:\n        return cls.cache.pop(0)\n\n    client = OpenAI()\n\n    treatment_tag = TagUtils.tag_of(data_tags, treatment_name, \"prepared\")\n    outcome_tag = TagUtils.tag_of(data_tags, outcome_name, \"prepared\")\n\n    num_samples_per_var = 3\n\n    if gpt_log_path == None:\n        gpt_log_path = (\n            f\"ranker-gpt-{datetime.now().strftime('%Y-%m-%d-%H-%M-%S')}.log\"\n        )\n    with open(gpt_log_path, \"w+\") as f:\n\n        # Define the messages to send to the model\n        messages = [\n            {\n                \"role\": \"system\",\n                \"content\": \"You are a helpful assistant for causal reasoning.\",\n            },\n            {\n                \"role\": \"user\",\n                \"content\": f\"\"\"Below is a list of variable names and some example distinct values for each. \"\"\"\n                f\"\"\"The lists are not sorted in compatible ways, so that elements in the same position may not correspond to the same entity. \"\"\"\n                f\"\"\"{', '.join([f'{TagUtils.tag_of(data_tags, v, \"prepared\")}: [{\", \".join(str(x) for x in data[v].unique().tolist()[:num_samples_per_var])}]' for v in data.columns])}\"\"\"\n                \"\"\"\\n\\n\"\"\"\n                \"\"\"I have constructed a partial causal graph over these variables. Here is the list of directed edges: \"\"\"\n                f\"\"\"[{', '.join([f'({TagUtils.tag_of(data_tags, u, \"prepared\")}, {TagUtils.tag_of(data_tags, v, \"prepared\")})' for u, v in graph.edges])}]\"\"\"\n                \"\"\"\\n\\n\"\"\"\n                f\"\"\"I plan to use this causal graph to calculate the ATE of {treatment_tag} on {outcome_tag}. \"\"\"\n                \"\"\"However, I'm not sure of its correctness nor completeness. \"\"\"\n                \"\"\"I want you to rank pairs of variables from this collection of variables, based on how important it is for me to either add or remove an edge between them in the graph\"\"\"\n                \"\"\" for the accuracy of my ATE calculation. \"\"\"\n                \"\"\"I understand that you may think this is speculative, but I want you to do your best to come up with such a ranked list ALWAYS. \"\"\"\n                \"\"\"I will interpret any results you give me knowing that you may not be sure about them. \"\"\"\n                \"\"\"Only return the ranked answers, one per line, preceded by a number and a period. Separate each variable in a pair with a comma. \"\"\"\n                \"\"\"Do not return any other text before or after the list.\"\"\",\n            },\n        ]\n\n        reply = (\n            client.chat.completions.create(model=model, messages=messages)\n            .choices[0]\n            .message.content\n        )\n\n        # Log the messages and the reply\n        f.write(f\"{datetime.now()}\\n\")\n        f.write(\"Messages:\\n\")\n        for message in messages:\n            f.write(f\"{message['role']}: {message['content']}\\n\")\n        f.write(\"----------------\\n\")\n        f.write(f\"Reply: {reply}\\n\\n\")\n        f.write(\"================\\n\")\n        f.flush()\n        f.close()\n\n    # Combat hallucinations\n    reply_rows = reply.split(\"\\n\")\n    reply_rows = [\n        row for row in reply_rows if row.strip() != \"\" and row[0].isdigit()\n    ]\n    possibly_ranked_edges = [\n        [v.strip() for v in \".\".join(row.split(\".\")[1:]).strip().split(\",\")]\n        for row in reply_rows\n    ]\n    print(possibly_ranked_edges)\n    ranked_edges = []\n    tags = data_tags[\"Tag\"].values\n    for edge in possibly_ranked_edges:\n        if len(edge) != 2:\n            continue\n\n        left = None\n        right = None\n\n        if edge[0] in tags:\n            left = edge[0]\n        elif f\"{edge[0]} mean\" in tags:\n            left = f\"{edge[0]} mean\"\n\n        if edge[1] in tags:\n            right = edge[1]\n        elif f\"{edge[1]} mean\" in tags:\n            right = f\"{edge[1]} mean\"\n\n        if left is not None and right is not None:\n            ranked_edges.append(Edge((left, right)))\n\n    cls.cache = ranked_edges[1:]\n    return ranked_edges[0]\n</code></pre>"},{"location":"reference/logos/logos/","title":"LOGos","text":""},{"location":"reference/logos/logos/#logos.logos.LOGos","title":"<code>LOGos</code>","text":"<p>LOGos provides a high-level interface for causal analysis of event logs.</p> Source code in <code>src/logos/logos.py</code> <pre><code>class LOGos:\n    \"\"\"\n    LOGos provides a high-level interface for causal analysis of event logs.\n    \"\"\"\n\n    def _set_vars_to_defaults(self) -&gt; None:\n        \"\"\"\n        Set some of the variables to their default values.\n        \"\"\"\n        # The parsed log as a dataframe, and metadata about the parsed variables.\n        self._parsed_log: pd.DataFrame = pd.DataFrame()\n        self._parsed_variables: pd.DataFrame = pd.DataFrame()\n        self._parsed_templates: pd.DataFrame = pd.DataFrame()\n\n        # The variable used to define causal units and the number of causal units.\n        self._causal_unit_var: Optional[str] = None\n        self._num_causal_units: Optional[int] = None\n\n        # The prepared log as a dataframe, and metadata about the prepared variables.\n        self._prepared_log: pd.DataFrame = pd.DataFrame()\n        self._prepared_variables: pd.DataFrame = pd.DataFrame()\n\n        # The available aggregation and imputation functions.\n        agg_module = importlib.import_module(\"src.logos.aggimp.agg_funcs\")\n        self._agg_funcs: dict[str, Callable] = {\n            n: f for n, f in inspect.getmembers(agg_module, inspect.isfunction)\n        }\n\n        imp_module = importlib.import_module(\"src.logos.aggimp.imp_funcs\")\n        self._imp_funcs: dict[str, Callable] = {\n            n: f for n, f in inspect.getmembers(imp_module, inspect.isfunction)\n        }\n\n        # The graph of causal relationships.\n        self._graph: nx.DiGraph = nx.DiGraph()\n\n        # The exploration progress matrix, indicating which edges have been explored.\n        self._edge_states: Optional[EdgeStateMatrix] = None\n\n        # The most recent next exploration suggestion.\n        self._next_exploration: Optional[str] = None\n\n        # An ECCS object for refinement.\n        self._eccs: Optional[ECCS] = None\n\n    @property\n    def parsed_log(self) -&gt; pd.DataFrame:\n        \"\"\"\n        Get the parsed log as a dataframe.\n        \"\"\"\n        return self._parsed_log\n\n    @property\n    def parsed_variables(self) -&gt; pd.DataFrame:\n        \"\"\"\n        Get the parsed variables as a dataframe.\n        \"\"\"\n        return self._parsed_variables\n\n    @property\n    def parsed_templates(self) -&gt; pd.DataFrame:\n        \"\"\"\n        Get the parsed templates as a dataframe.\n        \"\"\"\n        return self._parsed_templates\n\n    @property\n    def prepared_log(self) -&gt; pd.DataFrame:\n        \"\"\"\n        Get the prepared log as a dataframe.\n        \"\"\"\n        return self._prepared_log\n\n    @property\n    def prepared_variables(self) -&gt; pd.DataFrame:\n        \"\"\"\n        Get the prepared variables as a dataframe.\n        \"\"\"\n        return self._prepared_variables\n\n    @property\n    def prepared_variable_names(self) -&gt; list[str]:\n        \"\"\"\n        Get the names of the prepared variables.\n        \"\"\"\n        return self._prepared_variables[\"Name\"].values.tolist()\n\n    @property\n    def prepared_variable_tags(self) -&gt; list[str]:\n        \"\"\"\n        Get the tags of the prepared variables.\n        \"\"\"\n        return self._prepared_variables[\"Tag\"].values.tolist()\n\n    def prepared_variable_names_with_base_x_and_no_pre_post_agg(\n        self, x: Union[str, PreparedVariableName]\n    ) -&gt; list[str]:\n        \"\"\"\n        Get all prepared variables with the given base variable and no pre-\n        or post-aggregate values.\n\n        Parameters:\n            x: The base variable to check.\n\n        Returns:\n            A list of variables with the given base variable and no pre-\n            or post-aggregate values.\n        \"\"\"\n        return [\n            var\n            for var in self.prepared_variable_names\n            if PreparedVariableName(var).has_base_var(x)\n            and PreparedVariableName(var).no_pre_post_aggs()\n        ]\n\n    @property\n    def num_prepared_variables(self) -&gt; int:\n        \"\"\"\n        Get the number of prepared variables.\n        \"\"\"\n        return len(self.prepared_variables)\n\n    def __init__(\n        self, filename: str, workdir: str, skip_writeout: bool = False\n    ) -&gt; None:\n        \"\"\"\n        Initialize a LOGos instance, giving it the full path to the log file that will be analyzed.\n\n        Parameters:\n            filename: The full path to the log file that will be analyzed.\n            workdir: The directory where the parsed and prepared dataframes will be stored.\n            skip_writeout: Whether to skip writing out the parsed and prepared dataframes.\n        \"\"\"\n\n        self._set_vars_to_defaults()\n        self._filename = filename\n        print(f\"Initialized LOGos with log file {filename}\")\n\n        # Set and create working directory\n        self._workdir = workdir\n        if not os.path.exists(self._workdir):\n            os.makedirs(self._workdir, exist_ok=True)\n        print(f\"Work directory set to {self._workdir}\")\n\n        self._skip_writeout = skip_writeout\n\n    def _get_filename(self, var_name: str) -&gt; str:\n        \"\"\"\n        Create the file name string for dumping/loading pkl files.\n\n        Parameters:\n            var_name: The name of the variable to be dumped/loaded.\n\n        Returns:\n            The file name string.\n        \"\"\"\n        return os.path.join(\n            self._workdir,\n            os.path.basename(self._filename)\n            + f\"{var_name}_{self._causal_unit_var}_{self._num_causal_units}.pkl\",\n        )\n\n    def _find_type(self, row: pd.Series) -&gt; str:\n        \"\"\"\n        Identify the type of a parsed variable.\n\n        Parameters:\n            row: A row of the parsed variables dataframe.\n\n        Returns:\n            The type of the parsed variable as a string. Options are \"date\", \"time\", \"num\" and \"str\".\n        \"\"\"\n\n        with warnings.catch_warnings():\n            warnings.filterwarnings(\"error\", category=UserWarning)\n\n            try:\n                y = pd.to_numeric(row[\"Examples\"], errors=\"raise\")\n                return \"num\"\n            except Exception as e:\n                try:\n                    y = pd.to_timedelta(row[\"Examples\"], errors=\"raise\")\n                    return \"time\"\n                except Exception as e:\n                    try:\n                        y = pd.to_datetime(row[\"Examples\"], errors=\"raise\")\n                        return \"date\"\n                    except Exception as e:\n                        return \"str\"\n\n    def _find_uninteresting(self, row: pd.Series) -&gt; bool:\n        \"\"\"\n        Identify whether a parsed variable is likely to be uninteresting.\n\n        Parameters:\n            row: A row of the parsed variables dataframe.\n\n        Returns:\n            True if the variable is likely to be uninteresting, False otherwise.\n        \"\"\"\n        return (\n            row[\"Type\"] != \"num\"\n            and (self._parsed_log[row[\"Name\"]].nunique() &gt;= 0.15 * row[\"Occurrences\"])\n        ) or (self._parsed_log[row[\"Name\"]].nunique() == 1)\n\n    \"\"\"\n    A default dictionary of regular expressions to be used for parsing the log.\n    \"\"\"\n    DEFAULT_REGEX_DICT = {\n        \"Timestamp\": r\"\\d{4}\\-\\d{2}\\-\\d{2}T\\d{2}:\\d{2}:\\d{2}\\.\\d{6}Z\",\n    }\n\n    def parse(\n        self,\n        regex_dict: dict[str, str] = DEFAULT_REGEX_DICT,\n        sim_thresh: float = 0.65,\n        depth: int = 5,\n        force: bool = False,\n        message_prefix: str = r\".*\",\n        enable_gpt_tagging: bool = False,\n    ) -&gt; str:\n        \"\"\"\n        Parse the log file into a dataframe.\n\n        Parameters:\n            regex_dict: (for Drain) A dictionary of regular expressions to be used for parsing.\n            sim_thresh: (for Drain) The similarity threshold to be used for parsing.\n            depth: (for Drain) The parse tree depth to be used for parsing.\n            force: Whether to force re-parsing of the log file.\n            message_prefix: A prefix used to identify the beginning of each log message.\n                Can be used to collapse multiple lines into a single message. Each line that doesn't start with this\n                prefix will be concatenated to the previous log message.\n            enable_gpt_tagging: A boolean indicating whether GPT tagging should be enabled.\n\n        Returns:\n            The time elapsed for parsing, as a string.\n        \"\"\"\n        start_time = datetime.now()\n        parser = Drain(\n            indir=os.path.dirname(self._filename),\n            depth=depth,\n            st=sim_thresh,\n            rex=regex_dict,\n            skip_writeout=self._skip_writeout,\n            message_prefix=message_prefix,\n        )\n\n        # Check if the parsed files already exist.\n        files_exist = not force\n        parsed_df_names = [\n            nameof(self._parsed_log),\n            nameof(self._parsed_templates),\n            nameof(self._parsed_variables),\n        ]\n        for var_name in parsed_df_names:\n            if not os.path.isfile(self._get_filename(var_name)):\n                files_exist = False\n                break\n\n        if files_exist:\n            self._parsed_log = Pickler.load(self._get_filename(parsed_df_names[0]))\n            self._parsed_templates = Pickler.load(\n                self._get_filename(parsed_df_names[1])\n            )\n            self._parsed_variables = Pickler.load(\n                self._get_filename(parsed_df_names[2])\n            )\n        else:\n            (\n                self._parsed_log,\n                self._parsed_templates,\n                self._parsed_variables,\n            ) = parser.parse(self._filename.split(\"/\")[-1])\n            tqdm.pandas(desc=\"Determining variable types...\")\n            self._parsed_variables[\"Type\"] = self._parsed_variables.progress_apply(\n                self._find_type, axis=1\n            )\n\n            # Cast and convert date columns\n            is_date = self._parsed_variables[\"Type\"] == \"date\"\n            date_cols = self._parsed_variables.loc[is_date, \"Name\"]\n            tqdm.pandas(desc=\"Casting date variables...\")\n            self._parsed_log[date_cols] = self._parsed_log[date_cols].progress_apply(\n                pd.to_datetime, errors=\"coerce\"\n            )\n            tqdm.pandas(desc=\"Casting date variables round 2...\")\n            self._parsed_log[date_cols] = self._parsed_log[date_cols].progress_applymap(\n                lambda x: x.timestamp() if not pd.isnull(x) else None\n            )\n            self._parsed_variables.loc[is_date, \"Type\"] = \"num\"\n\n            # Cast and convert time columns\n            is_time = self._parsed_variables[\"Type\"] == \"time\"\n            time_cols = self._parsed_variables.loc[is_time, \"Name\"]\n            tqdm.pandas(desc=\"Casting time variables...\")\n            self._parsed_log[time_cols] = self._parsed_log[time_cols].progress_apply(\n                pd.to_timedelta, errors=\"coerce\"\n            )\n            tqdm.pandas(desc=\"Casting time variables round 2...\")\n            self._parsed_log[time_cols] = self._parsed_log[time_cols].progress_applymap(\n                lambda x: x.total_seconds() if not pd.isnull(x) else None\n            )\n            self._parsed_variables.loc[is_time, \"Type\"] = \"num\"\n\n            # Cast numeric columns\n            is_num = self._parsed_variables[\"Type\"] == \"num\"\n            numeric_cols = self._parsed_variables.loc[is_num, \"Name\"]\n            tqdm.pandas(desc=\"Casting numerical variables...\")\n            self._parsed_log[numeric_cols] = self._parsed_log[\n                numeric_cols\n            ].progress_apply(pd.to_numeric, errors=\"coerce\")\n\n            # Tag variables.\n            tqdm.pandas(desc=\"Tagging variables...\")\n            if enable_gpt_tagging:\n                tag, tag_origin = zip(\n                    *self._parsed_variables.progress_apply(\n                        lambda x: TagUtils.waterfall_tag(self.parsed_templates, x),\n                        axis=1,\n                    )\n                )\n            else:\n                tag, tag_origin = zip(\n                    *self._parsed_variables.progress_apply(\n                        lambda x: TagUtils.preceding_tokens_tag(x),\n                        axis=1,\n                    )\n                )\n            self._parsed_variables[\"Tag\"] = tag\n            self._parsed_variables[\"TagOrigin\"] = tag_origin\n            TagUtils.deduplicate_tags(self._parsed_variables)\n\n            # Detect identifiers.\n            tqdm.pandas(desc=\"Detecting identifiers...\")\n            self._parsed_variables[\"IsUninteresting\"] = (\n                self._parsed_variables.progress_apply(self._find_uninteresting, axis=1)\n            )\n\n            # Reorder columns.\n            self._parsed_variables = self._parsed_variables[\n                [\n                    \"Name\",\n                    \"Tag\",\n                    \"TagOrigin\",\n                    \"Type\",\n                    \"IsUninteresting\",\n                    \"Occurrences\",\n                    \"Preceding 3 tokens\",\n                    \"Examples\",\n                    \"From regex\",\n                ]\n            ]\n\n        # Write out files if appropriate.\n        if not self._skip_writeout and not files_exist:\n            Pickler.dump(self._parsed_log, self._get_filename(parsed_df_names[0]))\n            Pickler.dump(self._parsed_templates, self._get_filename(parsed_df_names[1]))\n            Pickler.dump(self._parsed_variables, self._get_filename(parsed_df_names[2]))\n\n        end_time = datetime.now()\n        elapsed = \"{:.6f}\".format((end_time - start_time).total_seconds())\n        print(f\"Parsing complete in {elapsed} seconds!\")\n        return elapsed\n\n    def include_in_template(\n        self,\n        var: str,\n        enable_gpt_tagging: bool = False,\n        skip_writeout: Optional[bool] = None,\n    ) -&gt; None:\n        \"\"\"\n        Treat a certain parsed variable as part of its template and regenerate parsed dataframes.\n\n        Parameters:\n            var: The name or tag of the variable to be included in its template.\n            enable_gpt_tagging: A boolean indicating whether GPT-3.5 tagging should be enabled.\n            skip_writeout: Whether to skip writing out the regenerated parsed dataframes. Defaults\n                to the value of self._skip_writeout.\n        \"\"\"\n        name = TagUtils.name_of(self._parsed_variables, var, \"parsed\")\n\n        old_template_id = ParsedVariableName(name).template_id()\n        idx = ParsedVariableName(name).index()\n        value_counts = self._parsed_log[name].value_counts().to_dict()\n\n        ### Modify _parsed_templates\n        old_template_row = (\n            self._parsed_templates.loc[\n                self._parsed_templates[\"TemplateId\"] == old_template_id\n            ]\n            .iloc[0]\n            .copy()\n        )\n        toks = old_template_row[\"TemplateText\"].split(\" \")\n        new_template_ids = {}\n        new_variable_indices = old_template_row[\"VariableIndices\"]\n        new_variable_indices.remove(idx)\n\n        for value, occurences in value_counts.items():\n            new_template_row = old_template_row.copy()\n            toks[idx] = value\n\n            new_template_row[\"TemplateText\"] = \" \".join(toks)\n            new_template_row[\"TemplateId\"] = hashlib.md5(\n                new_template_row[\"TemplateText\"].encode(\"utf-8\")\n            ).hexdigest()[0:8]\n            new_template_row[\"Occurrences\"] = occurences\n            new_template_row[\"VariableIndices\"] = new_variable_indices\n            new_template_row[\"RegexIndices\"] = old_template_row[\"RegexIndices\"]\n\n            self._parsed_templates.loc[len(self._parsed_templates)] = new_template_row\n            new_template_ids[value] = new_template_row[\"TemplateId\"]\n\n        self._parsed_templates = self._parsed_templates[\n            self._parsed_templates[\"TemplateId\"] != old_template_id\n        ].reset_index(drop=True)\n\n        ### Modify _parsed_log\n\n        # Update the template ids of all rows that belonged to the old template\n        self._parsed_log[\"TemplateId\"] = self._parsed_log.apply(\n            lambda x: (\n                new_template_ids[x[name]]\n                if (x[\"TemplateId\"] == old_template_id)\n                else x[\"TemplateId\"]\n            ),\n            axis=1,\n        )\n\n        # Create new variables for each new template id and assign the value of the old variables to them\n        new_variables = []\n        for new_template_id in new_template_ids.values():\n            for other_idx in new_variable_indices:\n                new_var_name = f\"{new_template_id}_{str(other_idx)}\"\n                new_variables.append(new_var_name)\n                self._parsed_log[new_var_name] = self._parsed_log.apply(\n                    lambda x: (\n                        x[f\"{old_template_id}_{other_idx}\"]\n                        if (x[\"TemplateId\"] == new_template_id)\n                        else None\n                    ),\n                    axis=1,\n                )\n\n        # Drop variable columns associated with old template id\n        variables_to_drop = [\n            v for v in self._parsed_log.columns if v.startswith(old_template_id)\n        ]\n        self._parsed_log.drop(columns=variables_to_drop, inplace=True)\n\n        ### Modify _parsed_variables\n\n        # Add variable rows for each new variable\n        for value, occurrences in value_counts.items():\n            for other_idx in new_variable_indices:\n                new_template_id = new_template_ids[value]\n                new_var_name = f\"{new_template_id}_{str(other_idx)}\"\n\n                x = {}\n                x[\"Name\"] = new_var_name\n                x[\"Occurrences\"] = occurrences\n                x[\"Preceding 3 tokens\"] = (\n                    self._parsed_templates[\n                        self._parsed_templates[\"TemplateId\"] == new_template_id\n                    ][\"TemplateText\"]\n                    .values[0]\n                    .split()[max(0, other_idx - 3) : other_idx]\n                )\n                x[\"Examples\"] = (\n                    self._parsed_log[new_var_name]\n                    .loc[self._parsed_log[new_var_name].notna()]\n                    .unique()[:5]\n                    .tolist()\n                )\n                x[\"From regex\"] = False\n                if enable_gpt_tagging:\n                    x[\"Tag\"], x[\"TagOrigin\"] = TagUtils.waterfall_tag(\n                        self.parsed_templates, pd.Series(x)\n                    )\n                else:\n                    x[\"Tag\"], x[\"TagOrigin\"] = TagUtils.preceding_tokens_tag(\n                        pd.Series(x)\n                    )\n                x[\"Type\"] = self._find_type(pd.Series(x))\n                x[\"IsUninteresting\"] = self._find_uninteresting(pd.Series(x))\n\n                self._parsed_variables.loc[len(self._parsed_variables)] = x\n\n        # Drop variable rows associated with old template id\n        self._parsed_variables = self._parsed_variables[\n            ~self._parsed_variables[\"Name\"].isin(variables_to_drop)\n        ].reset_index(drop=True)\n\n        # Deduplicate tags again\n        TagUtils.deduplicate_tags(self._parsed_variables)\n\n        # Write out files if appropriate.\n        if skip_writeout is None:\n            skip_writeout = self._skip_writeout\n        if not skip_writeout:\n            print(\"about to write stuff out\")\n            Pickler.dump(self._parsed_log, self._get_filename(nameof(self._parsed_log)))\n            Pickler.dump(\n                self._parsed_templates,\n                self._get_filename(nameof(self._parsed_templates)),\n            )\n            Pickler.dump(\n                self._parsed_variables,\n                self._get_filename(nameof(self._parsed_variables)),\n            )\n\n    def tag_parsed_variable(self, name: str, tag: str) -&gt; None:\n        \"\"\"\n        Tag a parsed variable.\n\n        Parameters:\n            name: The name of the variable to be tagged.\n            tag: The tag to be assigned to the variable.\n        \"\"\"\n        TagUtils.set_tag(self._parsed_variables, name, tag, \"parsed\")\n        TagUtils.deduplicate_tags(self._parsed_variables)\n\n    def get_tag_of_parsed(self, name: str) -&gt; str:\n        \"\"\"\n        Get the tag of a parsed variable.\n\n        Parameters:\n            name: The name of the variable.\n\n        Returns:\n            The tag of the variable.\n        \"\"\"\n        return TagUtils.get_tag(self._parsed_variables, name, \"parsed\")\n\n    def tag_prepared_variable(self, name: str, tag: str) -&gt; None:\n        \"\"\"\n        Tag a prepared variable.\n\n        Parameters:\n            name: The name of the variable to be tagged.\n            tag: The tag to be assigned to the variable.\n        \"\"\"\n        TagUtils.set_tag(self._prepared_variables, name, tag, \"prepared\")\n        TagUtils.deduplicate_tags(self._prepared_variables)\n\n    def get_tag_of_prepared(self, name: str) -&gt; str:\n        \"\"\"\n        Get the tag of a prepared variable.\n\n        Parameters:\n            name: The name of the variable.\n\n        Returns:\n            The tag of the variable.\n        \"\"\"\n        return TagUtils.get_tag(self._prepared_variables, name, \"prepared\")\n\n    def get_causal_unit_info(self) -&gt; Tuple[str, int]:\n        \"\"\"\n        Get the variable used to define causal units and the number of\n        causal units.\n\n        Returns:\n            The name of the variable used to define causal units\n            and the number of causal units.\n        \"\"\"\n        return self._causal_unit_var, self._num_causal_units\n\n    def suggest_causal_unit_defs(\n        self,\n        min_causal_units: int = 4,\n        num_suggestions: int = 10,\n    ) -&gt; Optional[pd.DataFrame]:\n        \"\"\"\n        Suggest at most `num_suggestions` causal unit definitions based on IUS maximization,\n        while returning at least `min_causal_units` causal units.\n\n        Parameters:\n            min_causal_units: The minimum number of causal units that a suggested\n                definition should create.\n            num_suggestions: The maximum number of causal unit definitions to suggest.\n\n        Returns:\n            A DataFrame with one row for each suggested causal unit definition, or `None`\n                if no suggestions were made.\n        \"\"\"\n\n        return CausalUnitSuggester.suggest_causal_unit_defs(\n            self._parsed_log[self._parsed_variables[\"Name\"].values],\n            self._parsed_variables,\n            min_causal_units=min_causal_units,\n            num_suggestions=num_suggestions,\n        )\n\n    def set_causal_unit(\n        self,\n        var: str,\n        num_units: Optional[int] = None,\n    ) -&gt; None:\n        \"\"\"\n        Set the variable used to define causal units and optionally the number of\n        causal units. The latter will be ignored if the variable is categorical, but it\n        must be specified if the variable is numerical.\n\n        Parameters:\n            var: The name or tag of the variable to be used as the causal unit.\n            num_units: The number of causal units to be created.\n\n        Raises:\n            ValueError: If the variable is numerical and `num_units` is not specified.\n        \"\"\"\n        var_name = TagUtils.name_of(self._parsed_variables, var, \"parsed\")\n        var_type = self._parsed_variables.loc[\n            self._parsed_variables[\"Name\"] == var_name, \"Type\"\n        ].values[0]\n\n        if var_type == \"num\" and num_units is None:\n            raise ValueError(\n                \"The number of causal units must be specified if the causal unit is numerical.\"\n            )\n\n        self._causal_unit_var = var_name\n        self._num_causal_units = num_units\n\n        print(\n            f\"Causal unit set to {var_name} (tag: {self.get_tag_of_parsed(var_name)}) \"\n            + (\n                \"\"\n                if not self._num_causal_units\n                else f\" with {self._num_causal_units} causal units.\"\n            )\n        )\n\n    def prepare(\n        self,\n        custom_agg: dict[str, list[str]] = {},\n        custom_imp: dict[str, list[str]] = {},\n        count_occurences: bool = False,\n        ignore_uninteresting: bool = True,\n        force: bool = False,\n        lasso_alpha: float = Pruner.LASSO_DEFAULT_ALPHA,\n        lasso_max_iter: int = Pruner.LASSO_DEFAULT_MAX_ITER,\n        drop_bad_aggs: bool = True,\n        reject_prunable_edges: bool = False,\n    ) -&gt; str:\n        \"\"\"\n        Prepare the log parsed from the table for causal analysis, using aggregation and imputation as needed.\n\n        Parameters:\n            custom_agg: A dictionary of custom aggregation functions to be used for specific variables.\n            custom_imp: A dictionary of custom imputation functions to be used for specific variables.\n            count_occurences: Whether to include extra variables counting the occurence of each template.\n            ignore_uninteresting: Whether to ignore uninteresting variables.\n            force: Whether to force re-preparation of the log.\n            lasso_alpha: The alpha parameter to be used for LASSO regression.\n            lasso_max_iter: The maximum number of iterations to be used for LASSO regression.\n            drop_bad_aggs: Whether to drop prepared variables that do not add information compared to other\n                variables based on the same base variable but using a different aggregation function.\n            reject_prunable_edges: Whether to reject edges that are prunable based on LASSO applciation.\n\n        Returns:\n            The time elapsed for preparation, as a string.\n        \"\"\"\n\n        start_time = datetime.now()\n        # Ensure causal unit is set. TODO: make IUS maximizer the default\n        if self._causal_unit_var is None:\n            print(\"Causal unit not defined. Aborting.\")\n            return None\n\n        # Check if the prepared files already exist.\n        files_exist = not force\n        prepared_df_names = [\n            nameof(self._prepared_log),\n            nameof(self._prepared_variables),\n        ]\n        for var_name in prepared_df_names:\n            if not os.path.isfile(self._get_filename(var_name)):\n                files_exist = False\n                break\n\n        if files_exist:\n            self._prepared_log = Pickler.load(self._get_filename(prepared_df_names[0]))\n            self._prepared_variables = Pickler.load(\n                self._get_filename(prepared_df_names[1])\n            )\n        else:\n            self._prepare_anew(\n                custom_agg,\n                custom_imp,\n                count_occurences=count_occurences,\n                ignore_uninteresting=ignore_uninteresting,\n                drop_bad_aggs=drop_bad_aggs,\n            )\n\n        self._edge_states = EdgeStateMatrix(self.prepared_variable_names)\n        if reject_prunable_edges:\n            print(f\"Pruning edges...\")\n            self.reject_all_prunable_edges(\n                lasso_alpha=lasso_alpha, lasso_max_iter=lasso_max_iter\n            )\n\n        self._eccs = ECCS(self._prepared_log, nx.DiGraph())\n\n        end_time = datetime.now()\n        elapsed = \"{:.6f}\".format((end_time - start_time).total_seconds())\n        print(\n            f\"\"\"Preparation complete in {elapsed} seconds! \"\"\"\n            f\"\"\"{np.count_nonzero(self._edge_states.m == -1)} of the {self.num_prepared_variables ** 2} possible edges were auto-rejected.\"\"\"\n        )\n\n        return elapsed\n\n    def _prepare_anew(\n        self,\n        custom_agg: dict[str, list[str]] = {},\n        custom_imp: dict[str, list[str]] = {},\n        count_occurences: bool = False,\n        ignore_uninteresting: bool = True,\n        drop_bad_aggs: bool = True,\n    ) -&gt; None:\n        \"\"\"\n        Prepare the log anew.\n\n        Parameters:\n            custom_agg: A dictionary of custom aggregation functions to be used for specific variables.\n            custom_imp: A dictionary of custom imputation functions to be used for specific variables.\n            count_occurences: Whether to include extra variables counting the occurence of each template.\n            ignore_uninteresting: Whether to ignore uninteresting variables.\n            drop_bad_aggs: Whether to drop prepared variables that do not add information compared to other\n                variables based on the same base variable but using a different aggregation function.\n        \"\"\"\n\n        print(f\"Determining the causal unit assignment...\")\n        causal_unit_assignment = CausalUnitSuggester._discretize(\n            self._parsed_log[self._causal_unit_var],\n            self._parsed_variables[\n                self._parsed_variables[\"Name\"] == self._causal_unit_var\n            ][\"Type\"].values[0],\n            self._num_causal_units,\n        )\n\n        # Convert keys in custom_agg and custom_imp to the names of the variables, if they are tags.\n        custom_agg = {\n            TagUtils.name_of(self._parsed_variables, k, \"parsed\"): v\n            for k, v in custom_agg.items()\n        }\n        custom_imp = {\n            TagUtils.name_of(self._parsed_variables, k, \"parsed\"): v\n            for k, v in custom_imp.items()\n        }\n\n        # Start with the parsed log, optionally with extra variables counting the occurence of each template.\n        if count_occurences:\n            print(f\"Adding template occurrence count variables...\")\n            self._prepared_log = pd.concat(\n                [\n                    self._parsed_log,\n                    pd.get_dummies(\n                        self._parsed_log[\"TemplateId\"],\n                        prefix=\"TemplateId\",\n                        prefix_sep=\"=\",\n                    ),\n                ],\n                axis=1,\n            )\n        else:\n            self._prepared_log = self._parsed_log.copy(deep=True)\n\n        # No longer need the column storing the actual template IDs\n        self._prepared_log.drop(columns=\"TemplateId\", inplace=True)\n\n        # Build dictionary of aggregation functions\n        agg_dict: dict[str, str] = {\n            variable.Name: (\n                custom_agg[variable.Name]\n                if variable.Name in custom_agg\n                else AggregateSelector.DEFAULT_AGGREGATES[variable.Type]\n            )\n            for variable in self._parsed_variables.itertuples()\n        }\n\n        # Add aggregations for template counts\n        for col in self._prepared_log.columns:\n            if PreparedVariableName(col).base_var() == \"TemplateId\":\n                agg_dict[col] = [\"sum\"]\n\n        # Drop uninteresting columns if requested, except if they are the causal unit.\n        ui_cols = self._parsed_variables.loc[\n            self._parsed_variables[\"IsUninteresting\"], \"Name\"\n        ].values\n        ui_cols = [x for x in ui_cols if x != self._causal_unit_var]\n        if ignore_uninteresting:\n            self._prepared_log.drop(\n                columns=ui_cols,\n                inplace=True,\n            )\n            for col in ui_cols:\n                agg_dict.pop(col, None)\n            print(\n                f\"Dropped {len(ui_cols)} uninteresting columns, out of an original total of {len(self.parsed_variables)}.\"\n            )\n\n        # Ensure the causal unit variable only has one aggregation function\n        agg_dict[self._causal_unit_var] = agg_dict[self._causal_unit_var][:1]\n\n        # Perform the aggregation\n        print(\"Calculating aggregates for each causal unit...\")\n        agg_func_dict: dict[str, list[Callable]] = {\n            name: [self._agg_funcs[f] for f in funcs]\n            for name, funcs in agg_dict.items()\n        }\n        self._prepared_log = self._prepared_log.groupby(\n            causal_unit_assignment\n        ).aggregate(agg_func_dict)\n        self._prepared_log.columns = [\n            \"+\".join(col) for col in self._prepared_log.columns.values\n        ]\n        self._parsed_variables[\"Aggregates\"] = self._parsed_variables[\"Name\"].map(\n            lambda x: agg_dict.get(x, [])\n        )\n        self._prepared_log.set_index(\n            f\"{self._causal_unit_var}+{self._parsed_variables[self._parsed_variables['Name'] == self._causal_unit_var]['Aggregates'].values[0][0]}\",\n            inplace=True,\n        )\n        self._prepared_log.sort_index(inplace=True)\n        self._prepared_log.index = self._prepared_log.index.astype(str)\n\n        # Perform the imputation\n        for col in tqdm(self._prepared_log.columns, desc=\"Imputing missing values...\"):\n            if self._prepared_log[col].isnull().values.any():\n                base_var = PreparedVariableName(col).base_var()\n                func_name: str = (\n                    custom_imp[base_var] if base_var in custom_imp else \"no_imp\"\n                )\n                self._prepared_log[col] = (self._imp_funcs[func_name])(\n                    self._prepared_log[col]\n                )\n        self._prepared_log.dropna(inplace=True)\n\n        # Drop variables that do not add information compared to other variables based on the same base variable\n        # but using a different aggregation function.\n        if drop_bad_aggs:\n            print(f\"Dropping aggregates that do not add information...\")\n            cols_to_drop = AggregateSelector.find_uninformative_aggregates(\n                self._prepared_log, self._parsed_variables, self._causal_unit_var\n            )\n            self._prepared_log.drop(columns=cols_to_drop, inplace=True)\n\n        # Identify the categorical variables and one-hot encode them\n        categorical_vars = self._prepared_log.select_dtypes(\n            include=\"object\"\n        ).columns.tolist()\n        for col in tqdm(\n            categorical_vars, desc=\"One-hot encoding categorical variables...\"\n        ):\n            self._prepared_log = pd.concat(\n                [\n                    self._prepared_log,\n                    pd.get_dummies(\n                        self._prepared_log[col], prefix=col, prefix_sep=\"=\", dtype=int\n                    ),\n                ],\n                axis=1,\n            )\n            self._prepared_log.drop(col, axis=1, inplace=True)\n        # Deal with https://github.com/pydot/pydot/issues/258\n        self._prepared_log.columns = [\n            x.replace(\":\", \";\") for x in self._prepared_log.columns\n        ]\n\n        # Generate dataframe of prepared variables for later tagging etc.\n        self._generate_prepared_variables_df()\n\n        # Convert any date columns to Unix timestamps in milliseconds\n        date_cols = self._prepared_variables.loc[\n            self._prepared_variables[\"Type\"] == \"date\", \"Name\"\n        ].values\n        self._prepared_log[date_cols] = self._prepared_log[date_cols].map(\n            lambda x: x.timestamp() * 1000.0\n        )\n\n        # Convert any time columns to milliseconds\n        time_cols = self._prepared_variables.loc[\n            self._prepared_variables[\"Type\"] == \"time\", \"Name\"\n        ].values\n        self._prepared_log[time_cols] = self._prepared_log[time_cols].map(\n            lambda x: x.total_seconds() * 1000.0\n        )\n\n        # Write out prepared log and variables\n        if not self._skip_writeout:\n            Pickler.dump(\n                self._prepared_log, self._get_filename(nameof(self._prepared_log))\n            )\n            Pickler.dump(\n                self._prepared_variables,\n                self._get_filename(nameof(self._prepared_variables)),\n            )\n\n        print(\n            f\"\"\"Successfully prepared the log with causal unit {self._causal_unit_var} \"\"\"\n            f\"\"\"(tag: {self.get_tag_of_parsed(self._causal_unit_var)})\"\"\"\n            + (\n                \"\"\n                if not self._num_causal_units\n                else f\" with {self._num_causal_units} causal units.\"\n            )\n        )\n\n        return\n\n    def _generate_prepared_variables_df(self) -&gt; None:\n        \"\"\"\n        Generate dataframe of prepared variables for later tagging etc.\n        \"\"\"\n\n        self._prepared_variables = pd.DataFrame()\n        self._prepared_variables[\"Name\"] = self._prepared_log.columns\n\n        # Bring in varable name components leveraging PreparedVariableName\n        self._prepared_variables[\"Base\"] = self._prepared_variables[\"Name\"].apply(\n            lambda x: PreparedVariableName(x).base_var()\n        )\n        self._prepared_variables[\"Pre-agg Value\"] = self._prepared_variables[\n            \"Name\"\n        ].apply(lambda x: PreparedVariableName(x).pre_agg_value())\n        self._prepared_variables[\"Agg\"] = self._prepared_variables[\"Name\"].apply(\n            lambda x: PreparedVariableName(x).aggregate()\n        )\n        self._prepared_variables[\"Post-agg Value\"] = self._prepared_variables[\n            \"Name\"\n        ].apply(lambda x: PreparedVariableName(x).post_agg_value())\n\n        # Bring in other info from self._parsed_variables\n        self._prepared_variables[\"Tag\"] = self._prepared_variables.apply(\n            lambda x: (\n                self._parsed_variables.loc[\n                    self._parsed_variables[\"Name\"] == x[\"Base\"],\n                    \"Tag\",\n                ].values[0]\n                if x[\"Base\"] != \"TemplateId\"\n                else \"TemplateId\"\n            )\n            + (f\" {x['Pre-agg Value']}\" if x[\"Pre-agg Value\"] != \"\" else \"\")\n            + (f\" {x['Agg']}\" if x[\"Agg\"] != \"\" else \"\")\n            + (f\" {x['Post-agg Value']}\" if x[\"Post-agg Value\"] != \"\" else \"\"),\n            axis=1,\n        )\n        self._prepared_variables[\"Base Variable Occurences\"] = self._prepared_variables[\n            \"Base\"\n        ].apply(\n            lambda x: (\n                self._parsed_variables.loc[\n                    self._parsed_variables[\"Name\"] == x, \"Occurrences\"\n                ].values[0]\n                if x != \"TemplateId\"\n                else \"\"\n            )\n        )\n        self._prepared_variables[\"Type\"] = self._prepared_variables[\"Base\"].apply(\n            lambda x: (\n                self._parsed_variables.loc[\n                    self._parsed_variables[\"Name\"] == x, \"Type\"\n                ].values[0]\n                if x != \"TemplateId\"\n                else \"\"\n            )\n        )\n        self._prepared_variables[\"Examples\"] = self._prepared_variables[\"Base\"].apply(\n            lambda x: (\n                self._parsed_variables.loc[\n                    self._parsed_variables[\"Name\"] == x, \"Examples\"\n                ].values[0]\n                if x != \"TemplateId\"\n                else \"\"\n            )\n        )\n        self._prepared_variables[\"From regex\"] = self._prepared_variables[\"Base\"].apply(\n            lambda x: (\n                self._parsed_variables.loc[\n                    self._parsed_variables[\"Name\"] == x, \"From regex\"\n                ].values[0]\n                if x != \"TemplateId\"\n                else \"\"\n            )\n        )\n\n        # Bring in template text, only for appropriate base variables.\n        self._prepared_variables[\"TemplateText\"] = self._prepared_variables.apply(\n            lambda x: (\n                self._parsed_templates.loc[\n                    self._parsed_templates[\"TemplateId\"]\n                    == PreparedVariableName(x[\"Name\"]).template_id(),\n                    \"TemplateText\",\n                ].values[0]\n                if x[\"From regex\"] == False\n                else \"\"\n            ),\n            axis=1,\n        )\n\n    def inspect(\n        self,\n        var: str,\n        ref_var: Optional[str] = None,\n        row_limit: Optional[int] = 10,\n    ) -&gt; Tuple[pd.DataFrame, pd.DataFrame, pd.DataFrame]:\n        \"\"\"\n        Print information about a specific prepared variable.\n\n        Parameters:\n            var: The name or tag of the variable.\n            ref_var: The name or tag of a reference variable.\n            row_limit: The number of rows of the prepared log to print out,\n                to illustrate example values of this variable.\n\n        Returns:\n            A tuple containing:\n                (1) Information about the base variable of `var`, if `var` is not related to the\n                    occurrence count of a template.\n                (2) Information about the template of `var`, if `var` was not created from a regex.\n                (3) A sample of the prepared log, with `row_limit` rows.\n        \"\"\"\n\n        # Retrieve the name of this variable, if a tag was passed in.\n        name = TagUtils.name_of(self._prepared_variables, var, \"prepared\")\n\n        print(f\"Information about prepared variable {name}:\\n\")\n        base_var = PreparedVariableName(name).base_var()\n        from_regex = False\n\n        base_var_info_df = pd.DataFrame()\n        if base_var != \"TemplateId\":\n            print(f\"--&gt; Variable Information about {base_var}:\")\n            base_var_info_df = self._parsed_variables[\n                self._parsed_variables[\"Name\"] == base_var\n            ]\n            from_regex = base_var_info_df[\"From regex\"].values[0]\n            display(base_var_info_df)\n\n        template_info_df = pd.DataFrame()\n        if not from_regex:\n            template_id = PreparedVariableName(name).template_id()\n            print(f\"--&gt; Template Information about {template_id}:\")\n            template_info_df = self._parsed_templates[\n                self._parsed_templates[\"TemplateId\"] == template_id\n            ]\n            display(template_info_df)\n\n        print(\"--&gt; Causal Unit Partial Information:\")\n        if row_limit == None:\n            row_limit = len(self._prepared_log)\n        col_list = [name]\n        col_list.extend([ref_var] if ref_var is not None else [])\n        prepared_log_info_df = self._prepared_log[col_list].head(row_limit)\n        col_names = [f\"{name} (candidate)\"]\n        col_names.extend([f\"{ref_var} (outcome)\"] if ref_var is not None else [])\n        prepared_log_info_df.columns = col_names\n        display(prepared_log_info_df)\n\n        return base_var_info_df, template_info_df, prepared_log_info_df\n\n    def clear_graph(self, clear_edge_states: bool = True) -&gt; None:\n        \"\"\"\n        Clear the graph and possibly edge states.\n\n        Parameters:\n            clear_edge_states: Whether to also clear the edge states.\n        \"\"\"\n        self._graph = nx.DiGraph()\n        if clear_edge_states:\n            self._edge_states = EdgeStateMatrix(self.prepared_variable_names)\n        if self._eccs:\n            self._eccs.clear_graph(clear_edge_states)\n\n    def display_graph(self) -&gt; None:\n        \"\"\"\n        Display the current graph.\n        \"\"\"\n        GraphRenderer.display_graph(self._graph, self._prepared_variables)\n\n    def save_graph(self, filename: str) -&gt; None:\n        \"\"\"\n        Save the current graph to a file.\n\n        Parameters:\n            filename: The name of the file to save to.\n        \"\"\"\n        GraphRenderer.save_graph(self._graph, self._prepared_variables, filename)\n\n    def accept(\n        self,\n        src: str,\n        dst: str,\n        also_fix: bool,\n        interactive: bool = True,\n    ) -&gt; Tuple[float, Optional[str], Optional[str]]:\n        \"\"\"\n        Mark a causal graph edge as accepted.\n\n        This will also reject the edge from `dst` to `src` and remove any other variables with the\n        same base variable as either `src` or `dst` from consideration for the partial causal graph.\n\n        Parameters:\n            src: The name or tag of the source variable.\n            dst: The name or tag of the destination variable.\n            also_fix: Whether to also fix the edge, for ECCS.\n            interactive: Whether to display the graph interactively after accepting the edge.\n\n        Returns:\n            A tuple containing:\n                (1) the exploration score after the edge addition,\n                (2) the max-impact variable to explore next, if any,\n                (3) optionally a string representation of the graph, if `interactive` is False.\n        \"\"\"\n\n        src_name = TagUtils.name_of(self._prepared_variables, src, \"prepared\")\n        dst_name = TagUtils.name_of(self._prepared_variables, dst, \"prepared\")\n        to_drop = self._edge_states.mark_edge(src_name, dst_name, \"Accepted\")\n        for node in to_drop:\n            if node in self._graph.nodes:\n                self._graph.remove_node(node)\n\n        self._graph.add_node(src_name)\n        self._graph.add_node(dst_name)\n        self._graph.add_edge(src_name, dst_name)\n        if (dst_name, src_name) in self._graph.edges:\n            self._graph.remove_edge(dst_name, src_name)\n        if interactive:\n            GraphRenderer.display_graph(self._graph, self._prepared_variables)\n        if self._eccs:\n            self._eccs.remove_edge(dst_name, src_name)\n            self._eccs.add_edge(src_name, dst_name)\n            if also_fix:\n                self._eccs.fix_edge(src_name, dst_name)\n\n        return (\n            self.exploration_score,\n            self.suggest_next_exploration(),\n            (\n                GraphRenderer.draw_graph(self._graph, self._prepared_variables)\n                if not interactive\n                else \"\"\n            ),\n        )\n\n    def reject(\n        self,\n        src: str,\n        dst: str,\n        also_ban: bool,\n        interactive: bool = True,\n    ) -&gt; Tuple[float, Optional[str], Optional[str]]:\n        \"\"\"\n        Mark a causal graph edge as rejected.\n\n        Parameters:\n            src: The name or tag of the source variable.\n            dst: The name or tag of the destination variable.\n            also_ban: Whether to also ban the edge, for ECCS.\n            interactive: Whether to display the graph interactively after rejecting the edge.\n\n        Returns:\n            A tuple containing:\n                (1) the exploration score after the edge rejection,\n                (2) the max-impact variable to explore next, if any,\n                (3) optionally a string representation of the graph, if `interactive` is False.\n        \"\"\"\n\n        src_name = TagUtils.name_of(self._prepared_variables, src, \"prepared\")\n        dst_name = TagUtils.name_of(self._prepared_variables, dst, \"prepared\")\n        self._edge_states.mark_edge(src_name, dst_name, \"Rejected\")\n        if self._eccs and also_ban:\n            self._eccs.ban_edge(src_name, dst_name)\n\n        if interactive:\n            GraphRenderer.display_graph(self._graph, self._prepared_variables)\n\n        return (\n            self.exploration_score,\n            self.suggest_next_exploration(),\n            (\n                GraphRenderer.draw_graph(self._graph, self._prepared_variables)\n                if not interactive\n                else \"\"\n            ),\n        )\n\n    def reject_undecided_incoming(\n        self, dst: str, also_ban: bool, interactive: bool = True\n    ) -&gt; Tuple[float, Optional[str], Optional[str]]:\n        \"\"\"\n        Mark all undecided incoming edges to a variable as rejected.\n\n        Parameters:\n            dst: The name or tag of the destination variable.\n            also_ban: Whether to also ban the edges, for ECCS.\n            interactive: Whether to display the graph interactively after rejecting the edges.\n\n        Returns:\n            A tuple containing:\n                (1) the exploration score after the edge rejections,\n                (2) the max-impact variable to explore next, if any,\n                (3) optionally a string representation of the graph, if `interactive` is False.\n        \"\"\"\n        dst_name = TagUtils.name_of(self._prepared_variables, dst, \"prepared\")\n        for v in self.prepared_variable_names:\n            if self._edge_states.get_edge_state(v, dst_name) == \"Undecided\":\n                self._edge_states.mark_edge(v, dst_name, \"Rejected\")\n                if self._eccs and also_ban:\n                    self._eccs.ban_edge(v, dst_name)\n\n        if interactive:\n            GraphRenderer.display_graph(self._graph, self._prepared_variables)\n\n        return (\n            self.exploration_score,\n            self.suggest_next_exploration(),\n            (\n                GraphRenderer.draw_graph(self._graph, self._prepared_variables)\n                if not interactive\n                else \"\"\n            ),\n        )\n\n    def reject_undecided_outgoing(\n        self, src: str, also_ban: bool, interactive: bool = True\n    ) -&gt; Tuple[float, Optional[str], Optional[str]]:\n        \"\"\"\n        Mark all undecided outgoing edges from a variable as rejected.\n\n        Parameters:\n            src: The name or tag of the source variable.\n            also_ban: Whether to also ban the edges, for ECCS.\n            interactive: Whether to display the graph interactively after rejecting the edges.\n\n        Returns:\n            A tuple containing:\n                (1) the exploration score after the edge rejections,\n                (2) the max-impact variable to explore next, if any,\n                (3) optionally a string representation of the graph, if `interactive` is False.\n        \"\"\"\n        src_name = TagUtils.name_of(self._prepared_variables, src, \"prepared\")\n        for v in self.prepared_variable_names:\n            if self._edge_states.get_edge_state(src_name, v) == \"Undecided\":\n                self._edge_states.mark_edge(src_name, v, \"Rejected\")\n                if self._eccs and also_ban:\n                    self._eccs.ban_edge(src_name, v)\n\n        if interactive:\n            GraphRenderer.display_graph(self._graph, self._prepared_variables)\n\n        return (\n            self.exploration_score,\n            self.suggest_next_exploration(),\n            (\n                GraphRenderer.draw_graph(self._graph, self._prepared_variables)\n                if not interactive\n                else \"\"\n            ),\n        )\n\n    def reject_all_prunable_edges(\n        self,\n        also_ban: bool,\n        lasso_alpha: float = Pruner.LASSO_DEFAULT_ALPHA,\n        lasso_max_iter: int = Pruner.LASSO_DEFAULT_MAX_ITER,\n    ) -&gt; Tuple[float, Optional[str], Optional[str]]:\n        \"\"\"\n        For every prepared variable, reject all incoming edges that start at a variable\n        that is pruned by our pruning approach. This may be time-consuming depending on the number of variables.\n\n        Parameters:\n            also_ban: Whether to also ban the edges, for ECCS.\n            lasso_alpha: The alpha parameter to be used for Lasso regression.\n            lasso_max_iter: The maximum number of iterations to be used for Lasso regression.\n\n        Returns:\n            A tuple containing:\n                (1) the exploration score after the edge rejections,\n                (2) the max-impact variable to explore next, if any,\n                (3) optionally a string representation of the graph, if `interactive` is False.\n        \"\"\"\n        num_processors = multiprocessing.cpu_count()\n        with multiprocessing.Pool(processes=num_processors) as pool:\n            all_candidates = pool.starmap(\n                Pruner.prune_with_lasso,\n                tqdm(\n                    [\n                        (self._prepared_log, [target], lasso_alpha, lasso_max_iter)\n                        for target in self.prepared_variable_names\n                    ],\n                    total=self.num_prepared_variables,\n                    desc=\"Finding pruned variables...\",\n                ),\n            )\n\n        Printer.printv(all_candidates)\n\n        for candidates, target in zip(all_candidates, self.prepared_variable_names):\n            non_candidates = (\n                set(self._prepared_log.columns) - set(candidates) - set([target])\n            )\n            for nc in non_candidates:\n                self._edge_states.mark_edge(nc, target, \"Rejected\")\n                if self._eccs and also_ban:\n                    self._eccs.ban_edge(nc, target)\n\n        return (\n            self.exploration_score,\n            self.suggest_next_exploration(),\n            GraphRenderer.draw_graph(self._graph, self._prepared_variables),\n        )\n\n    @property\n    def exploration_score(self) -&gt; float:\n        \"\"\"\n        Calculate the exploration score of the current partial causal graph,\n        based on the edge state matrix.\n\n        Returns:\n            The exploration score of the current partial causal graph.\n        \"\"\"\n        # Number of edges incident to a node in the current partial graph\n        M = self._graph.number_of_nodes()\n        N = self.num_prepared_variables\n        incident = M * (2 * N - M - 1)\n        if incident == 0:\n            return 0\n\n        # Number of edges among the incident that have been considered\n        graph_var_indices = [self._edge_states.idx(x) for x in list(self._graph.nodes)]\n        other_indices = list(np.setdiff1d(np.arange(N), graph_var_indices))\n        considered = np.sum(\n            self._edge_states.m[graph_var_indices][:, graph_var_indices] != 0\n        )\n        considered -= M  # subtract self-edges\n        considered += np.sum(\n            self._edge_states.m[graph_var_indices][:, other_indices] != 0\n        )\n        considered += np.sum(\n            self._edge_states.m[other_indices][:, graph_var_indices] != 0\n        )\n\n        Printer.printv(f\"Considered: {considered}\")\n        Printer.printv(f\"Incident: {incident}\")\n\n        return considered / incident\n\n    def rank_candidate_causes(\n        self,\n        target: Optional[str] = None,\n        ignore: Optional[List[str]] = None,\n        method: CandidateCauseRankerMethod = CandidateCauseRankerMethod.LOGOS,\n        prune_candidates: bool = True,\n        lasso_alpha: float = Pruner.LASSO_DEFAULT_ALPHA,\n        lasso_max_iter: int = Pruner.LASSO_DEFAULT_MAX_ITER,\n        model: str = \"gpt-4o-mini-2024-07-18\",\n        gpt_log_path: Optional[str] = None,\n    ) -&gt; Tuple[pd.DataFrame, str]:\n        \"\"\"\n        Present the user with ranked candidate causes for `target`. If no `target`\n        is specified, the most recent suggestion of `suggest_next_exploration()` is used, if any.\n        If `ignore` is specified, the variables in `ignore` are not considered as candidate causes.\n\n        Parameters:\n            target: The name or tag of the target variable.\n            ignore: A list of variables to ignore.\n            method: The method to use for ranking candidate causes.\n            prune_candidates: Whether to prune the candidate causes using Lasso regression. Only\n                applies if `method` is `CandidateCauseRankerMethod.LOGOS`.\n            lasso_alpha: The alpha parameter to be used for Lasso regression. Only applies if\n                `method` is `CandidateCauseRankerMethod.LOGOS` and `prune_candidates` is True.\n            lasso_max_iter: The maximum number of iterations to be used for Lasso regression. Only\n                applies if `method` is `CandidateCauseRankerMethod.LOGOS` and `prune_candidates` is True.\n            model: The model to use for the langmodel method. Only applies if the method is\n                `CandidateCauseRankerMethod.LANGMODEL`.\n            gpt_log_path: The path to the log file to use for the langmodel method. Only applies if\n                the method is `CandidateCauseRankerMethod.LANGMODEL`.\n        Returns:\n            A tuple containing:\n            (1) A dataframe containing the candidate causes for `target` and\n            (2) The time elapsed for exploration, as a string.\n        \"\"\"\n\n        start_time = datetime.now()\n\n        # Handle the case where the user has not specified a target.\n        if target is None and self._next_exploration is None:\n            print(\"No target specified.\")\n            return pd.DataFrame(columns=CandidateCauseRanker.COLUMN_ORDER), \"\"\n        elif target is None:\n            target = self._next_exploration\n\n        # If the user provided the target as a tag, retrieve its name\n        target = TagUtils.name_of(self._prepared_variables, target, \"prepared\")\n\n        # Use the specified method to rank candidate causes\n        result_df, pruned = CandidateCauseRanker.rank(\n            self.prepared_log,\n            self.prepared_variables,\n            target,\n            ignore,\n            method,\n            prune_candidates,\n            lasso_alpha,\n            lasso_max_iter,\n            model,\n            (\n                gpt_log_path\n                if (gpt_log_path is not None)\n                else os.path.join(\n                    self._workdir,\n                    f\"ranker-gpt-{datetime.now().strftime('%Y-%m-%d-%H-%M-%S')}.log\",\n                )\n            ),\n        )\n\n        # Mark the edges rejected by the pruning step, if any.\n        for var in pruned:\n            self._edge_states.mark_edge(var, target, \"Rejected\")\n\n        # Add fields to the returned dataframe\n        result_df[\"Candidate-&gt;Target Edge Status\"] = result_df[\"Candidate\"].apply(\n            lambda x: self._edge_states.get_edge_state(x, target)\n        )\n        result_df[\"Target-&gt;Candidate Edge Status\"] = result_df[\"Candidate\"].apply(\n            lambda x: self._edge_states.get_edge_state(target, x)\n        )\n\n        ret_val = result_df[CandidateCauseRanker.COLUMN_ORDER]\n\n        end_time = datetime.now()\n        elapsed = \"{:.6f}\".format((end_time - start_time).total_seconds())\n        print(f\"Candidate cause exploration complete in {elapsed} seconds!\")\n\n        return ret_val, elapsed\n\n    def get_causal_graph_refinement_suggestion(\n        self,\n        method: InteractiveCausalGraphRefinerMethod = InteractiveCausalGraphRefinerMethod.LOGOS,\n        treatment: Optional[str] = None,\n        outcome: Optional[str] = None,\n        model: str = \"gpt-4o-mini-2024-07-18\",\n        gpt_log_path: Optional[str] = None,\n    ) -&gt; Tuple[Edge, str]:\n        \"\"\"\n        Present the user with an edge, the presence and direction of which they should assess.\n\n        Parameters:\n            method: The method to use for producing a causal graph refinement suggestion.\n            treatment: The name or tag of the treatment variable. Only applies if the method is\n                `InteractiveCausalGraphRefinerMethod.LOGOS`.\n            outcome: The name or tag of the outcome variable. Only applies if the method is\n                `InteractiveCausalGraphRefinerMethod.LOGOS`.\n            model: The model to use for the langmodel method. Only applies if the method is\n                `CandidateCauseRankerMethod.LANGMODEL`.\n            gpt_log_path: The path to the log file to use for the langmodel method. Only applies if\n                the method is `CandidateCauseRankerMethod.LANGMODEL`.\n        Returns:\n            A tuple containing:\n            (1) The edge to assess, as an Edge object, and\n            (2) The time elapsed for generating the suggestion, as a string.\n        \"\"\"\n\n        start_time = datetime.now()\n\n        treatment_name = TagUtils.name_of(\n            self._prepared_variables, treatment, \"prepared\"\n        )\n        outcome_name = TagUtils.name_of(self._prepared_variables, outcome, \"prepared\")\n\n        edge = InteractiveCausalGraphRefiner.get_suggestion(\n            self.prepared_log,\n            method,\n            self._eccs,\n            treatment_name,\n            outcome_name,\n            self._graph,\n            model,\n            (\n                gpt_log_path\n                if (gpt_log_path is not None)\n                else os.path.join(\n                    self._workdir,\n                    f\"refiner-gpt-{datetime.now().strftime('%Y-%m-%d-%H-%M-%S')}.log\",\n                )\n            ),\n            self.prepared_variables\n        )\n\n        edge_tags = None\n        if edge:\n            edge_tags = tuple(\n                TagUtils.tag_of(self._prepared_variables, x, \"prepared\") for x in edge\n            )\n\n        end_time = datetime.now()\n        elapsed = \"{:.6f}\".format((end_time - start_time).total_seconds())\n        print(f\"Candidate cause exploration complete in {elapsed} seconds!\")\n\n        return edge_tags, elapsed\n\n    def suggest_next_exploration(self) -&gt; Optional[str]:\n        \"\"\"\n        Suggest the variable that should be explored next. Suggest the prepared variable in the partial causal graph\n        that has the most (nonzero) Unexplored incoming edges, if any; otherwise suggest the prepared variable\n        with the most (nonzero) Undecided incoming edges, even if it is not in the partial causal graph.\n\n        If all edges are decided, return None.\n\n        Returns:\n            The name of the variable to explore next.\n        \"\"\"\n\n        # Try to find a suggestion from the partial causal graph.\n        node_names = list(self._graph.nodes)\n        graph_var_indices = [self._edge_states.idx(x) for x in node_names]\n        graph_var_incoming_edge_states = self._edge_states.m[:, graph_var_indices]\n        undecided_edges_per_col = (\n            np.sum(graph_var_incoming_edge_states == 0, axis=0)\n            if len(graph_var_incoming_edge_states) &gt; 0\n            else []\n        )\n        max_undecided = (\n            np.max(undecided_edges_per_col) if len(undecided_edges_per_col) &gt; 0 else 0\n        )\n\n        if max_undecided &gt; 0:\n            max_undecided_idx = np.argmax(undecided_edges_per_col)\n            self._next_exploration = node_names[max_undecided_idx]\n            return self._next_exploration\n\n        # If no suggestion was found, try to find a suggestion from the entire collection of prepared variables.\n        undecided_edges_per_col = np.sum(self._edge_states.m == 0, axis=0)\n        max_undecided = np.max(undecided_edges_per_col)\n\n        if max_undecided &gt; 0:\n            max_undecided_idx = np.argmax(undecided_edges_per_col)\n            self._next_exploration = self._prepared_variables.loc[\n                max_undecided_idx, \"Name\"\n            ]\n            return self._next_exploration\n\n        # If no suggestion was found, return None.\n        self._next_exploration = None\n        return None\n\n    def discover_graph(\n        self,\n        method: str = \"hill_climb\",\n        max_cond_vars: int = 3,\n        model: str = \"gpt-3.5-turbo\",\n    ) -&gt; None:\n        \"\"\"\n        Discover a causal graph based on the prepared table automatically.\n\n        Parameters:\n            method: The method to be used for graph discovery, among \"PC\", \"hill_climb\", \"exhaustive\" and \"GPT\".\n            max_cond_vars: The maximum number of conditioning variables to be used for PC.\n            model: The model to be used for GPT-based graph discovery.\n\n        \"\"\"\n\n        if method == \"PC\":\n            self._graph = CausalDiscoverer.pc(\n                self._prepared_log, max_cond_vars=max_cond_vars\n            )\n        elif method == \"hill_climb\":\n            self._graph = CausalDiscoverer.hill_climb(self._prepared_log)\n        elif method == \"exhaustive\":\n            self._graph = CausalDiscoverer.exhaustive(self._prepared_log)\n        elif method == \"GPT\":\n            self._graph = CausalDiscoverer.gpt(self._prepared_log, model=model)\n        else:\n            raise ValueError(f\"Invalid graph discovery method {method}\")\n\n        self._edge_states.clear_and_set_from_graph(self._graph)\n\n    def get_adjusted_ate(\n        self,\n        treatment: str,\n        outcome: str,\n        confounder: Optional[str] = None,\n    ) -&gt; float:\n        \"\"\"\n        Calculate the adjusted ATE of `treatment` on `outcome`, given the current partial causal graph.\n\n        Parameters:\n            treatment: The name or tag of the treatment variable.\n            outcome: The name or tag of the outcome variable.\n            confounder: The name or tag of a confounder variable. If specified, overrides the current partial\n                causal graph in favor of a three-node graph with `treatment`, `outcome` and `confounder`.\n\n        Returns:\n            The adjusted ATE of `treatment` on `outcome`.\n        \"\"\"\n        return ATECalculator.get_ate_and_confidence(\n            self.prepared_log,\n            self.prepared_variables,\n            treatment,\n            outcome,\n            confounder,\n            graph=self._graph,\n            calculate_p_value=False,\n            calculate_std_error=False,\n        )[\"ATE\"]\n\n    def get_unadjusted_ate(\n        self,\n        treatment: str,\n        outcome: str,\n    ) -&gt; float:\n        \"\"\"\n        Calculate the unadjusted ATE of `treatment` on `outcome`, ignoring the current partial causal graph\n        in favor of a two-node graph with just `treatment` and `outcome`.\n\n        Parameters:\n            treatment: The name or tag of the treatment variable.\n            outcome: The name or tag of the outcome variable.\n\n        Returns:\n            The unadjusted ATE of `treatment` on `outcome`.\n        \"\"\"\n        return ATECalculator.get_ate_and_confidence(\n            self.prepared_log,\n            self.prepared_variables,\n            treatment,\n            outcome,\n            calculate_p_value=False,\n            calculate_std_error=False,\n        )[\"ATE\"]\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.parsed_log","title":"<code>parsed_log: pd.DataFrame</code>  <code>property</code>","text":"<p>Get the parsed log as a dataframe.</p>"},{"location":"reference/logos/logos/#logos.logos.LOGos.parsed_variables","title":"<code>parsed_variables: pd.DataFrame</code>  <code>property</code>","text":"<p>Get the parsed variables as a dataframe.</p>"},{"location":"reference/logos/logos/#logos.logos.LOGos.parsed_templates","title":"<code>parsed_templates: pd.DataFrame</code>  <code>property</code>","text":"<p>Get the parsed templates as a dataframe.</p>"},{"location":"reference/logos/logos/#logos.logos.LOGos.prepared_log","title":"<code>prepared_log: pd.DataFrame</code>  <code>property</code>","text":"<p>Get the prepared log as a dataframe.</p>"},{"location":"reference/logos/logos/#logos.logos.LOGos.prepared_variables","title":"<code>prepared_variables: pd.DataFrame</code>  <code>property</code>","text":"<p>Get the prepared variables as a dataframe.</p>"},{"location":"reference/logos/logos/#logos.logos.LOGos.prepared_variable_names","title":"<code>prepared_variable_names: list[str]</code>  <code>property</code>","text":"<p>Get the names of the prepared variables.</p>"},{"location":"reference/logos/logos/#logos.logos.LOGos.prepared_variable_tags","title":"<code>prepared_variable_tags: list[str]</code>  <code>property</code>","text":"<p>Get the tags of the prepared variables.</p>"},{"location":"reference/logos/logos/#logos.logos.LOGos.num_prepared_variables","title":"<code>num_prepared_variables: int</code>  <code>property</code>","text":"<p>Get the number of prepared variables.</p>"},{"location":"reference/logos/logos/#logos.logos.LOGos.exploration_score","title":"<code>exploration_score: float</code>  <code>property</code>","text":"<p>Calculate the exploration score of the current partial causal graph, based on the edge state matrix.</p> <p>Returns:</p> Type Description <code>float</code> <p>The exploration score of the current partial causal graph.</p>"},{"location":"reference/logos/logos/#logos.logos.LOGos._set_vars_to_defaults","title":"<code>_set_vars_to_defaults()</code>","text":"<p>Set some of the variables to their default values.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def _set_vars_to_defaults(self) -&gt; None:\n    \"\"\"\n    Set some of the variables to their default values.\n    \"\"\"\n    # The parsed log as a dataframe, and metadata about the parsed variables.\n    self._parsed_log: pd.DataFrame = pd.DataFrame()\n    self._parsed_variables: pd.DataFrame = pd.DataFrame()\n    self._parsed_templates: pd.DataFrame = pd.DataFrame()\n\n    # The variable used to define causal units and the number of causal units.\n    self._causal_unit_var: Optional[str] = None\n    self._num_causal_units: Optional[int] = None\n\n    # The prepared log as a dataframe, and metadata about the prepared variables.\n    self._prepared_log: pd.DataFrame = pd.DataFrame()\n    self._prepared_variables: pd.DataFrame = pd.DataFrame()\n\n    # The available aggregation and imputation functions.\n    agg_module = importlib.import_module(\"src.logos.aggimp.agg_funcs\")\n    self._agg_funcs: dict[str, Callable] = {\n        n: f for n, f in inspect.getmembers(agg_module, inspect.isfunction)\n    }\n\n    imp_module = importlib.import_module(\"src.logos.aggimp.imp_funcs\")\n    self._imp_funcs: dict[str, Callable] = {\n        n: f for n, f in inspect.getmembers(imp_module, inspect.isfunction)\n    }\n\n    # The graph of causal relationships.\n    self._graph: nx.DiGraph = nx.DiGraph()\n\n    # The exploration progress matrix, indicating which edges have been explored.\n    self._edge_states: Optional[EdgeStateMatrix] = None\n\n    # The most recent next exploration suggestion.\n    self._next_exploration: Optional[str] = None\n\n    # An ECCS object for refinement.\n    self._eccs: Optional[ECCS] = None\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.prepared_variable_names_with_base_x_and_no_pre_post_agg","title":"<code>prepared_variable_names_with_base_x_and_no_pre_post_agg(x)</code>","text":"<p>Get all prepared variables with the given base variable and no pre- or post-aggregate values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Union[str, PreparedVariableName]</code> <p>The base variable to check.</p> required <p>Returns:</p> Type Description <code>list[str]</code> <p>A list of variables with the given base variable and no pre-</p> <code>list[str]</code> <p>or post-aggregate values.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def prepared_variable_names_with_base_x_and_no_pre_post_agg(\n    self, x: Union[str, PreparedVariableName]\n) -&gt; list[str]:\n    \"\"\"\n    Get all prepared variables with the given base variable and no pre-\n    or post-aggregate values.\n\n    Parameters:\n        x: The base variable to check.\n\n    Returns:\n        A list of variables with the given base variable and no pre-\n        or post-aggregate values.\n    \"\"\"\n    return [\n        var\n        for var in self.prepared_variable_names\n        if PreparedVariableName(var).has_base_var(x)\n        and PreparedVariableName(var).no_pre_post_aggs()\n    ]\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.__init__","title":"<code>__init__(filename, workdir, skip_writeout=False)</code>","text":"<p>Initialize a LOGos instance, giving it the full path to the log file that will be analyzed.</p> <p>Parameters:</p> Name Type Description Default <code>filename</code> <code>str</code> <p>The full path to the log file that will be analyzed.</p> required <code>workdir</code> <code>str</code> <p>The directory where the parsed and prepared dataframes will be stored.</p> required <code>skip_writeout</code> <code>bool</code> <p>Whether to skip writing out the parsed and prepared dataframes.</p> <code>False</code> Source code in <code>src/logos/logos.py</code> <pre><code>def __init__(\n    self, filename: str, workdir: str, skip_writeout: bool = False\n) -&gt; None:\n    \"\"\"\n    Initialize a LOGos instance, giving it the full path to the log file that will be analyzed.\n\n    Parameters:\n        filename: The full path to the log file that will be analyzed.\n        workdir: The directory where the parsed and prepared dataframes will be stored.\n        skip_writeout: Whether to skip writing out the parsed and prepared dataframes.\n    \"\"\"\n\n    self._set_vars_to_defaults()\n    self._filename = filename\n    print(f\"Initialized LOGos with log file {filename}\")\n\n    # Set and create working directory\n    self._workdir = workdir\n    if not os.path.exists(self._workdir):\n        os.makedirs(self._workdir, exist_ok=True)\n    print(f\"Work directory set to {self._workdir}\")\n\n    self._skip_writeout = skip_writeout\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos._get_filename","title":"<code>_get_filename(var_name)</code>","text":"<p>Create the file name string for dumping/loading pkl files.</p> <p>Parameters:</p> Name Type Description Default <code>var_name</code> <code>str</code> <p>The name of the variable to be dumped/loaded.</p> required <p>Returns:</p> Type Description <code>str</code> <p>The file name string.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def _get_filename(self, var_name: str) -&gt; str:\n    \"\"\"\n    Create the file name string for dumping/loading pkl files.\n\n    Parameters:\n        var_name: The name of the variable to be dumped/loaded.\n\n    Returns:\n        The file name string.\n    \"\"\"\n    return os.path.join(\n        self._workdir,\n        os.path.basename(self._filename)\n        + f\"{var_name}_{self._causal_unit_var}_{self._num_causal_units}.pkl\",\n    )\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos._find_type","title":"<code>_find_type(row)</code>","text":"<p>Identify the type of a parsed variable.</p> <p>Parameters:</p> Name Type Description Default <code>row</code> <code>Series</code> <p>A row of the parsed variables dataframe.</p> required <p>Returns:</p> Type Description <code>str</code> <p>The type of the parsed variable as a string. Options are \"date\", \"time\", \"num\" and \"str\".</p> Source code in <code>src/logos/logos.py</code> <pre><code>def _find_type(self, row: pd.Series) -&gt; str:\n    \"\"\"\n    Identify the type of a parsed variable.\n\n    Parameters:\n        row: A row of the parsed variables dataframe.\n\n    Returns:\n        The type of the parsed variable as a string. Options are \"date\", \"time\", \"num\" and \"str\".\n    \"\"\"\n\n    with warnings.catch_warnings():\n        warnings.filterwarnings(\"error\", category=UserWarning)\n\n        try:\n            y = pd.to_numeric(row[\"Examples\"], errors=\"raise\")\n            return \"num\"\n        except Exception as e:\n            try:\n                y = pd.to_timedelta(row[\"Examples\"], errors=\"raise\")\n                return \"time\"\n            except Exception as e:\n                try:\n                    y = pd.to_datetime(row[\"Examples\"], errors=\"raise\")\n                    return \"date\"\n                except Exception as e:\n                    return \"str\"\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos._find_uninteresting","title":"<code>_find_uninteresting(row)</code>","text":"<p>Identify whether a parsed variable is likely to be uninteresting.</p> <p>Parameters:</p> Name Type Description Default <code>row</code> <code>Series</code> <p>A row of the parsed variables dataframe.</p> required <p>Returns:</p> Type Description <code>bool</code> <p>True if the variable is likely to be uninteresting, False otherwise.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def _find_uninteresting(self, row: pd.Series) -&gt; bool:\n    \"\"\"\n    Identify whether a parsed variable is likely to be uninteresting.\n\n    Parameters:\n        row: A row of the parsed variables dataframe.\n\n    Returns:\n        True if the variable is likely to be uninteresting, False otherwise.\n    \"\"\"\n    return (\n        row[\"Type\"] != \"num\"\n        and (self._parsed_log[row[\"Name\"]].nunique() &gt;= 0.15 * row[\"Occurrences\"])\n    ) or (self._parsed_log[row[\"Name\"]].nunique() == 1)\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.parse","title":"<code>parse(regex_dict=DEFAULT_REGEX_DICT, sim_thresh=0.65, depth=5, force=False, message_prefix='.*', enable_gpt_tagging=False)</code>","text":"<p>Parse the log file into a dataframe.</p> <p>Parameters:</p> Name Type Description Default <code>regex_dict</code> <code>dict[str, str]</code> <p>(for Drain) A dictionary of regular expressions to be used for parsing.</p> <code>DEFAULT_REGEX_DICT</code> <code>sim_thresh</code> <code>float</code> <p>(for Drain) The similarity threshold to be used for parsing.</p> <code>0.65</code> <code>depth</code> <code>int</code> <p>(for Drain) The parse tree depth to be used for parsing.</p> <code>5</code> <code>force</code> <code>bool</code> <p>Whether to force re-parsing of the log file.</p> <code>False</code> <code>message_prefix</code> <code>str</code> <p>A prefix used to identify the beginning of each log message. Can be used to collapse multiple lines into a single message. Each line that doesn't start with this prefix will be concatenated to the previous log message.</p> <code>'.*'</code> <code>enable_gpt_tagging</code> <code>bool</code> <p>A boolean indicating whether GPT tagging should be enabled.</p> <code>False</code> <p>Returns:</p> Type Description <code>str</code> <p>The time elapsed for parsing, as a string.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def parse(\n    self,\n    regex_dict: dict[str, str] = DEFAULT_REGEX_DICT,\n    sim_thresh: float = 0.65,\n    depth: int = 5,\n    force: bool = False,\n    message_prefix: str = r\".*\",\n    enable_gpt_tagging: bool = False,\n) -&gt; str:\n    \"\"\"\n    Parse the log file into a dataframe.\n\n    Parameters:\n        regex_dict: (for Drain) A dictionary of regular expressions to be used for parsing.\n        sim_thresh: (for Drain) The similarity threshold to be used for parsing.\n        depth: (for Drain) The parse tree depth to be used for parsing.\n        force: Whether to force re-parsing of the log file.\n        message_prefix: A prefix used to identify the beginning of each log message.\n            Can be used to collapse multiple lines into a single message. Each line that doesn't start with this\n            prefix will be concatenated to the previous log message.\n        enable_gpt_tagging: A boolean indicating whether GPT tagging should be enabled.\n\n    Returns:\n        The time elapsed for parsing, as a string.\n    \"\"\"\n    start_time = datetime.now()\n    parser = Drain(\n        indir=os.path.dirname(self._filename),\n        depth=depth,\n        st=sim_thresh,\n        rex=regex_dict,\n        skip_writeout=self._skip_writeout,\n        message_prefix=message_prefix,\n    )\n\n    # Check if the parsed files already exist.\n    files_exist = not force\n    parsed_df_names = [\n        nameof(self._parsed_log),\n        nameof(self._parsed_templates),\n        nameof(self._parsed_variables),\n    ]\n    for var_name in parsed_df_names:\n        if not os.path.isfile(self._get_filename(var_name)):\n            files_exist = False\n            break\n\n    if files_exist:\n        self._parsed_log = Pickler.load(self._get_filename(parsed_df_names[0]))\n        self._parsed_templates = Pickler.load(\n            self._get_filename(parsed_df_names[1])\n        )\n        self._parsed_variables = Pickler.load(\n            self._get_filename(parsed_df_names[2])\n        )\n    else:\n        (\n            self._parsed_log,\n            self._parsed_templates,\n            self._parsed_variables,\n        ) = parser.parse(self._filename.split(\"/\")[-1])\n        tqdm.pandas(desc=\"Determining variable types...\")\n        self._parsed_variables[\"Type\"] = self._parsed_variables.progress_apply(\n            self._find_type, axis=1\n        )\n\n        # Cast and convert date columns\n        is_date = self._parsed_variables[\"Type\"] == \"date\"\n        date_cols = self._parsed_variables.loc[is_date, \"Name\"]\n        tqdm.pandas(desc=\"Casting date variables...\")\n        self._parsed_log[date_cols] = self._parsed_log[date_cols].progress_apply(\n            pd.to_datetime, errors=\"coerce\"\n        )\n        tqdm.pandas(desc=\"Casting date variables round 2...\")\n        self._parsed_log[date_cols] = self._parsed_log[date_cols].progress_applymap(\n            lambda x: x.timestamp() if not pd.isnull(x) else None\n        )\n        self._parsed_variables.loc[is_date, \"Type\"] = \"num\"\n\n        # Cast and convert time columns\n        is_time = self._parsed_variables[\"Type\"] == \"time\"\n        time_cols = self._parsed_variables.loc[is_time, \"Name\"]\n        tqdm.pandas(desc=\"Casting time variables...\")\n        self._parsed_log[time_cols] = self._parsed_log[time_cols].progress_apply(\n            pd.to_timedelta, errors=\"coerce\"\n        )\n        tqdm.pandas(desc=\"Casting time variables round 2...\")\n        self._parsed_log[time_cols] = self._parsed_log[time_cols].progress_applymap(\n            lambda x: x.total_seconds() if not pd.isnull(x) else None\n        )\n        self._parsed_variables.loc[is_time, \"Type\"] = \"num\"\n\n        # Cast numeric columns\n        is_num = self._parsed_variables[\"Type\"] == \"num\"\n        numeric_cols = self._parsed_variables.loc[is_num, \"Name\"]\n        tqdm.pandas(desc=\"Casting numerical variables...\")\n        self._parsed_log[numeric_cols] = self._parsed_log[\n            numeric_cols\n        ].progress_apply(pd.to_numeric, errors=\"coerce\")\n\n        # Tag variables.\n        tqdm.pandas(desc=\"Tagging variables...\")\n        if enable_gpt_tagging:\n            tag, tag_origin = zip(\n                *self._parsed_variables.progress_apply(\n                    lambda x: TagUtils.waterfall_tag(self.parsed_templates, x),\n                    axis=1,\n                )\n            )\n        else:\n            tag, tag_origin = zip(\n                *self._parsed_variables.progress_apply(\n                    lambda x: TagUtils.preceding_tokens_tag(x),\n                    axis=1,\n                )\n            )\n        self._parsed_variables[\"Tag\"] = tag\n        self._parsed_variables[\"TagOrigin\"] = tag_origin\n        TagUtils.deduplicate_tags(self._parsed_variables)\n\n        # Detect identifiers.\n        tqdm.pandas(desc=\"Detecting identifiers...\")\n        self._parsed_variables[\"IsUninteresting\"] = (\n            self._parsed_variables.progress_apply(self._find_uninteresting, axis=1)\n        )\n\n        # Reorder columns.\n        self._parsed_variables = self._parsed_variables[\n            [\n                \"Name\",\n                \"Tag\",\n                \"TagOrigin\",\n                \"Type\",\n                \"IsUninteresting\",\n                \"Occurrences\",\n                \"Preceding 3 tokens\",\n                \"Examples\",\n                \"From regex\",\n            ]\n        ]\n\n    # Write out files if appropriate.\n    if not self._skip_writeout and not files_exist:\n        Pickler.dump(self._parsed_log, self._get_filename(parsed_df_names[0]))\n        Pickler.dump(self._parsed_templates, self._get_filename(parsed_df_names[1]))\n        Pickler.dump(self._parsed_variables, self._get_filename(parsed_df_names[2]))\n\n    end_time = datetime.now()\n    elapsed = \"{:.6f}\".format((end_time - start_time).total_seconds())\n    print(f\"Parsing complete in {elapsed} seconds!\")\n    return elapsed\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.include_in_template","title":"<code>include_in_template(var, enable_gpt_tagging=False, skip_writeout=None)</code>","text":"<p>Treat a certain parsed variable as part of its template and regenerate parsed dataframes.</p> <p>Parameters:</p> Name Type Description Default <code>var</code> <code>str</code> <p>The name or tag of the variable to be included in its template.</p> required <code>enable_gpt_tagging</code> <code>bool</code> <p>A boolean indicating whether GPT-3.5 tagging should be enabled.</p> <code>False</code> <code>skip_writeout</code> <code>Optional[bool]</code> <p>Whether to skip writing out the regenerated parsed dataframes. Defaults to the value of self._skip_writeout.</p> <code>None</code> Source code in <code>src/logos/logos.py</code> <pre><code>def include_in_template(\n    self,\n    var: str,\n    enable_gpt_tagging: bool = False,\n    skip_writeout: Optional[bool] = None,\n) -&gt; None:\n    \"\"\"\n    Treat a certain parsed variable as part of its template and regenerate parsed dataframes.\n\n    Parameters:\n        var: The name or tag of the variable to be included in its template.\n        enable_gpt_tagging: A boolean indicating whether GPT-3.5 tagging should be enabled.\n        skip_writeout: Whether to skip writing out the regenerated parsed dataframes. Defaults\n            to the value of self._skip_writeout.\n    \"\"\"\n    name = TagUtils.name_of(self._parsed_variables, var, \"parsed\")\n\n    old_template_id = ParsedVariableName(name).template_id()\n    idx = ParsedVariableName(name).index()\n    value_counts = self._parsed_log[name].value_counts().to_dict()\n\n    ### Modify _parsed_templates\n    old_template_row = (\n        self._parsed_templates.loc[\n            self._parsed_templates[\"TemplateId\"] == old_template_id\n        ]\n        .iloc[0]\n        .copy()\n    )\n    toks = old_template_row[\"TemplateText\"].split(\" \")\n    new_template_ids = {}\n    new_variable_indices = old_template_row[\"VariableIndices\"]\n    new_variable_indices.remove(idx)\n\n    for value, occurences in value_counts.items():\n        new_template_row = old_template_row.copy()\n        toks[idx] = value\n\n        new_template_row[\"TemplateText\"] = \" \".join(toks)\n        new_template_row[\"TemplateId\"] = hashlib.md5(\n            new_template_row[\"TemplateText\"].encode(\"utf-8\")\n        ).hexdigest()[0:8]\n        new_template_row[\"Occurrences\"] = occurences\n        new_template_row[\"VariableIndices\"] = new_variable_indices\n        new_template_row[\"RegexIndices\"] = old_template_row[\"RegexIndices\"]\n\n        self._parsed_templates.loc[len(self._parsed_templates)] = new_template_row\n        new_template_ids[value] = new_template_row[\"TemplateId\"]\n\n    self._parsed_templates = self._parsed_templates[\n        self._parsed_templates[\"TemplateId\"] != old_template_id\n    ].reset_index(drop=True)\n\n    ### Modify _parsed_log\n\n    # Update the template ids of all rows that belonged to the old template\n    self._parsed_log[\"TemplateId\"] = self._parsed_log.apply(\n        lambda x: (\n            new_template_ids[x[name]]\n            if (x[\"TemplateId\"] == old_template_id)\n            else x[\"TemplateId\"]\n        ),\n        axis=1,\n    )\n\n    # Create new variables for each new template id and assign the value of the old variables to them\n    new_variables = []\n    for new_template_id in new_template_ids.values():\n        for other_idx in new_variable_indices:\n            new_var_name = f\"{new_template_id}_{str(other_idx)}\"\n            new_variables.append(new_var_name)\n            self._parsed_log[new_var_name] = self._parsed_log.apply(\n                lambda x: (\n                    x[f\"{old_template_id}_{other_idx}\"]\n                    if (x[\"TemplateId\"] == new_template_id)\n                    else None\n                ),\n                axis=1,\n            )\n\n    # Drop variable columns associated with old template id\n    variables_to_drop = [\n        v for v in self._parsed_log.columns if v.startswith(old_template_id)\n    ]\n    self._parsed_log.drop(columns=variables_to_drop, inplace=True)\n\n    ### Modify _parsed_variables\n\n    # Add variable rows for each new variable\n    for value, occurrences in value_counts.items():\n        for other_idx in new_variable_indices:\n            new_template_id = new_template_ids[value]\n            new_var_name = f\"{new_template_id}_{str(other_idx)}\"\n\n            x = {}\n            x[\"Name\"] = new_var_name\n            x[\"Occurrences\"] = occurrences\n            x[\"Preceding 3 tokens\"] = (\n                self._parsed_templates[\n                    self._parsed_templates[\"TemplateId\"] == new_template_id\n                ][\"TemplateText\"]\n                .values[0]\n                .split()[max(0, other_idx - 3) : other_idx]\n            )\n            x[\"Examples\"] = (\n                self._parsed_log[new_var_name]\n                .loc[self._parsed_log[new_var_name].notna()]\n                .unique()[:5]\n                .tolist()\n            )\n            x[\"From regex\"] = False\n            if enable_gpt_tagging:\n                x[\"Tag\"], x[\"TagOrigin\"] = TagUtils.waterfall_tag(\n                    self.parsed_templates, pd.Series(x)\n                )\n            else:\n                x[\"Tag\"], x[\"TagOrigin\"] = TagUtils.preceding_tokens_tag(\n                    pd.Series(x)\n                )\n            x[\"Type\"] = self._find_type(pd.Series(x))\n            x[\"IsUninteresting\"] = self._find_uninteresting(pd.Series(x))\n\n            self._parsed_variables.loc[len(self._parsed_variables)] = x\n\n    # Drop variable rows associated with old template id\n    self._parsed_variables = self._parsed_variables[\n        ~self._parsed_variables[\"Name\"].isin(variables_to_drop)\n    ].reset_index(drop=True)\n\n    # Deduplicate tags again\n    TagUtils.deduplicate_tags(self._parsed_variables)\n\n    # Write out files if appropriate.\n    if skip_writeout is None:\n        skip_writeout = self._skip_writeout\n    if not skip_writeout:\n        print(\"about to write stuff out\")\n        Pickler.dump(self._parsed_log, self._get_filename(nameof(self._parsed_log)))\n        Pickler.dump(\n            self._parsed_templates,\n            self._get_filename(nameof(self._parsed_templates)),\n        )\n        Pickler.dump(\n            self._parsed_variables,\n            self._get_filename(nameof(self._parsed_variables)),\n        )\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.tag_parsed_variable","title":"<code>tag_parsed_variable(name, tag)</code>","text":"<p>Tag a parsed variable.</p> <p>Parameters:</p> Name Type Description Default <code>name</code> <code>str</code> <p>The name of the variable to be tagged.</p> required <code>tag</code> <code>str</code> <p>The tag to be assigned to the variable.</p> required Source code in <code>src/logos/logos.py</code> <pre><code>def tag_parsed_variable(self, name: str, tag: str) -&gt; None:\n    \"\"\"\n    Tag a parsed variable.\n\n    Parameters:\n        name: The name of the variable to be tagged.\n        tag: The tag to be assigned to the variable.\n    \"\"\"\n    TagUtils.set_tag(self._parsed_variables, name, tag, \"parsed\")\n    TagUtils.deduplicate_tags(self._parsed_variables)\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.get_tag_of_parsed","title":"<code>get_tag_of_parsed(name)</code>","text":"<p>Get the tag of a parsed variable.</p> <p>Parameters:</p> Name Type Description Default <code>name</code> <code>str</code> <p>The name of the variable.</p> required <p>Returns:</p> Type Description <code>str</code> <p>The tag of the variable.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def get_tag_of_parsed(self, name: str) -&gt; str:\n    \"\"\"\n    Get the tag of a parsed variable.\n\n    Parameters:\n        name: The name of the variable.\n\n    Returns:\n        The tag of the variable.\n    \"\"\"\n    return TagUtils.get_tag(self._parsed_variables, name, \"parsed\")\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.tag_prepared_variable","title":"<code>tag_prepared_variable(name, tag)</code>","text":"<p>Tag a prepared variable.</p> <p>Parameters:</p> Name Type Description Default <code>name</code> <code>str</code> <p>The name of the variable to be tagged.</p> required <code>tag</code> <code>str</code> <p>The tag to be assigned to the variable.</p> required Source code in <code>src/logos/logos.py</code> <pre><code>def tag_prepared_variable(self, name: str, tag: str) -&gt; None:\n    \"\"\"\n    Tag a prepared variable.\n\n    Parameters:\n        name: The name of the variable to be tagged.\n        tag: The tag to be assigned to the variable.\n    \"\"\"\n    TagUtils.set_tag(self._prepared_variables, name, tag, \"prepared\")\n    TagUtils.deduplicate_tags(self._prepared_variables)\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.get_tag_of_prepared","title":"<code>get_tag_of_prepared(name)</code>","text":"<p>Get the tag of a prepared variable.</p> <p>Parameters:</p> Name Type Description Default <code>name</code> <code>str</code> <p>The name of the variable.</p> required <p>Returns:</p> Type Description <code>str</code> <p>The tag of the variable.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def get_tag_of_prepared(self, name: str) -&gt; str:\n    \"\"\"\n    Get the tag of a prepared variable.\n\n    Parameters:\n        name: The name of the variable.\n\n    Returns:\n        The tag of the variable.\n    \"\"\"\n    return TagUtils.get_tag(self._prepared_variables, name, \"prepared\")\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.get_causal_unit_info","title":"<code>get_causal_unit_info()</code>","text":"<p>Get the variable used to define causal units and the number of causal units.</p> <p>Returns:</p> Type Description <code>str</code> <p>The name of the variable used to define causal units</p> <code>int</code> <p>and the number of causal units.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def get_causal_unit_info(self) -&gt; Tuple[str, int]:\n    \"\"\"\n    Get the variable used to define causal units and the number of\n    causal units.\n\n    Returns:\n        The name of the variable used to define causal units\n        and the number of causal units.\n    \"\"\"\n    return self._causal_unit_var, self._num_causal_units\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.suggest_causal_unit_defs","title":"<code>suggest_causal_unit_defs(min_causal_units=4, num_suggestions=10)</code>","text":"<p>Suggest at most <code>num_suggestions</code> causal unit definitions based on IUS maximization, while returning at least <code>min_causal_units</code> causal units.</p> <p>Parameters:</p> Name Type Description Default <code>min_causal_units</code> <code>int</code> <p>The minimum number of causal units that a suggested definition should create.</p> <code>4</code> <code>num_suggestions</code> <code>int</code> <p>The maximum number of causal unit definitions to suggest.</p> <code>10</code> <p>Returns:</p> Type Description <code>Optional[DataFrame]</code> <p>A DataFrame with one row for each suggested causal unit definition, or <code>None</code> if no suggestions were made.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def suggest_causal_unit_defs(\n    self,\n    min_causal_units: int = 4,\n    num_suggestions: int = 10,\n) -&gt; Optional[pd.DataFrame]:\n    \"\"\"\n    Suggest at most `num_suggestions` causal unit definitions based on IUS maximization,\n    while returning at least `min_causal_units` causal units.\n\n    Parameters:\n        min_causal_units: The minimum number of causal units that a suggested\n            definition should create.\n        num_suggestions: The maximum number of causal unit definitions to suggest.\n\n    Returns:\n        A DataFrame with one row for each suggested causal unit definition, or `None`\n            if no suggestions were made.\n    \"\"\"\n\n    return CausalUnitSuggester.suggest_causal_unit_defs(\n        self._parsed_log[self._parsed_variables[\"Name\"].values],\n        self._parsed_variables,\n        min_causal_units=min_causal_units,\n        num_suggestions=num_suggestions,\n    )\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.set_causal_unit","title":"<code>set_causal_unit(var, num_units=None)</code>","text":"<p>Set the variable used to define causal units and optionally the number of causal units. The latter will be ignored if the variable is categorical, but it must be specified if the variable is numerical.</p> <p>Parameters:</p> Name Type Description Default <code>var</code> <code>str</code> <p>The name or tag of the variable to be used as the causal unit.</p> required <code>num_units</code> <code>Optional[int]</code> <p>The number of causal units to be created.</p> <code>None</code> <p>Raises:</p> Type Description <code>ValueError</code> <p>If the variable is numerical and <code>num_units</code> is not specified.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def set_causal_unit(\n    self,\n    var: str,\n    num_units: Optional[int] = None,\n) -&gt; None:\n    \"\"\"\n    Set the variable used to define causal units and optionally the number of\n    causal units. The latter will be ignored if the variable is categorical, but it\n    must be specified if the variable is numerical.\n\n    Parameters:\n        var: The name or tag of the variable to be used as the causal unit.\n        num_units: The number of causal units to be created.\n\n    Raises:\n        ValueError: If the variable is numerical and `num_units` is not specified.\n    \"\"\"\n    var_name = TagUtils.name_of(self._parsed_variables, var, \"parsed\")\n    var_type = self._parsed_variables.loc[\n        self._parsed_variables[\"Name\"] == var_name, \"Type\"\n    ].values[0]\n\n    if var_type == \"num\" and num_units is None:\n        raise ValueError(\n            \"The number of causal units must be specified if the causal unit is numerical.\"\n        )\n\n    self._causal_unit_var = var_name\n    self._num_causal_units = num_units\n\n    print(\n        f\"Causal unit set to {var_name} (tag: {self.get_tag_of_parsed(var_name)}) \"\n        + (\n            \"\"\n            if not self._num_causal_units\n            else f\" with {self._num_causal_units} causal units.\"\n        )\n    )\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.prepare","title":"<code>prepare(custom_agg={}, custom_imp={}, count_occurences=False, ignore_uninteresting=True, force=False, lasso_alpha=Pruner.LASSO_DEFAULT_ALPHA, lasso_max_iter=Pruner.LASSO_DEFAULT_MAX_ITER, drop_bad_aggs=True, reject_prunable_edges=False)</code>","text":"<p>Prepare the log parsed from the table for causal analysis, using aggregation and imputation as needed.</p> <p>Parameters:</p> Name Type Description Default <code>custom_agg</code> <code>dict[str, list[str]]</code> <p>A dictionary of custom aggregation functions to be used for specific variables.</p> <code>{}</code> <code>custom_imp</code> <code>dict[str, list[str]]</code> <p>A dictionary of custom imputation functions to be used for specific variables.</p> <code>{}</code> <code>count_occurences</code> <code>bool</code> <p>Whether to include extra variables counting the occurence of each template.</p> <code>False</code> <code>ignore_uninteresting</code> <code>bool</code> <p>Whether to ignore uninteresting variables.</p> <code>True</code> <code>force</code> <code>bool</code> <p>Whether to force re-preparation of the log.</p> <code>False</code> <code>lasso_alpha</code> <code>float</code> <p>The alpha parameter to be used for LASSO regression.</p> <code>LASSO_DEFAULT_ALPHA</code> <code>lasso_max_iter</code> <code>int</code> <p>The maximum number of iterations to be used for LASSO regression.</p> <code>LASSO_DEFAULT_MAX_ITER</code> <code>drop_bad_aggs</code> <code>bool</code> <p>Whether to drop prepared variables that do not add information compared to other variables based on the same base variable but using a different aggregation function.</p> <code>True</code> <code>reject_prunable_edges</code> <code>bool</code> <p>Whether to reject edges that are prunable based on LASSO applciation.</p> <code>False</code> <p>Returns:</p> Type Description <code>str</code> <p>The time elapsed for preparation, as a string.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def prepare(\n    self,\n    custom_agg: dict[str, list[str]] = {},\n    custom_imp: dict[str, list[str]] = {},\n    count_occurences: bool = False,\n    ignore_uninteresting: bool = True,\n    force: bool = False,\n    lasso_alpha: float = Pruner.LASSO_DEFAULT_ALPHA,\n    lasso_max_iter: int = Pruner.LASSO_DEFAULT_MAX_ITER,\n    drop_bad_aggs: bool = True,\n    reject_prunable_edges: bool = False,\n) -&gt; str:\n    \"\"\"\n    Prepare the log parsed from the table for causal analysis, using aggregation and imputation as needed.\n\n    Parameters:\n        custom_agg: A dictionary of custom aggregation functions to be used for specific variables.\n        custom_imp: A dictionary of custom imputation functions to be used for specific variables.\n        count_occurences: Whether to include extra variables counting the occurence of each template.\n        ignore_uninteresting: Whether to ignore uninteresting variables.\n        force: Whether to force re-preparation of the log.\n        lasso_alpha: The alpha parameter to be used for LASSO regression.\n        lasso_max_iter: The maximum number of iterations to be used for LASSO regression.\n        drop_bad_aggs: Whether to drop prepared variables that do not add information compared to other\n            variables based on the same base variable but using a different aggregation function.\n        reject_prunable_edges: Whether to reject edges that are prunable based on LASSO applciation.\n\n    Returns:\n        The time elapsed for preparation, as a string.\n    \"\"\"\n\n    start_time = datetime.now()\n    # Ensure causal unit is set. TODO: make IUS maximizer the default\n    if self._causal_unit_var is None:\n        print(\"Causal unit not defined. Aborting.\")\n        return None\n\n    # Check if the prepared files already exist.\n    files_exist = not force\n    prepared_df_names = [\n        nameof(self._prepared_log),\n        nameof(self._prepared_variables),\n    ]\n    for var_name in prepared_df_names:\n        if not os.path.isfile(self._get_filename(var_name)):\n            files_exist = False\n            break\n\n    if files_exist:\n        self._prepared_log = Pickler.load(self._get_filename(prepared_df_names[0]))\n        self._prepared_variables = Pickler.load(\n            self._get_filename(prepared_df_names[1])\n        )\n    else:\n        self._prepare_anew(\n            custom_agg,\n            custom_imp,\n            count_occurences=count_occurences,\n            ignore_uninteresting=ignore_uninteresting,\n            drop_bad_aggs=drop_bad_aggs,\n        )\n\n    self._edge_states = EdgeStateMatrix(self.prepared_variable_names)\n    if reject_prunable_edges:\n        print(f\"Pruning edges...\")\n        self.reject_all_prunable_edges(\n            lasso_alpha=lasso_alpha, lasso_max_iter=lasso_max_iter\n        )\n\n    self._eccs = ECCS(self._prepared_log, nx.DiGraph())\n\n    end_time = datetime.now()\n    elapsed = \"{:.6f}\".format((end_time - start_time).total_seconds())\n    print(\n        f\"\"\"Preparation complete in {elapsed} seconds! \"\"\"\n        f\"\"\"{np.count_nonzero(self._edge_states.m == -1)} of the {self.num_prepared_variables ** 2} possible edges were auto-rejected.\"\"\"\n    )\n\n    return elapsed\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos._prepare_anew","title":"<code>_prepare_anew(custom_agg={}, custom_imp={}, count_occurences=False, ignore_uninteresting=True, drop_bad_aggs=True)</code>","text":"<p>Prepare the log anew.</p> <p>Parameters:</p> Name Type Description Default <code>custom_agg</code> <code>dict[str, list[str]]</code> <p>A dictionary of custom aggregation functions to be used for specific variables.</p> <code>{}</code> <code>custom_imp</code> <code>dict[str, list[str]]</code> <p>A dictionary of custom imputation functions to be used for specific variables.</p> <code>{}</code> <code>count_occurences</code> <code>bool</code> <p>Whether to include extra variables counting the occurence of each template.</p> <code>False</code> <code>ignore_uninteresting</code> <code>bool</code> <p>Whether to ignore uninteresting variables.</p> <code>True</code> <code>drop_bad_aggs</code> <code>bool</code> <p>Whether to drop prepared variables that do not add information compared to other variables based on the same base variable but using a different aggregation function.</p> <code>True</code> Source code in <code>src/logos/logos.py</code> <pre><code>def _prepare_anew(\n    self,\n    custom_agg: dict[str, list[str]] = {},\n    custom_imp: dict[str, list[str]] = {},\n    count_occurences: bool = False,\n    ignore_uninteresting: bool = True,\n    drop_bad_aggs: bool = True,\n) -&gt; None:\n    \"\"\"\n    Prepare the log anew.\n\n    Parameters:\n        custom_agg: A dictionary of custom aggregation functions to be used for specific variables.\n        custom_imp: A dictionary of custom imputation functions to be used for specific variables.\n        count_occurences: Whether to include extra variables counting the occurence of each template.\n        ignore_uninteresting: Whether to ignore uninteresting variables.\n        drop_bad_aggs: Whether to drop prepared variables that do not add information compared to other\n            variables based on the same base variable but using a different aggregation function.\n    \"\"\"\n\n    print(f\"Determining the causal unit assignment...\")\n    causal_unit_assignment = CausalUnitSuggester._discretize(\n        self._parsed_log[self._causal_unit_var],\n        self._parsed_variables[\n            self._parsed_variables[\"Name\"] == self._causal_unit_var\n        ][\"Type\"].values[0],\n        self._num_causal_units,\n    )\n\n    # Convert keys in custom_agg and custom_imp to the names of the variables, if they are tags.\n    custom_agg = {\n        TagUtils.name_of(self._parsed_variables, k, \"parsed\"): v\n        for k, v in custom_agg.items()\n    }\n    custom_imp = {\n        TagUtils.name_of(self._parsed_variables, k, \"parsed\"): v\n        for k, v in custom_imp.items()\n    }\n\n    # Start with the parsed log, optionally with extra variables counting the occurence of each template.\n    if count_occurences:\n        print(f\"Adding template occurrence count variables...\")\n        self._prepared_log = pd.concat(\n            [\n                self._parsed_log,\n                pd.get_dummies(\n                    self._parsed_log[\"TemplateId\"],\n                    prefix=\"TemplateId\",\n                    prefix_sep=\"=\",\n                ),\n            ],\n            axis=1,\n        )\n    else:\n        self._prepared_log = self._parsed_log.copy(deep=True)\n\n    # No longer need the column storing the actual template IDs\n    self._prepared_log.drop(columns=\"TemplateId\", inplace=True)\n\n    # Build dictionary of aggregation functions\n    agg_dict: dict[str, str] = {\n        variable.Name: (\n            custom_agg[variable.Name]\n            if variable.Name in custom_agg\n            else AggregateSelector.DEFAULT_AGGREGATES[variable.Type]\n        )\n        for variable in self._parsed_variables.itertuples()\n    }\n\n    # Add aggregations for template counts\n    for col in self._prepared_log.columns:\n        if PreparedVariableName(col).base_var() == \"TemplateId\":\n            agg_dict[col] = [\"sum\"]\n\n    # Drop uninteresting columns if requested, except if they are the causal unit.\n    ui_cols = self._parsed_variables.loc[\n        self._parsed_variables[\"IsUninteresting\"], \"Name\"\n    ].values\n    ui_cols = [x for x in ui_cols if x != self._causal_unit_var]\n    if ignore_uninteresting:\n        self._prepared_log.drop(\n            columns=ui_cols,\n            inplace=True,\n        )\n        for col in ui_cols:\n            agg_dict.pop(col, None)\n        print(\n            f\"Dropped {len(ui_cols)} uninteresting columns, out of an original total of {len(self.parsed_variables)}.\"\n        )\n\n    # Ensure the causal unit variable only has one aggregation function\n    agg_dict[self._causal_unit_var] = agg_dict[self._causal_unit_var][:1]\n\n    # Perform the aggregation\n    print(\"Calculating aggregates for each causal unit...\")\n    agg_func_dict: dict[str, list[Callable]] = {\n        name: [self._agg_funcs[f] for f in funcs]\n        for name, funcs in agg_dict.items()\n    }\n    self._prepared_log = self._prepared_log.groupby(\n        causal_unit_assignment\n    ).aggregate(agg_func_dict)\n    self._prepared_log.columns = [\n        \"+\".join(col) for col in self._prepared_log.columns.values\n    ]\n    self._parsed_variables[\"Aggregates\"] = self._parsed_variables[\"Name\"].map(\n        lambda x: agg_dict.get(x, [])\n    )\n    self._prepared_log.set_index(\n        f\"{self._causal_unit_var}+{self._parsed_variables[self._parsed_variables['Name'] == self._causal_unit_var]['Aggregates'].values[0][0]}\",\n        inplace=True,\n    )\n    self._prepared_log.sort_index(inplace=True)\n    self._prepared_log.index = self._prepared_log.index.astype(str)\n\n    # Perform the imputation\n    for col in tqdm(self._prepared_log.columns, desc=\"Imputing missing values...\"):\n        if self._prepared_log[col].isnull().values.any():\n            base_var = PreparedVariableName(col).base_var()\n            func_name: str = (\n                custom_imp[base_var] if base_var in custom_imp else \"no_imp\"\n            )\n            self._prepared_log[col] = (self._imp_funcs[func_name])(\n                self._prepared_log[col]\n            )\n    self._prepared_log.dropna(inplace=True)\n\n    # Drop variables that do not add information compared to other variables based on the same base variable\n    # but using a different aggregation function.\n    if drop_bad_aggs:\n        print(f\"Dropping aggregates that do not add information...\")\n        cols_to_drop = AggregateSelector.find_uninformative_aggregates(\n            self._prepared_log, self._parsed_variables, self._causal_unit_var\n        )\n        self._prepared_log.drop(columns=cols_to_drop, inplace=True)\n\n    # Identify the categorical variables and one-hot encode them\n    categorical_vars = self._prepared_log.select_dtypes(\n        include=\"object\"\n    ).columns.tolist()\n    for col in tqdm(\n        categorical_vars, desc=\"One-hot encoding categorical variables...\"\n    ):\n        self._prepared_log = pd.concat(\n            [\n                self._prepared_log,\n                pd.get_dummies(\n                    self._prepared_log[col], prefix=col, prefix_sep=\"=\", dtype=int\n                ),\n            ],\n            axis=1,\n        )\n        self._prepared_log.drop(col, axis=1, inplace=True)\n    # Deal with https://github.com/pydot/pydot/issues/258\n    self._prepared_log.columns = [\n        x.replace(\":\", \";\") for x in self._prepared_log.columns\n    ]\n\n    # Generate dataframe of prepared variables for later tagging etc.\n    self._generate_prepared_variables_df()\n\n    # Convert any date columns to Unix timestamps in milliseconds\n    date_cols = self._prepared_variables.loc[\n        self._prepared_variables[\"Type\"] == \"date\", \"Name\"\n    ].values\n    self._prepared_log[date_cols] = self._prepared_log[date_cols].map(\n        lambda x: x.timestamp() * 1000.0\n    )\n\n    # Convert any time columns to milliseconds\n    time_cols = self._prepared_variables.loc[\n        self._prepared_variables[\"Type\"] == \"time\", \"Name\"\n    ].values\n    self._prepared_log[time_cols] = self._prepared_log[time_cols].map(\n        lambda x: x.total_seconds() * 1000.0\n    )\n\n    # Write out prepared log and variables\n    if not self._skip_writeout:\n        Pickler.dump(\n            self._prepared_log, self._get_filename(nameof(self._prepared_log))\n        )\n        Pickler.dump(\n            self._prepared_variables,\n            self._get_filename(nameof(self._prepared_variables)),\n        )\n\n    print(\n        f\"\"\"Successfully prepared the log with causal unit {self._causal_unit_var} \"\"\"\n        f\"\"\"(tag: {self.get_tag_of_parsed(self._causal_unit_var)})\"\"\"\n        + (\n            \"\"\n            if not self._num_causal_units\n            else f\" with {self._num_causal_units} causal units.\"\n        )\n    )\n\n    return\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos._generate_prepared_variables_df","title":"<code>_generate_prepared_variables_df()</code>","text":"<p>Generate dataframe of prepared variables for later tagging etc.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def _generate_prepared_variables_df(self) -&gt; None:\n    \"\"\"\n    Generate dataframe of prepared variables for later tagging etc.\n    \"\"\"\n\n    self._prepared_variables = pd.DataFrame()\n    self._prepared_variables[\"Name\"] = self._prepared_log.columns\n\n    # Bring in varable name components leveraging PreparedVariableName\n    self._prepared_variables[\"Base\"] = self._prepared_variables[\"Name\"].apply(\n        lambda x: PreparedVariableName(x).base_var()\n    )\n    self._prepared_variables[\"Pre-agg Value\"] = self._prepared_variables[\n        \"Name\"\n    ].apply(lambda x: PreparedVariableName(x).pre_agg_value())\n    self._prepared_variables[\"Agg\"] = self._prepared_variables[\"Name\"].apply(\n        lambda x: PreparedVariableName(x).aggregate()\n    )\n    self._prepared_variables[\"Post-agg Value\"] = self._prepared_variables[\n        \"Name\"\n    ].apply(lambda x: PreparedVariableName(x).post_agg_value())\n\n    # Bring in other info from self._parsed_variables\n    self._prepared_variables[\"Tag\"] = self._prepared_variables.apply(\n        lambda x: (\n            self._parsed_variables.loc[\n                self._parsed_variables[\"Name\"] == x[\"Base\"],\n                \"Tag\",\n            ].values[0]\n            if x[\"Base\"] != \"TemplateId\"\n            else \"TemplateId\"\n        )\n        + (f\" {x['Pre-agg Value']}\" if x[\"Pre-agg Value\"] != \"\" else \"\")\n        + (f\" {x['Agg']}\" if x[\"Agg\"] != \"\" else \"\")\n        + (f\" {x['Post-agg Value']}\" if x[\"Post-agg Value\"] != \"\" else \"\"),\n        axis=1,\n    )\n    self._prepared_variables[\"Base Variable Occurences\"] = self._prepared_variables[\n        \"Base\"\n    ].apply(\n        lambda x: (\n            self._parsed_variables.loc[\n                self._parsed_variables[\"Name\"] == x, \"Occurrences\"\n            ].values[0]\n            if x != \"TemplateId\"\n            else \"\"\n        )\n    )\n    self._prepared_variables[\"Type\"] = self._prepared_variables[\"Base\"].apply(\n        lambda x: (\n            self._parsed_variables.loc[\n                self._parsed_variables[\"Name\"] == x, \"Type\"\n            ].values[0]\n            if x != \"TemplateId\"\n            else \"\"\n        )\n    )\n    self._prepared_variables[\"Examples\"] = self._prepared_variables[\"Base\"].apply(\n        lambda x: (\n            self._parsed_variables.loc[\n                self._parsed_variables[\"Name\"] == x, \"Examples\"\n            ].values[0]\n            if x != \"TemplateId\"\n            else \"\"\n        )\n    )\n    self._prepared_variables[\"From regex\"] = self._prepared_variables[\"Base\"].apply(\n        lambda x: (\n            self._parsed_variables.loc[\n                self._parsed_variables[\"Name\"] == x, \"From regex\"\n            ].values[0]\n            if x != \"TemplateId\"\n            else \"\"\n        )\n    )\n\n    # Bring in template text, only for appropriate base variables.\n    self._prepared_variables[\"TemplateText\"] = self._prepared_variables.apply(\n        lambda x: (\n            self._parsed_templates.loc[\n                self._parsed_templates[\"TemplateId\"]\n                == PreparedVariableName(x[\"Name\"]).template_id(),\n                \"TemplateText\",\n            ].values[0]\n            if x[\"From regex\"] == False\n            else \"\"\n        ),\n        axis=1,\n    )\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.inspect","title":"<code>inspect(var, ref_var=None, row_limit=10)</code>","text":"<p>Print information about a specific prepared variable.</p> <p>Parameters:</p> Name Type Description Default <code>var</code> <code>str</code> <p>The name or tag of the variable.</p> required <code>ref_var</code> <code>Optional[str]</code> <p>The name or tag of a reference variable.</p> <code>None</code> <code>row_limit</code> <code>Optional[int]</code> <p>The number of rows of the prepared log to print out, to illustrate example values of this variable.</p> <code>10</code> <p>Returns:</p> Type Description <code>Tuple[DataFrame, DataFrame, DataFrame]</code> <p>A tuple containing: (1) Information about the base variable of <code>var</code>, if <code>var</code> is not related to the     occurrence count of a template. (2) Information about the template of <code>var</code>, if <code>var</code> was not created from a regex. (3) A sample of the prepared log, with <code>row_limit</code> rows.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def inspect(\n    self,\n    var: str,\n    ref_var: Optional[str] = None,\n    row_limit: Optional[int] = 10,\n) -&gt; Tuple[pd.DataFrame, pd.DataFrame, pd.DataFrame]:\n    \"\"\"\n    Print information about a specific prepared variable.\n\n    Parameters:\n        var: The name or tag of the variable.\n        ref_var: The name or tag of a reference variable.\n        row_limit: The number of rows of the prepared log to print out,\n            to illustrate example values of this variable.\n\n    Returns:\n        A tuple containing:\n            (1) Information about the base variable of `var`, if `var` is not related to the\n                occurrence count of a template.\n            (2) Information about the template of `var`, if `var` was not created from a regex.\n            (3) A sample of the prepared log, with `row_limit` rows.\n    \"\"\"\n\n    # Retrieve the name of this variable, if a tag was passed in.\n    name = TagUtils.name_of(self._prepared_variables, var, \"prepared\")\n\n    print(f\"Information about prepared variable {name}:\\n\")\n    base_var = PreparedVariableName(name).base_var()\n    from_regex = False\n\n    base_var_info_df = pd.DataFrame()\n    if base_var != \"TemplateId\":\n        print(f\"--&gt; Variable Information about {base_var}:\")\n        base_var_info_df = self._parsed_variables[\n            self._parsed_variables[\"Name\"] == base_var\n        ]\n        from_regex = base_var_info_df[\"From regex\"].values[0]\n        display(base_var_info_df)\n\n    template_info_df = pd.DataFrame()\n    if not from_regex:\n        template_id = PreparedVariableName(name).template_id()\n        print(f\"--&gt; Template Information about {template_id}:\")\n        template_info_df = self._parsed_templates[\n            self._parsed_templates[\"TemplateId\"] == template_id\n        ]\n        display(template_info_df)\n\n    print(\"--&gt; Causal Unit Partial Information:\")\n    if row_limit == None:\n        row_limit = len(self._prepared_log)\n    col_list = [name]\n    col_list.extend([ref_var] if ref_var is not None else [])\n    prepared_log_info_df = self._prepared_log[col_list].head(row_limit)\n    col_names = [f\"{name} (candidate)\"]\n    col_names.extend([f\"{ref_var} (outcome)\"] if ref_var is not None else [])\n    prepared_log_info_df.columns = col_names\n    display(prepared_log_info_df)\n\n    return base_var_info_df, template_info_df, prepared_log_info_df\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.clear_graph","title":"<code>clear_graph(clear_edge_states=True)</code>","text":"<p>Clear the graph and possibly edge states.</p> <p>Parameters:</p> Name Type Description Default <code>clear_edge_states</code> <code>bool</code> <p>Whether to also clear the edge states.</p> <code>True</code> Source code in <code>src/logos/logos.py</code> <pre><code>def clear_graph(self, clear_edge_states: bool = True) -&gt; None:\n    \"\"\"\n    Clear the graph and possibly edge states.\n\n    Parameters:\n        clear_edge_states: Whether to also clear the edge states.\n    \"\"\"\n    self._graph = nx.DiGraph()\n    if clear_edge_states:\n        self._edge_states = EdgeStateMatrix(self.prepared_variable_names)\n    if self._eccs:\n        self._eccs.clear_graph(clear_edge_states)\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.display_graph","title":"<code>display_graph()</code>","text":"<p>Display the current graph.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def display_graph(self) -&gt; None:\n    \"\"\"\n    Display the current graph.\n    \"\"\"\n    GraphRenderer.display_graph(self._graph, self._prepared_variables)\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.save_graph","title":"<code>save_graph(filename)</code>","text":"<p>Save the current graph to a file.</p> <p>Parameters:</p> Name Type Description Default <code>filename</code> <code>str</code> <p>The name of the file to save to.</p> required Source code in <code>src/logos/logos.py</code> <pre><code>def save_graph(self, filename: str) -&gt; None:\n    \"\"\"\n    Save the current graph to a file.\n\n    Parameters:\n        filename: The name of the file to save to.\n    \"\"\"\n    GraphRenderer.save_graph(self._graph, self._prepared_variables, filename)\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.accept","title":"<code>accept(src, dst, also_fix, interactive=True)</code>","text":"<p>Mark a causal graph edge as accepted.</p> <p>This will also reject the edge from <code>dst</code> to <code>src</code> and remove any other variables with the same base variable as either <code>src</code> or <code>dst</code> from consideration for the partial causal graph.</p> <p>Parameters:</p> Name Type Description Default <code>src</code> <code>str</code> <p>The name or tag of the source variable.</p> required <code>dst</code> <code>str</code> <p>The name or tag of the destination variable.</p> required <code>also_fix</code> <code>bool</code> <p>Whether to also fix the edge, for ECCS.</p> required <code>interactive</code> <code>bool</code> <p>Whether to display the graph interactively after accepting the edge.</p> <code>True</code> <p>Returns:</p> Type Description <code>Tuple[float, Optional[str], Optional[str]]</code> <p>A tuple containing: (1) the exploration score after the edge addition, (2) the max-impact variable to explore next, if any, (3) optionally a string representation of the graph, if <code>interactive</code> is False.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def accept(\n    self,\n    src: str,\n    dst: str,\n    also_fix: bool,\n    interactive: bool = True,\n) -&gt; Tuple[float, Optional[str], Optional[str]]:\n    \"\"\"\n    Mark a causal graph edge as accepted.\n\n    This will also reject the edge from `dst` to `src` and remove any other variables with the\n    same base variable as either `src` or `dst` from consideration for the partial causal graph.\n\n    Parameters:\n        src: The name or tag of the source variable.\n        dst: The name or tag of the destination variable.\n        also_fix: Whether to also fix the edge, for ECCS.\n        interactive: Whether to display the graph interactively after accepting the edge.\n\n    Returns:\n        A tuple containing:\n            (1) the exploration score after the edge addition,\n            (2) the max-impact variable to explore next, if any,\n            (3) optionally a string representation of the graph, if `interactive` is False.\n    \"\"\"\n\n    src_name = TagUtils.name_of(self._prepared_variables, src, \"prepared\")\n    dst_name = TagUtils.name_of(self._prepared_variables, dst, \"prepared\")\n    to_drop = self._edge_states.mark_edge(src_name, dst_name, \"Accepted\")\n    for node in to_drop:\n        if node in self._graph.nodes:\n            self._graph.remove_node(node)\n\n    self._graph.add_node(src_name)\n    self._graph.add_node(dst_name)\n    self._graph.add_edge(src_name, dst_name)\n    if (dst_name, src_name) in self._graph.edges:\n        self._graph.remove_edge(dst_name, src_name)\n    if interactive:\n        GraphRenderer.display_graph(self._graph, self._prepared_variables)\n    if self._eccs:\n        self._eccs.remove_edge(dst_name, src_name)\n        self._eccs.add_edge(src_name, dst_name)\n        if also_fix:\n            self._eccs.fix_edge(src_name, dst_name)\n\n    return (\n        self.exploration_score,\n        self.suggest_next_exploration(),\n        (\n            GraphRenderer.draw_graph(self._graph, self._prepared_variables)\n            if not interactive\n            else \"\"\n        ),\n    )\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.reject","title":"<code>reject(src, dst, also_ban, interactive=True)</code>","text":"<p>Mark a causal graph edge as rejected.</p> <p>Parameters:</p> Name Type Description Default <code>src</code> <code>str</code> <p>The name or tag of the source variable.</p> required <code>dst</code> <code>str</code> <p>The name or tag of the destination variable.</p> required <code>also_ban</code> <code>bool</code> <p>Whether to also ban the edge, for ECCS.</p> required <code>interactive</code> <code>bool</code> <p>Whether to display the graph interactively after rejecting the edge.</p> <code>True</code> <p>Returns:</p> Type Description <code>Tuple[float, Optional[str], Optional[str]]</code> <p>A tuple containing: (1) the exploration score after the edge rejection, (2) the max-impact variable to explore next, if any, (3) optionally a string representation of the graph, if <code>interactive</code> is False.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def reject(\n    self,\n    src: str,\n    dst: str,\n    also_ban: bool,\n    interactive: bool = True,\n) -&gt; Tuple[float, Optional[str], Optional[str]]:\n    \"\"\"\n    Mark a causal graph edge as rejected.\n\n    Parameters:\n        src: The name or tag of the source variable.\n        dst: The name or tag of the destination variable.\n        also_ban: Whether to also ban the edge, for ECCS.\n        interactive: Whether to display the graph interactively after rejecting the edge.\n\n    Returns:\n        A tuple containing:\n            (1) the exploration score after the edge rejection,\n            (2) the max-impact variable to explore next, if any,\n            (3) optionally a string representation of the graph, if `interactive` is False.\n    \"\"\"\n\n    src_name = TagUtils.name_of(self._prepared_variables, src, \"prepared\")\n    dst_name = TagUtils.name_of(self._prepared_variables, dst, \"prepared\")\n    self._edge_states.mark_edge(src_name, dst_name, \"Rejected\")\n    if self._eccs and also_ban:\n        self._eccs.ban_edge(src_name, dst_name)\n\n    if interactive:\n        GraphRenderer.display_graph(self._graph, self._prepared_variables)\n\n    return (\n        self.exploration_score,\n        self.suggest_next_exploration(),\n        (\n            GraphRenderer.draw_graph(self._graph, self._prepared_variables)\n            if not interactive\n            else \"\"\n        ),\n    )\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.reject_undecided_incoming","title":"<code>reject_undecided_incoming(dst, also_ban, interactive=True)</code>","text":"<p>Mark all undecided incoming edges to a variable as rejected.</p> <p>Parameters:</p> Name Type Description Default <code>dst</code> <code>str</code> <p>The name or tag of the destination variable.</p> required <code>also_ban</code> <code>bool</code> <p>Whether to also ban the edges, for ECCS.</p> required <code>interactive</code> <code>bool</code> <p>Whether to display the graph interactively after rejecting the edges.</p> <code>True</code> <p>Returns:</p> Type Description <code>Tuple[float, Optional[str], Optional[str]]</code> <p>A tuple containing: (1) the exploration score after the edge rejections, (2) the max-impact variable to explore next, if any, (3) optionally a string representation of the graph, if <code>interactive</code> is False.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def reject_undecided_incoming(\n    self, dst: str, also_ban: bool, interactive: bool = True\n) -&gt; Tuple[float, Optional[str], Optional[str]]:\n    \"\"\"\n    Mark all undecided incoming edges to a variable as rejected.\n\n    Parameters:\n        dst: The name or tag of the destination variable.\n        also_ban: Whether to also ban the edges, for ECCS.\n        interactive: Whether to display the graph interactively after rejecting the edges.\n\n    Returns:\n        A tuple containing:\n            (1) the exploration score after the edge rejections,\n            (2) the max-impact variable to explore next, if any,\n            (3) optionally a string representation of the graph, if `interactive` is False.\n    \"\"\"\n    dst_name = TagUtils.name_of(self._prepared_variables, dst, \"prepared\")\n    for v in self.prepared_variable_names:\n        if self._edge_states.get_edge_state(v, dst_name) == \"Undecided\":\n            self._edge_states.mark_edge(v, dst_name, \"Rejected\")\n            if self._eccs and also_ban:\n                self._eccs.ban_edge(v, dst_name)\n\n    if interactive:\n        GraphRenderer.display_graph(self._graph, self._prepared_variables)\n\n    return (\n        self.exploration_score,\n        self.suggest_next_exploration(),\n        (\n            GraphRenderer.draw_graph(self._graph, self._prepared_variables)\n            if not interactive\n            else \"\"\n        ),\n    )\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.reject_undecided_outgoing","title":"<code>reject_undecided_outgoing(src, also_ban, interactive=True)</code>","text":"<p>Mark all undecided outgoing edges from a variable as rejected.</p> <p>Parameters:</p> Name Type Description Default <code>src</code> <code>str</code> <p>The name or tag of the source variable.</p> required <code>also_ban</code> <code>bool</code> <p>Whether to also ban the edges, for ECCS.</p> required <code>interactive</code> <code>bool</code> <p>Whether to display the graph interactively after rejecting the edges.</p> <code>True</code> <p>Returns:</p> Type Description <code>Tuple[float, Optional[str], Optional[str]]</code> <p>A tuple containing: (1) the exploration score after the edge rejections, (2) the max-impact variable to explore next, if any, (3) optionally a string representation of the graph, if <code>interactive</code> is False.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def reject_undecided_outgoing(\n    self, src: str, also_ban: bool, interactive: bool = True\n) -&gt; Tuple[float, Optional[str], Optional[str]]:\n    \"\"\"\n    Mark all undecided outgoing edges from a variable as rejected.\n\n    Parameters:\n        src: The name or tag of the source variable.\n        also_ban: Whether to also ban the edges, for ECCS.\n        interactive: Whether to display the graph interactively after rejecting the edges.\n\n    Returns:\n        A tuple containing:\n            (1) the exploration score after the edge rejections,\n            (2) the max-impact variable to explore next, if any,\n            (3) optionally a string representation of the graph, if `interactive` is False.\n    \"\"\"\n    src_name = TagUtils.name_of(self._prepared_variables, src, \"prepared\")\n    for v in self.prepared_variable_names:\n        if self._edge_states.get_edge_state(src_name, v) == \"Undecided\":\n            self._edge_states.mark_edge(src_name, v, \"Rejected\")\n            if self._eccs and also_ban:\n                self._eccs.ban_edge(src_name, v)\n\n    if interactive:\n        GraphRenderer.display_graph(self._graph, self._prepared_variables)\n\n    return (\n        self.exploration_score,\n        self.suggest_next_exploration(),\n        (\n            GraphRenderer.draw_graph(self._graph, self._prepared_variables)\n            if not interactive\n            else \"\"\n        ),\n    )\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.reject_all_prunable_edges","title":"<code>reject_all_prunable_edges(also_ban, lasso_alpha=Pruner.LASSO_DEFAULT_ALPHA, lasso_max_iter=Pruner.LASSO_DEFAULT_MAX_ITER)</code>","text":"<p>For every prepared variable, reject all incoming edges that start at a variable that is pruned by our pruning approach. This may be time-consuming depending on the number of variables.</p> <p>Parameters:</p> Name Type Description Default <code>also_ban</code> <code>bool</code> <p>Whether to also ban the edges, for ECCS.</p> required <code>lasso_alpha</code> <code>float</code> <p>The alpha parameter to be used for Lasso regression.</p> <code>LASSO_DEFAULT_ALPHA</code> <code>lasso_max_iter</code> <code>int</code> <p>The maximum number of iterations to be used for Lasso regression.</p> <code>LASSO_DEFAULT_MAX_ITER</code> <p>Returns:</p> Type Description <code>Tuple[float, Optional[str], Optional[str]]</code> <p>A tuple containing: (1) the exploration score after the edge rejections, (2) the max-impact variable to explore next, if any, (3) optionally a string representation of the graph, if <code>interactive</code> is False.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def reject_all_prunable_edges(\n    self,\n    also_ban: bool,\n    lasso_alpha: float = Pruner.LASSO_DEFAULT_ALPHA,\n    lasso_max_iter: int = Pruner.LASSO_DEFAULT_MAX_ITER,\n) -&gt; Tuple[float, Optional[str], Optional[str]]:\n    \"\"\"\n    For every prepared variable, reject all incoming edges that start at a variable\n    that is pruned by our pruning approach. This may be time-consuming depending on the number of variables.\n\n    Parameters:\n        also_ban: Whether to also ban the edges, for ECCS.\n        lasso_alpha: The alpha parameter to be used for Lasso regression.\n        lasso_max_iter: The maximum number of iterations to be used for Lasso regression.\n\n    Returns:\n        A tuple containing:\n            (1) the exploration score after the edge rejections,\n            (2) the max-impact variable to explore next, if any,\n            (3) optionally a string representation of the graph, if `interactive` is False.\n    \"\"\"\n    num_processors = multiprocessing.cpu_count()\n    with multiprocessing.Pool(processes=num_processors) as pool:\n        all_candidates = pool.starmap(\n            Pruner.prune_with_lasso,\n            tqdm(\n                [\n                    (self._prepared_log, [target], lasso_alpha, lasso_max_iter)\n                    for target in self.prepared_variable_names\n                ],\n                total=self.num_prepared_variables,\n                desc=\"Finding pruned variables...\",\n            ),\n        )\n\n    Printer.printv(all_candidates)\n\n    for candidates, target in zip(all_candidates, self.prepared_variable_names):\n        non_candidates = (\n            set(self._prepared_log.columns) - set(candidates) - set([target])\n        )\n        for nc in non_candidates:\n            self._edge_states.mark_edge(nc, target, \"Rejected\")\n            if self._eccs and also_ban:\n                self._eccs.ban_edge(nc, target)\n\n    return (\n        self.exploration_score,\n        self.suggest_next_exploration(),\n        GraphRenderer.draw_graph(self._graph, self._prepared_variables),\n    )\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.rank_candidate_causes","title":"<code>rank_candidate_causes(target=None, ignore=None, method=CandidateCauseRankerMethod.LOGOS, prune_candidates=True, lasso_alpha=Pruner.LASSO_DEFAULT_ALPHA, lasso_max_iter=Pruner.LASSO_DEFAULT_MAX_ITER, model='gpt-4o-mini-2024-07-18', gpt_log_path=None)</code>","text":"<p>Present the user with ranked candidate causes for <code>target</code>. If no <code>target</code> is specified, the most recent suggestion of <code>suggest_next_exploration()</code> is used, if any. If <code>ignore</code> is specified, the variables in <code>ignore</code> are not considered as candidate causes.</p> <p>Parameters:</p> Name Type Description Default <code>target</code> <code>Optional[str]</code> <p>The name or tag of the target variable.</p> <code>None</code> <code>ignore</code> <code>Optional[List[str]]</code> <p>A list of variables to ignore.</p> <code>None</code> <code>method</code> <code>CandidateCauseRankerMethod</code> <p>The method to use for ranking candidate causes.</p> <code>LOGOS</code> <code>prune_candidates</code> <code>bool</code> <p>Whether to prune the candidate causes using Lasso regression. Only applies if <code>method</code> is <code>CandidateCauseRankerMethod.LOGOS</code>.</p> <code>True</code> <code>lasso_alpha</code> <code>float</code> <p>The alpha parameter to be used for Lasso regression. Only applies if <code>method</code> is <code>CandidateCauseRankerMethod.LOGOS</code> and <code>prune_candidates</code> is True.</p> <code>LASSO_DEFAULT_ALPHA</code> <code>lasso_max_iter</code> <code>int</code> <p>The maximum number of iterations to be used for Lasso regression. Only applies if <code>method</code> is <code>CandidateCauseRankerMethod.LOGOS</code> and <code>prune_candidates</code> is True.</p> <code>LASSO_DEFAULT_MAX_ITER</code> <code>model</code> <code>str</code> <p>The model to use for the langmodel method. Only applies if the method is <code>CandidateCauseRankerMethod.LANGMODEL</code>.</p> <code>'gpt-4o-mini-2024-07-18'</code> <code>gpt_log_path</code> <code>Optional[str]</code> <p>The path to the log file to use for the langmodel method. Only applies if the method is <code>CandidateCauseRankerMethod.LANGMODEL</code>.</p> <code>None</code> <p>Returns:     A tuple containing:     (1) A dataframe containing the candidate causes for <code>target</code> and     (2) The time elapsed for exploration, as a string.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def rank_candidate_causes(\n    self,\n    target: Optional[str] = None,\n    ignore: Optional[List[str]] = None,\n    method: CandidateCauseRankerMethod = CandidateCauseRankerMethod.LOGOS,\n    prune_candidates: bool = True,\n    lasso_alpha: float = Pruner.LASSO_DEFAULT_ALPHA,\n    lasso_max_iter: int = Pruner.LASSO_DEFAULT_MAX_ITER,\n    model: str = \"gpt-4o-mini-2024-07-18\",\n    gpt_log_path: Optional[str] = None,\n) -&gt; Tuple[pd.DataFrame, str]:\n    \"\"\"\n    Present the user with ranked candidate causes for `target`. If no `target`\n    is specified, the most recent suggestion of `suggest_next_exploration()` is used, if any.\n    If `ignore` is specified, the variables in `ignore` are not considered as candidate causes.\n\n    Parameters:\n        target: The name or tag of the target variable.\n        ignore: A list of variables to ignore.\n        method: The method to use for ranking candidate causes.\n        prune_candidates: Whether to prune the candidate causes using Lasso regression. Only\n            applies if `method` is `CandidateCauseRankerMethod.LOGOS`.\n        lasso_alpha: The alpha parameter to be used for Lasso regression. Only applies if\n            `method` is `CandidateCauseRankerMethod.LOGOS` and `prune_candidates` is True.\n        lasso_max_iter: The maximum number of iterations to be used for Lasso regression. Only\n            applies if `method` is `CandidateCauseRankerMethod.LOGOS` and `prune_candidates` is True.\n        model: The model to use for the langmodel method. Only applies if the method is\n            `CandidateCauseRankerMethod.LANGMODEL`.\n        gpt_log_path: The path to the log file to use for the langmodel method. Only applies if\n            the method is `CandidateCauseRankerMethod.LANGMODEL`.\n    Returns:\n        A tuple containing:\n        (1) A dataframe containing the candidate causes for `target` and\n        (2) The time elapsed for exploration, as a string.\n    \"\"\"\n\n    start_time = datetime.now()\n\n    # Handle the case where the user has not specified a target.\n    if target is None and self._next_exploration is None:\n        print(\"No target specified.\")\n        return pd.DataFrame(columns=CandidateCauseRanker.COLUMN_ORDER), \"\"\n    elif target is None:\n        target = self._next_exploration\n\n    # If the user provided the target as a tag, retrieve its name\n    target = TagUtils.name_of(self._prepared_variables, target, \"prepared\")\n\n    # Use the specified method to rank candidate causes\n    result_df, pruned = CandidateCauseRanker.rank(\n        self.prepared_log,\n        self.prepared_variables,\n        target,\n        ignore,\n        method,\n        prune_candidates,\n        lasso_alpha,\n        lasso_max_iter,\n        model,\n        (\n            gpt_log_path\n            if (gpt_log_path is not None)\n            else os.path.join(\n                self._workdir,\n                f\"ranker-gpt-{datetime.now().strftime('%Y-%m-%d-%H-%M-%S')}.log\",\n            )\n        ),\n    )\n\n    # Mark the edges rejected by the pruning step, if any.\n    for var in pruned:\n        self._edge_states.mark_edge(var, target, \"Rejected\")\n\n    # Add fields to the returned dataframe\n    result_df[\"Candidate-&gt;Target Edge Status\"] = result_df[\"Candidate\"].apply(\n        lambda x: self._edge_states.get_edge_state(x, target)\n    )\n    result_df[\"Target-&gt;Candidate Edge Status\"] = result_df[\"Candidate\"].apply(\n        lambda x: self._edge_states.get_edge_state(target, x)\n    )\n\n    ret_val = result_df[CandidateCauseRanker.COLUMN_ORDER]\n\n    end_time = datetime.now()\n    elapsed = \"{:.6f}\".format((end_time - start_time).total_seconds())\n    print(f\"Candidate cause exploration complete in {elapsed} seconds!\")\n\n    return ret_val, elapsed\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.get_causal_graph_refinement_suggestion","title":"<code>get_causal_graph_refinement_suggestion(method=InteractiveCausalGraphRefinerMethod.LOGOS, treatment=None, outcome=None, model='gpt-4o-mini-2024-07-18', gpt_log_path=None)</code>","text":"<p>Present the user with an edge, the presence and direction of which they should assess.</p> <p>Parameters:</p> Name Type Description Default <code>method</code> <code>InteractiveCausalGraphRefinerMethod</code> <p>The method to use for producing a causal graph refinement suggestion.</p> <code>LOGOS</code> <code>treatment</code> <code>Optional[str]</code> <p>The name or tag of the treatment variable. Only applies if the method is <code>InteractiveCausalGraphRefinerMethod.LOGOS</code>.</p> <code>None</code> <code>outcome</code> <code>Optional[str]</code> <p>The name or tag of the outcome variable. Only applies if the method is <code>InteractiveCausalGraphRefinerMethod.LOGOS</code>.</p> <code>None</code> <code>model</code> <code>str</code> <p>The model to use for the langmodel method. Only applies if the method is <code>CandidateCauseRankerMethod.LANGMODEL</code>.</p> <code>'gpt-4o-mini-2024-07-18'</code> <code>gpt_log_path</code> <code>Optional[str]</code> <p>The path to the log file to use for the langmodel method. Only applies if the method is <code>CandidateCauseRankerMethod.LANGMODEL</code>.</p> <code>None</code> <p>Returns:     A tuple containing:     (1) The edge to assess, as an Edge object, and     (2) The time elapsed for generating the suggestion, as a string.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def get_causal_graph_refinement_suggestion(\n    self,\n    method: InteractiveCausalGraphRefinerMethod = InteractiveCausalGraphRefinerMethod.LOGOS,\n    treatment: Optional[str] = None,\n    outcome: Optional[str] = None,\n    model: str = \"gpt-4o-mini-2024-07-18\",\n    gpt_log_path: Optional[str] = None,\n) -&gt; Tuple[Edge, str]:\n    \"\"\"\n    Present the user with an edge, the presence and direction of which they should assess.\n\n    Parameters:\n        method: The method to use for producing a causal graph refinement suggestion.\n        treatment: The name or tag of the treatment variable. Only applies if the method is\n            `InteractiveCausalGraphRefinerMethod.LOGOS`.\n        outcome: The name or tag of the outcome variable. Only applies if the method is\n            `InteractiveCausalGraphRefinerMethod.LOGOS`.\n        model: The model to use for the langmodel method. Only applies if the method is\n            `CandidateCauseRankerMethod.LANGMODEL`.\n        gpt_log_path: The path to the log file to use for the langmodel method. Only applies if\n            the method is `CandidateCauseRankerMethod.LANGMODEL`.\n    Returns:\n        A tuple containing:\n        (1) The edge to assess, as an Edge object, and\n        (2) The time elapsed for generating the suggestion, as a string.\n    \"\"\"\n\n    start_time = datetime.now()\n\n    treatment_name = TagUtils.name_of(\n        self._prepared_variables, treatment, \"prepared\"\n    )\n    outcome_name = TagUtils.name_of(self._prepared_variables, outcome, \"prepared\")\n\n    edge = InteractiveCausalGraphRefiner.get_suggestion(\n        self.prepared_log,\n        method,\n        self._eccs,\n        treatment_name,\n        outcome_name,\n        self._graph,\n        model,\n        (\n            gpt_log_path\n            if (gpt_log_path is not None)\n            else os.path.join(\n                self._workdir,\n                f\"refiner-gpt-{datetime.now().strftime('%Y-%m-%d-%H-%M-%S')}.log\",\n            )\n        ),\n        self.prepared_variables\n    )\n\n    edge_tags = None\n    if edge:\n        edge_tags = tuple(\n            TagUtils.tag_of(self._prepared_variables, x, \"prepared\") for x in edge\n        )\n\n    end_time = datetime.now()\n    elapsed = \"{:.6f}\".format((end_time - start_time).total_seconds())\n    print(f\"Candidate cause exploration complete in {elapsed} seconds!\")\n\n    return edge_tags, elapsed\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.suggest_next_exploration","title":"<code>suggest_next_exploration()</code>","text":"<p>Suggest the variable that should be explored next. Suggest the prepared variable in the partial causal graph that has the most (nonzero) Unexplored incoming edges, if any; otherwise suggest the prepared variable with the most (nonzero) Undecided incoming edges, even if it is not in the partial causal graph.</p> <p>If all edges are decided, return None.</p> <p>Returns:</p> Type Description <code>Optional[str]</code> <p>The name of the variable to explore next.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def suggest_next_exploration(self) -&gt; Optional[str]:\n    \"\"\"\n    Suggest the variable that should be explored next. Suggest the prepared variable in the partial causal graph\n    that has the most (nonzero) Unexplored incoming edges, if any; otherwise suggest the prepared variable\n    with the most (nonzero) Undecided incoming edges, even if it is not in the partial causal graph.\n\n    If all edges are decided, return None.\n\n    Returns:\n        The name of the variable to explore next.\n    \"\"\"\n\n    # Try to find a suggestion from the partial causal graph.\n    node_names = list(self._graph.nodes)\n    graph_var_indices = [self._edge_states.idx(x) for x in node_names]\n    graph_var_incoming_edge_states = self._edge_states.m[:, graph_var_indices]\n    undecided_edges_per_col = (\n        np.sum(graph_var_incoming_edge_states == 0, axis=0)\n        if len(graph_var_incoming_edge_states) &gt; 0\n        else []\n    )\n    max_undecided = (\n        np.max(undecided_edges_per_col) if len(undecided_edges_per_col) &gt; 0 else 0\n    )\n\n    if max_undecided &gt; 0:\n        max_undecided_idx = np.argmax(undecided_edges_per_col)\n        self._next_exploration = node_names[max_undecided_idx]\n        return self._next_exploration\n\n    # If no suggestion was found, try to find a suggestion from the entire collection of prepared variables.\n    undecided_edges_per_col = np.sum(self._edge_states.m == 0, axis=0)\n    max_undecided = np.max(undecided_edges_per_col)\n\n    if max_undecided &gt; 0:\n        max_undecided_idx = np.argmax(undecided_edges_per_col)\n        self._next_exploration = self._prepared_variables.loc[\n            max_undecided_idx, \"Name\"\n        ]\n        return self._next_exploration\n\n    # If no suggestion was found, return None.\n    self._next_exploration = None\n    return None\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.discover_graph","title":"<code>discover_graph(method='hill_climb', max_cond_vars=3, model='gpt-3.5-turbo')</code>","text":"<p>Discover a causal graph based on the prepared table automatically.</p> <p>Parameters:</p> Name Type Description Default <code>method</code> <code>str</code> <p>The method to be used for graph discovery, among \"PC\", \"hill_climb\", \"exhaustive\" and \"GPT\".</p> <code>'hill_climb'</code> <code>max_cond_vars</code> <code>int</code> <p>The maximum number of conditioning variables to be used for PC.</p> <code>3</code> <code>model</code> <code>str</code> <p>The model to be used for GPT-based graph discovery.</p> <code>'gpt-3.5-turbo'</code> Source code in <code>src/logos/logos.py</code> <pre><code>def discover_graph(\n    self,\n    method: str = \"hill_climb\",\n    max_cond_vars: int = 3,\n    model: str = \"gpt-3.5-turbo\",\n) -&gt; None:\n    \"\"\"\n    Discover a causal graph based on the prepared table automatically.\n\n    Parameters:\n        method: The method to be used for graph discovery, among \"PC\", \"hill_climb\", \"exhaustive\" and \"GPT\".\n        max_cond_vars: The maximum number of conditioning variables to be used for PC.\n        model: The model to be used for GPT-based graph discovery.\n\n    \"\"\"\n\n    if method == \"PC\":\n        self._graph = CausalDiscoverer.pc(\n            self._prepared_log, max_cond_vars=max_cond_vars\n        )\n    elif method == \"hill_climb\":\n        self._graph = CausalDiscoverer.hill_climb(self._prepared_log)\n    elif method == \"exhaustive\":\n        self._graph = CausalDiscoverer.exhaustive(self._prepared_log)\n    elif method == \"GPT\":\n        self._graph = CausalDiscoverer.gpt(self._prepared_log, model=model)\n    else:\n        raise ValueError(f\"Invalid graph discovery method {method}\")\n\n    self._edge_states.clear_and_set_from_graph(self._graph)\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.get_adjusted_ate","title":"<code>get_adjusted_ate(treatment, outcome, confounder=None)</code>","text":"<p>Calculate the adjusted ATE of <code>treatment</code> on <code>outcome</code>, given the current partial causal graph.</p> <p>Parameters:</p> Name Type Description Default <code>treatment</code> <code>str</code> <p>The name or tag of the treatment variable.</p> required <code>outcome</code> <code>str</code> <p>The name or tag of the outcome variable.</p> required <code>confounder</code> <code>Optional[str]</code> <p>The name or tag of a confounder variable. If specified, overrides the current partial causal graph in favor of a three-node graph with <code>treatment</code>, <code>outcome</code> and <code>confounder</code>.</p> <code>None</code> <p>Returns:</p> Type Description <code>float</code> <p>The adjusted ATE of <code>treatment</code> on <code>outcome</code>.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def get_adjusted_ate(\n    self,\n    treatment: str,\n    outcome: str,\n    confounder: Optional[str] = None,\n) -&gt; float:\n    \"\"\"\n    Calculate the adjusted ATE of `treatment` on `outcome`, given the current partial causal graph.\n\n    Parameters:\n        treatment: The name or tag of the treatment variable.\n        outcome: The name or tag of the outcome variable.\n        confounder: The name or tag of a confounder variable. If specified, overrides the current partial\n            causal graph in favor of a three-node graph with `treatment`, `outcome` and `confounder`.\n\n    Returns:\n        The adjusted ATE of `treatment` on `outcome`.\n    \"\"\"\n    return ATECalculator.get_ate_and_confidence(\n        self.prepared_log,\n        self.prepared_variables,\n        treatment,\n        outcome,\n        confounder,\n        graph=self._graph,\n        calculate_p_value=False,\n        calculate_std_error=False,\n    )[\"ATE\"]\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.get_unadjusted_ate","title":"<code>get_unadjusted_ate(treatment, outcome)</code>","text":"<p>Calculate the unadjusted ATE of <code>treatment</code> on <code>outcome</code>, ignoring the current partial causal graph in favor of a two-node graph with just <code>treatment</code> and <code>outcome</code>.</p> <p>Parameters:</p> Name Type Description Default <code>treatment</code> <code>str</code> <p>The name or tag of the treatment variable.</p> required <code>outcome</code> <code>str</code> <p>The name or tag of the outcome variable.</p> required <p>Returns:</p> Type Description <code>float</code> <p>The unadjusted ATE of <code>treatment</code> on <code>outcome</code>.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def get_unadjusted_ate(\n    self,\n    treatment: str,\n    outcome: str,\n) -&gt; float:\n    \"\"\"\n    Calculate the unadjusted ATE of `treatment` on `outcome`, ignoring the current partial causal graph\n    in favor of a two-node graph with just `treatment` and `outcome`.\n\n    Parameters:\n        treatment: The name or tag of the treatment variable.\n        outcome: The name or tag of the outcome variable.\n\n    Returns:\n        The unadjusted ATE of `treatment` on `outcome`.\n    \"\"\"\n    return ATECalculator.get_ate_and_confidence(\n        self.prepared_log,\n        self.prepared_variables,\n        treatment,\n        outcome,\n        calculate_p_value=False,\n        calculate_std_error=False,\n    )[\"ATE\"]\n</code></pre>"},{"location":"reference/logos/pickler/","title":"Pickler","text":""},{"location":"reference/logos/pickler/#logos.pickler.Pickler","title":"<code>Pickler</code>","text":"<p>A class for loading and dumping dataframes to and from pkl files.</p> Source code in <code>src/logos/pickler.py</code> <pre><code>class Pickler:\n    \"\"\"\n    A class for loading and dumping dataframes to and from pkl files.\n    \"\"\"\n\n    @staticmethod\n    def load(filename: str) -&gt; pd.DataFrame:\n        \"\"\"\n        Loads a dataframe from a pkl file.\n\n        Parameters:\n            filename: The name of the pkl file.\n\n        Returns:\n            The dataframe loaded from the pkl file.\n        \"\"\"\n        df = pd.DataFrame()\n        with open(filename, \"rb\") as f:\n            df = pickle.load(f)\n        return df\n\n    @staticmethod\n    def dump(df: pd.DataFrame, filename: str) -&gt; None:\n        \"\"\"\n        Dumps a dataframe to a pkl file.\n\n        Parameters:\n            df: The dataframe to be dumped.\n            filename: The name of the pkl file.\n        \"\"\"\n\n        if \"/\" in filename:\n            path = filename[: filename.rindex(\"/\")]\n            os.makedirs(path, exist_ok=True)\n\n        with open(filename, \"wb+\") as f:\n            pickle.dump(df, f, protocol=pickle.HIGHEST_PROTOCOL)\n</code></pre>"},{"location":"reference/logos/pickler/#logos.pickler.Pickler.load","title":"<code>load(filename)</code>  <code>staticmethod</code>","text":"<p>Loads a dataframe from a pkl file.</p> <p>Parameters:</p> Name Type Description Default <code>filename</code> <code>str</code> <p>The name of the pkl file.</p> required <p>Returns:</p> Type Description <code>DataFrame</code> <p>The dataframe loaded from the pkl file.</p> Source code in <code>src/logos/pickler.py</code> <pre><code>@staticmethod\ndef load(filename: str) -&gt; pd.DataFrame:\n    \"\"\"\n    Loads a dataframe from a pkl file.\n\n    Parameters:\n        filename: The name of the pkl file.\n\n    Returns:\n        The dataframe loaded from the pkl file.\n    \"\"\"\n    df = pd.DataFrame()\n    with open(filename, \"rb\") as f:\n        df = pickle.load(f)\n    return df\n</code></pre>"},{"location":"reference/logos/pickler/#logos.pickler.Pickler.dump","title":"<code>dump(df, filename)</code>  <code>staticmethod</code>","text":"<p>Dumps a dataframe to a pkl file.</p> <p>Parameters:</p> Name Type Description Default <code>df</code> <code>DataFrame</code> <p>The dataframe to be dumped.</p> required <code>filename</code> <code>str</code> <p>The name of the pkl file.</p> required Source code in <code>src/logos/pickler.py</code> <pre><code>@staticmethod\ndef dump(df: pd.DataFrame, filename: str) -&gt; None:\n    \"\"\"\n    Dumps a dataframe to a pkl file.\n\n    Parameters:\n        df: The dataframe to be dumped.\n        filename: The name of the pkl file.\n    \"\"\"\n\n    if \"/\" in filename:\n        path = filename[: filename.rindex(\"/\")]\n        os.makedirs(path, exist_ok=True)\n\n    with open(filename, \"wb+\") as f:\n        pickle.dump(df, f, protocol=pickle.HIGHEST_PROTOCOL)\n</code></pre>"},{"location":"reference/logos/printer/","title":"Printer","text":""},{"location":"reference/logos/printer/#logos.printer.Printer","title":"<code>Printer</code>","text":"<p>A class for controlling message printing.</p> Source code in <code>src/logos/printer.py</code> <pre><code>class Printer:\n    \"\"\"\n    A class for controlling message printing.\n    \"\"\"\n\n    \"\"\"\n    A flag indicating whether or not to print messages to the console.\n    \"\"\"\n    SAWMILL_VERBOSE = False\n\n    @classmethod\n    def printv(self, msg: Any) -&gt; None:\n        \"\"\"\n        Prints a message to the console if in verbose mode.\n\n        Parameters:\n            msg: The message to be printed.\n        \"\"\"\n        if Printer.SAWMILL_VERBOSE:\n            print(msg)\n\n    @classmethod\n    def set_verbose(self, val: bool) -&gt; None:\n        \"\"\"\n        Sets the verbosity of the printer.\n\n        Parameters:\n            val: The new verbosity value.\n        \"\"\"\n        Printer.SAWMILL_VERBOSE = val\n\n    @staticmethod\n    def set_warnings_to(self, value: str):\n        \"\"\"\n        Set selected warnings to `value`.\n\n        Parameters:\n            value: The value to set the warnings to.\n        \"\"\"\n        warnings.filterwarnings(\n            value, category=RuntimeWarning, message=\"mean of empty slice\"\n        )\n        warnings.filterwarnings(\n            value,\n            category=RuntimeWarning,\n            message=\"invalid value encountered in scalar divide\",\n        )\n</code></pre>"},{"location":"reference/logos/printer/#logos.printer.Printer.printv","title":"<code>printv(msg)</code>  <code>classmethod</code>","text":"<p>Prints a message to the console if in verbose mode.</p> <p>Parameters:</p> Name Type Description Default <code>msg</code> <code>Any</code> <p>The message to be printed.</p> required Source code in <code>src/logos/printer.py</code> <pre><code>@classmethod\ndef printv(self, msg: Any) -&gt; None:\n    \"\"\"\n    Prints a message to the console if in verbose mode.\n\n    Parameters:\n        msg: The message to be printed.\n    \"\"\"\n    if Printer.SAWMILL_VERBOSE:\n        print(msg)\n</code></pre>"},{"location":"reference/logos/printer/#logos.printer.Printer.set_verbose","title":"<code>set_verbose(val)</code>  <code>classmethod</code>","text":"<p>Sets the verbosity of the printer.</p> <p>Parameters:</p> Name Type Description Default <code>val</code> <code>bool</code> <p>The new verbosity value.</p> required Source code in <code>src/logos/printer.py</code> <pre><code>@classmethod\ndef set_verbose(self, val: bool) -&gt; None:\n    \"\"\"\n    Sets the verbosity of the printer.\n\n    Parameters:\n        val: The new verbosity value.\n    \"\"\"\n    Printer.SAWMILL_VERBOSE = val\n</code></pre>"},{"location":"reference/logos/printer/#logos.printer.Printer.set_warnings_to","title":"<code>set_warnings_to(value)</code>  <code>staticmethod</code>","text":"<p>Set selected warnings to <code>value</code>.</p> <p>Parameters:</p> Name Type Description Default <code>value</code> <code>str</code> <p>The value to set the warnings to.</p> required Source code in <code>src/logos/printer.py</code> <pre><code>@staticmethod\ndef set_warnings_to(self, value: str):\n    \"\"\"\n    Set selected warnings to `value`.\n\n    Parameters:\n        value: The value to set the warnings to.\n    \"\"\"\n    warnings.filterwarnings(\n        value, category=RuntimeWarning, message=\"mean of empty slice\"\n    )\n    warnings.filterwarnings(\n        value,\n        category=RuntimeWarning,\n        message=\"invalid value encountered in scalar divide\",\n    )\n</code></pre>"},{"location":"reference/logos/pruner/","title":"Pruner","text":""},{"location":"reference/logos/pruner/#logos.pruner.Pruner","title":"<code>Pruner</code>","text":"Source code in <code>src/logos/pruner.py</code> <pre><code>class Pruner:\n    LASSO_DEFAULT_ALPHA = 0.1\n    LASSO_DEFAULT_MAX_ITER = 100000\n\n    \"\"\"\n    A collection of pruning functions for prepared variables,\n    used for pruning and candidate suggestion.\n    \"\"\"\n\n    @staticmethod\n    def prune_with_lasso(\n        data: pd.DataFrame,\n        outcome_cols: list[str],\n        alpha: float = LASSO_DEFAULT_ALPHA,\n        max_iter: int = LASSO_DEFAULT_MAX_ITER,\n        top_n: int = 0,\n        ignore: Optional[list[str]] = None,\n    ) -&gt; list[str]:\n        \"\"\"\n        Prune variables using Lasso regression.\n\n        Parameters:\n            data: The dataframe containing the data.\n            outcome_cols: The names of the target variables.\n            alpha: The Lasso regularization parameter.\n            max_iter: The maximum number of iterations for Lasso.\n            top_n: The number of variables to return. If 0, return all variables.\n            ignore: The names of the variables to ignore.\n\n        Returns:\n            The names of the variables that Lasso identified as impactful, optionally\n            limited to the top `n` variables by absolute coefficient.\n        \"\"\"\n\n        # TODO: do this properly wherever this is called\n        outcome_col = outcome_cols[0]\n\n        # Separate the target variable and predictor variables.\n        # Optionally, do not consider variables already in the graph.\n        y = data[outcome_cols]\n        drop_cols = [] if ignore is None else ignore\n        to_ignore = outcome_cols\n        drop_cols.extend(to_ignore)\n\n        # Do not consider variables with the same base variable as an ignored variable.\n        for v in to_ignore:\n            vp = PreparedVariableName(v)\n            if vp.base_var() != \"TemplateId\":\n                drop_cols.extend([c for c in data.columns if vp.base_var() in c])\n        drop_cols = list(set(drop_cols))\n\n        # Iterate until multiple prepared variables with the same base variable are eliminated.\n        done = False\n\n        while not done:\n            Printer.printv(f\"Variables that Lasso will ignore: {drop_cols}\")\n            X = data.drop(drop_cols, axis=1)\n            X_cols = X.columns\n            if X.empty:\n                return []\n\n            scaler = StandardScaler()\n            X = scaler.fit_transform(X)\n\n            # Fit a Lasso model to the data\n            lasso = Lasso(alpha=alpha, max_iter=max_iter)\n            lasso.fit(X, y)\n            Printer.printv(f\"Lasso coefficients : {lasso.coef_}\")\n            Printer.printv(f\"Scale: {scaler.scale_}\")\n            final_coefs = lasso.coef_ / scaler.scale_\n            abs_coefs = np.abs(final_coefs)\n            Printer.printv(f\"Lasso coefficients unscaled: {final_coefs}\")\n\n            # Mask for nonzero elements\n            nonzero_mask = final_coefs != 0\n\n            # Mask for top n largest elements by absolute value\n            # Create an array of False values with the same shape as the coefficients\n            top_n_mask = [False] * len(final_coefs)\n            for i in np.argsort(abs_coefs)[-top_n:]:\n                top_n_mask[i] = True\n\n            # Retrieve columns based on conditions above\n            selected_names = list(X_cols[nonzero_mask &amp; top_n_mask])\n\n            # Only keep one aggregate per variable\n            d = set()\n            done = True\n            for var in selected_names:\n                base_var = PreparedVariableName(var).base_var()\n                if base_var in d:\n                    drop_cols.append(var)\n                    done = False\n                else:\n                    d.add(base_var)\n\n        Printer.printv(\"Lasso identified the following impactful variables:\")\n        Printer.printv(selected_names)\n\n        return selected_names\n\n    @staticmethod\n    def prune_with_triangle(\n        data: pd.DataFrame,\n        vars: pd.DataFrame,\n        treatment_col: str,\n        outcome_col: str,\n        work_dir: str,\n        top_n: int = 0,\n        force: bool = False,\n    ) -&gt; list[str]:\n        \"\"\"\n        Prune variables using triangle method.\n\n        Parameters:\n            data: The dataframe containing the data.\n            vars: The dataframe containing the variables.\n            treatment_col: The name of the treatment variable.\n            outcome_col: The name of the outcome variable.\n            work_dir: The directory to store intermediate files in.\n            top_n: The number of variables to return. If 0, return all variables.\n            force: Whether to force recalculation of the triangle method.\n\n        Returns:\n            The names of the variables that triangle method identified as impactful, optionally\n            limited to the top `n` variables.\n        \"\"\"\n\n        # Check whether we can use pre-calculated results\n        filename = os.path.join(\n            work_dir, f\"pickles/triangle_dags/{treatment_col}_{outcome_col}.pkl\"\n        )\n        if os.path.isfile(filename) and not force:\n            df = pickle.load(open(filename, \"rb\"))\n            print(\"Found pickled file\")\n            return list(df.index[:top_n].values)\n\n        Printer.printv(\"Starting to prune using triangle method\")\n        max_diffs = {}\n        base_ate = ATECalculator.get_ate_and_confidence(\n            data, vars, treatment_col, outcome_col, calculate_std_error=False\n        )[\"ATE\"]\n\n        for var in tqdm(data.columns, \"Processing triangle dags\"):\n            if var == treatment_col or var == outcome_col:\n                continue\n\n            # Construct the graphs to consider\n            graphs = []\n            # Second cause\n            graphs.append(\n                nx.DiGraph([(treatment_col, outcome_col), (var, outcome_col)])\n            )\n            # Confounder\n            graphs.append(\n                nx.DiGraph(\n                    [\n                        (treatment_col, outcome_col),\n                        (var, treatment_col),\n                        (var, outcome_col),\n                    ]\n                )\n            )\n            # Mediator with direct path\n            graphs.append(\n                nx.DiGraph(\n                    [\n                        (treatment_col, outcome_col),\n                        (treatment_col, var),\n                        (var, outcome_col),\n                    ]\n                )\n            )\n            # Mediator without direct path\n            graphs.append(nx.DiGraph([(treatment_col, var), (var, outcome_col)]))\n\n            # Calculate the corrsponding ATEs\n            ates = [base_ate]\n            for G in graphs:\n                try:\n                    ates.append(\n                        ATECalculator.get_ate_and_confidence(\n                            data,\n                            vars,\n                            treatment_col,\n                            outcome_col,\n                            graph=G,\n                            calculate_std_error=False,\n                        )[\"ATE\"]\n                    )\n                except:\n                    pass\n            max_diffs[var] = max(ates) - min(ates)\n        max_diffs = max_diffs\n        df = pd.DataFrame.from_dict(max_diffs, orient=\"index\", columns=[\"max_diff\"])\n        df = df.sort_values(by=\"max_diff\", ascending=False)\n\n        Pickler.dump(df, filename)\n\n        return list(df.index[:top_n].values)\n</code></pre>"},{"location":"reference/logos/pruner/#logos.pruner.Pruner.LASSO_DEFAULT_MAX_ITER","title":"<code>LASSO_DEFAULT_MAX_ITER = 100000</code>  <code>class-attribute</code> <code>instance-attribute</code>","text":"<p>A collection of pruning functions for prepared variables, used for pruning and candidate suggestion.</p>"},{"location":"reference/logos/pruner/#logos.pruner.Pruner.prune_with_lasso","title":"<code>prune_with_lasso(data, outcome_cols, alpha=LASSO_DEFAULT_ALPHA, max_iter=LASSO_DEFAULT_MAX_ITER, top_n=0, ignore=None)</code>  <code>staticmethod</code>","text":"<p>Prune variables using Lasso regression.</p> <p>Parameters:</p> Name Type Description Default <code>data</code> <code>DataFrame</code> <p>The dataframe containing the data.</p> required <code>outcome_cols</code> <code>list[str]</code> <p>The names of the target variables.</p> required <code>alpha</code> <code>float</code> <p>The Lasso regularization parameter.</p> <code>LASSO_DEFAULT_ALPHA</code> <code>max_iter</code> <code>int</code> <p>The maximum number of iterations for Lasso.</p> <code>LASSO_DEFAULT_MAX_ITER</code> <code>top_n</code> <code>int</code> <p>The number of variables to return. If 0, return all variables.</p> <code>0</code> <code>ignore</code> <code>Optional[list[str]]</code> <p>The names of the variables to ignore.</p> <code>None</code> <p>Returns:</p> Type Description <code>list[str]</code> <p>The names of the variables that Lasso identified as impactful, optionally</p> <code>list[str]</code> <p>limited to the top <code>n</code> variables by absolute coefficient.</p> Source code in <code>src/logos/pruner.py</code> <pre><code>@staticmethod\ndef prune_with_lasso(\n    data: pd.DataFrame,\n    outcome_cols: list[str],\n    alpha: float = LASSO_DEFAULT_ALPHA,\n    max_iter: int = LASSO_DEFAULT_MAX_ITER,\n    top_n: int = 0,\n    ignore: Optional[list[str]] = None,\n) -&gt; list[str]:\n    \"\"\"\n    Prune variables using Lasso regression.\n\n    Parameters:\n        data: The dataframe containing the data.\n        outcome_cols: The names of the target variables.\n        alpha: The Lasso regularization parameter.\n        max_iter: The maximum number of iterations for Lasso.\n        top_n: The number of variables to return. If 0, return all variables.\n        ignore: The names of the variables to ignore.\n\n    Returns:\n        The names of the variables that Lasso identified as impactful, optionally\n        limited to the top `n` variables by absolute coefficient.\n    \"\"\"\n\n    # TODO: do this properly wherever this is called\n    outcome_col = outcome_cols[0]\n\n    # Separate the target variable and predictor variables.\n    # Optionally, do not consider variables already in the graph.\n    y = data[outcome_cols]\n    drop_cols = [] if ignore is None else ignore\n    to_ignore = outcome_cols\n    drop_cols.extend(to_ignore)\n\n    # Do not consider variables with the same base variable as an ignored variable.\n    for v in to_ignore:\n        vp = PreparedVariableName(v)\n        if vp.base_var() != \"TemplateId\":\n            drop_cols.extend([c for c in data.columns if vp.base_var() in c])\n    drop_cols = list(set(drop_cols))\n\n    # Iterate until multiple prepared variables with the same base variable are eliminated.\n    done = False\n\n    while not done:\n        Printer.printv(f\"Variables that Lasso will ignore: {drop_cols}\")\n        X = data.drop(drop_cols, axis=1)\n        X_cols = X.columns\n        if X.empty:\n            return []\n\n        scaler = StandardScaler()\n        X = scaler.fit_transform(X)\n\n        # Fit a Lasso model to the data\n        lasso = Lasso(alpha=alpha, max_iter=max_iter)\n        lasso.fit(X, y)\n        Printer.printv(f\"Lasso coefficients : {lasso.coef_}\")\n        Printer.printv(f\"Scale: {scaler.scale_}\")\n        final_coefs = lasso.coef_ / scaler.scale_\n        abs_coefs = np.abs(final_coefs)\n        Printer.printv(f\"Lasso coefficients unscaled: {final_coefs}\")\n\n        # Mask for nonzero elements\n        nonzero_mask = final_coefs != 0\n\n        # Mask for top n largest elements by absolute value\n        # Create an array of False values with the same shape as the coefficients\n        top_n_mask = [False] * len(final_coefs)\n        for i in np.argsort(abs_coefs)[-top_n:]:\n            top_n_mask[i] = True\n\n        # Retrieve columns based on conditions above\n        selected_names = list(X_cols[nonzero_mask &amp; top_n_mask])\n\n        # Only keep one aggregate per variable\n        d = set()\n        done = True\n        for var in selected_names:\n            base_var = PreparedVariableName(var).base_var()\n            if base_var in d:\n                drop_cols.append(var)\n                done = False\n            else:\n                d.add(base_var)\n\n    Printer.printv(\"Lasso identified the following impactful variables:\")\n    Printer.printv(selected_names)\n\n    return selected_names\n</code></pre>"},{"location":"reference/logos/pruner/#logos.pruner.Pruner.prune_with_triangle","title":"<code>prune_with_triangle(data, vars, treatment_col, outcome_col, work_dir, top_n=0, force=False)</code>  <code>staticmethod</code>","text":"<p>Prune variables using triangle method.</p> <p>Parameters:</p> Name Type Description Default <code>data</code> <code>DataFrame</code> <p>The dataframe containing the data.</p> required <code>vars</code> <code>DataFrame</code> <p>The dataframe containing the variables.</p> required <code>treatment_col</code> <code>str</code> <p>The name of the treatment variable.</p> required <code>outcome_col</code> <code>str</code> <p>The name of the outcome variable.</p> required <code>work_dir</code> <code>str</code> <p>The directory to store intermediate files in.</p> required <code>top_n</code> <code>int</code> <p>The number of variables to return. If 0, return all variables.</p> <code>0</code> <code>force</code> <code>bool</code> <p>Whether to force recalculation of the triangle method.</p> <code>False</code> <p>Returns:</p> Type Description <code>list[str]</code> <p>The names of the variables that triangle method identified as impactful, optionally</p> <code>list[str]</code> <p>limited to the top <code>n</code> variables.</p> Source code in <code>src/logos/pruner.py</code> <pre><code>@staticmethod\ndef prune_with_triangle(\n    data: pd.DataFrame,\n    vars: pd.DataFrame,\n    treatment_col: str,\n    outcome_col: str,\n    work_dir: str,\n    top_n: int = 0,\n    force: bool = False,\n) -&gt; list[str]:\n    \"\"\"\n    Prune variables using triangle method.\n\n    Parameters:\n        data: The dataframe containing the data.\n        vars: The dataframe containing the variables.\n        treatment_col: The name of the treatment variable.\n        outcome_col: The name of the outcome variable.\n        work_dir: The directory to store intermediate files in.\n        top_n: The number of variables to return. If 0, return all variables.\n        force: Whether to force recalculation of the triangle method.\n\n    Returns:\n        The names of the variables that triangle method identified as impactful, optionally\n        limited to the top `n` variables.\n    \"\"\"\n\n    # Check whether we can use pre-calculated results\n    filename = os.path.join(\n        work_dir, f\"pickles/triangle_dags/{treatment_col}_{outcome_col}.pkl\"\n    )\n    if os.path.isfile(filename) and not force:\n        df = pickle.load(open(filename, \"rb\"))\n        print(\"Found pickled file\")\n        return list(df.index[:top_n].values)\n\n    Printer.printv(\"Starting to prune using triangle method\")\n    max_diffs = {}\n    base_ate = ATECalculator.get_ate_and_confidence(\n        data, vars, treatment_col, outcome_col, calculate_std_error=False\n    )[\"ATE\"]\n\n    for var in tqdm(data.columns, \"Processing triangle dags\"):\n        if var == treatment_col or var == outcome_col:\n            continue\n\n        # Construct the graphs to consider\n        graphs = []\n        # Second cause\n        graphs.append(\n            nx.DiGraph([(treatment_col, outcome_col), (var, outcome_col)])\n        )\n        # Confounder\n        graphs.append(\n            nx.DiGraph(\n                [\n                    (treatment_col, outcome_col),\n                    (var, treatment_col),\n                    (var, outcome_col),\n                ]\n            )\n        )\n        # Mediator with direct path\n        graphs.append(\n            nx.DiGraph(\n                [\n                    (treatment_col, outcome_col),\n                    (treatment_col, var),\n                    (var, outcome_col),\n                ]\n            )\n        )\n        # Mediator without direct path\n        graphs.append(nx.DiGraph([(treatment_col, var), (var, outcome_col)]))\n\n        # Calculate the corrsponding ATEs\n        ates = [base_ate]\n        for G in graphs:\n            try:\n                ates.append(\n                    ATECalculator.get_ate_and_confidence(\n                        data,\n                        vars,\n                        treatment_col,\n                        outcome_col,\n                        graph=G,\n                        calculate_std_error=False,\n                    )[\"ATE\"]\n                )\n            except:\n                pass\n        max_diffs[var] = max(ates) - min(ates)\n    max_diffs = max_diffs\n    df = pd.DataFrame.from_dict(max_diffs, orient=\"index\", columns=[\"max_diff\"])\n    df = df.sort_values(by=\"max_diff\", ascending=False)\n\n    Pickler.dump(df, filename)\n\n    return list(df.index[:top_n].values)\n</code></pre>"},{"location":"reference/logos/regression/","title":"Regression","text":""},{"location":"reference/logos/regression/#logos.regression.Regression","title":"<code>Regression</code>","text":"<p>A collection of regression-related functions.</p> Source code in <code>src/logos/regression.py</code> <pre><code>class Regression:\n    \"\"\"\n    A collection of regression-related functions.\n    \"\"\"\n\n    @staticmethod\n    def ols(X_name: str, X_data: pd.Series, Y_data: pd.Series) -&gt; dict:\n        \"\"\"\n        Calculate the slope and p-value of a linear regression of `X` on `Y`.\n\n        Parameters:\n            X_name: The name of the predictor variable.\n            X_data: The data for the predictor variable.\n            Y_data: The data for the target variable.\n\n        Returns:\n            A dictionary containing the slope and p-value of the regression. If\n            there is no slope parameter because X_data does not vary enough,\n            the slope and p-value will be None.\n        \"\"\"\n        X_data = sm.add_constant(X_data)\n        model = sm.OLS(Y_data, X_data).fit()\n        slope = None\n        p_value = None\n        if len(model.params) &gt; 1:\n            slope = model.params.iloc[1]\n            p_value = model.pvalues.iloc[1]\n        return {\n            \"Candidate\": X_name,\n            \"Slope\": slope,\n            \"P-value\": p_value,\n        }\n\n    @staticmethod\n    def get_normalized_copy(data: pd.DataFrame) -&gt; tuple[pd.DataFrame, pd.Series]:\n        \"\"\"\n        Return a normalized copy of the input data, with zero mean\n        and unit variance.\n\n        Parameters:\n            data: The data to normalize.\n\n        Returns:\n            A normalized copy of the input data.\n            The original standard deviations of the columns of the input data.\n        \"\"\"\n        data = data.copy(deep=True)\n        stdevs = data.std()\n\n        for column in data.columns:\n            if stdevs[column] == 0:\n                data.loc[:, column] = 0\n            else:\n                data.loc[:, column] = (data[column] - data[column].mean()) / stdevs[\n                    column\n                ]\n        return data, stdevs\n\n    @staticmethod\n    def multi_ols(\n        X_names: list[str], X_data: pd.DataFrame, Y_data: pd.Series\n    ) -&gt; pd.DataFrame:\n        \"\"\"\n        Calculate the slopes and p-values of a multivariate linear regression\n        of the variables in `X` on `Y`. Normalize each column to zero mean and\n        unit variance before running the regression. Return both the normalized\n        and unnormalized slopes.\n\n        Parameters:\n            X_names: The names of the predictor variables.\n            X_data: The data for the predictor variables.\n            Y_data: The data for the target variable.\n\n        Returns:\n            A dataframe with the names, slopes, and p-values of the regressions.\n        \"\"\"\n        X_data, stdevs = Regression.get_normalized_copy(X_data)\n\n        X_data = sm.add_constant(X_data)\n        model = sm.OLS(Y_data, X_data).fit()\n\n        # Get the coefficients and p-values, ignoring the constant\n        coefficients = model.params.iloc[1:]\n        p_values = model.pvalues.iloc[1:]\n\n        # Unnormalize the slopes\n        coefficients_unnormalized = coefficients.copy()\n        for coeff in coefficients_unnormalized.index:\n            coefficients_unnormalized[coeff] = (\n                coefficients[coeff] / stdevs[coeff] if stdevs[coeff] != 0 else 0\n            )\n\n        return pd.DataFrame(\n            {\n                \"Candidate\": coefficients.index,\n                \"Slope\": coefficients_unnormalized.values,\n                \"P-value\": p_values.values,\n                \"Normalized Slope\": coefficients.values,\n                \"Absolute Normalized Slope\": coefficients.abs().values,\n            }\n        )\n</code></pre>"},{"location":"reference/logos/regression/#logos.regression.Regression.ols","title":"<code>ols(X_name, X_data, Y_data)</code>  <code>staticmethod</code>","text":"<p>Calculate the slope and p-value of a linear regression of <code>X</code> on <code>Y</code>.</p> <p>Parameters:</p> Name Type Description Default <code>X_name</code> <code>str</code> <p>The name of the predictor variable.</p> required <code>X_data</code> <code>Series</code> <p>The data for the predictor variable.</p> required <code>Y_data</code> <code>Series</code> <p>The data for the target variable.</p> required <p>Returns:</p> Type Description <code>dict</code> <p>A dictionary containing the slope and p-value of the regression. If</p> <code>dict</code> <p>there is no slope parameter because X_data does not vary enough,</p> <code>dict</code> <p>the slope and p-value will be None.</p> Source code in <code>src/logos/regression.py</code> <pre><code>@staticmethod\ndef ols(X_name: str, X_data: pd.Series, Y_data: pd.Series) -&gt; dict:\n    \"\"\"\n    Calculate the slope and p-value of a linear regression of `X` on `Y`.\n\n    Parameters:\n        X_name: The name of the predictor variable.\n        X_data: The data for the predictor variable.\n        Y_data: The data for the target variable.\n\n    Returns:\n        A dictionary containing the slope and p-value of the regression. If\n        there is no slope parameter because X_data does not vary enough,\n        the slope and p-value will be None.\n    \"\"\"\n    X_data = sm.add_constant(X_data)\n    model = sm.OLS(Y_data, X_data).fit()\n    slope = None\n    p_value = None\n    if len(model.params) &gt; 1:\n        slope = model.params.iloc[1]\n        p_value = model.pvalues.iloc[1]\n    return {\n        \"Candidate\": X_name,\n        \"Slope\": slope,\n        \"P-value\": p_value,\n    }\n</code></pre>"},{"location":"reference/logos/regression/#logos.regression.Regression.get_normalized_copy","title":"<code>get_normalized_copy(data)</code>  <code>staticmethod</code>","text":"<p>Return a normalized copy of the input data, with zero mean and unit variance.</p> <p>Parameters:</p> Name Type Description Default <code>data</code> <code>DataFrame</code> <p>The data to normalize.</p> required <p>Returns:</p> Type Description <code>DataFrame</code> <p>A normalized copy of the input data.</p> <code>Series</code> <p>The original standard deviations of the columns of the input data.</p> Source code in <code>src/logos/regression.py</code> <pre><code>@staticmethod\ndef get_normalized_copy(data: pd.DataFrame) -&gt; tuple[pd.DataFrame, pd.Series]:\n    \"\"\"\n    Return a normalized copy of the input data, with zero mean\n    and unit variance.\n\n    Parameters:\n        data: The data to normalize.\n\n    Returns:\n        A normalized copy of the input data.\n        The original standard deviations of the columns of the input data.\n    \"\"\"\n    data = data.copy(deep=True)\n    stdevs = data.std()\n\n    for column in data.columns:\n        if stdevs[column] == 0:\n            data.loc[:, column] = 0\n        else:\n            data.loc[:, column] = (data[column] - data[column].mean()) / stdevs[\n                column\n            ]\n    return data, stdevs\n</code></pre>"},{"location":"reference/logos/regression/#logos.regression.Regression.multi_ols","title":"<code>multi_ols(X_names, X_data, Y_data)</code>  <code>staticmethod</code>","text":"<p>Calculate the slopes and p-values of a multivariate linear regression of the variables in <code>X</code> on <code>Y</code>. Normalize each column to zero mean and unit variance before running the regression. Return both the normalized and unnormalized slopes.</p> <p>Parameters:</p> Name Type Description Default <code>X_names</code> <code>list[str]</code> <p>The names of the predictor variables.</p> required <code>X_data</code> <code>DataFrame</code> <p>The data for the predictor variables.</p> required <code>Y_data</code> <code>Series</code> <p>The data for the target variable.</p> required <p>Returns:</p> Type Description <code>DataFrame</code> <p>A dataframe with the names, slopes, and p-values of the regressions.</p> Source code in <code>src/logos/regression.py</code> <pre><code>@staticmethod\ndef multi_ols(\n    X_names: list[str], X_data: pd.DataFrame, Y_data: pd.Series\n) -&gt; pd.DataFrame:\n    \"\"\"\n    Calculate the slopes and p-values of a multivariate linear regression\n    of the variables in `X` on `Y`. Normalize each column to zero mean and\n    unit variance before running the regression. Return both the normalized\n    and unnormalized slopes.\n\n    Parameters:\n        X_names: The names of the predictor variables.\n        X_data: The data for the predictor variables.\n        Y_data: The data for the target variable.\n\n    Returns:\n        A dataframe with the names, slopes, and p-values of the regressions.\n    \"\"\"\n    X_data, stdevs = Regression.get_normalized_copy(X_data)\n\n    X_data = sm.add_constant(X_data)\n    model = sm.OLS(Y_data, X_data).fit()\n\n    # Get the coefficients and p-values, ignoring the constant\n    coefficients = model.params.iloc[1:]\n    p_values = model.pvalues.iloc[1:]\n\n    # Unnormalize the slopes\n    coefficients_unnormalized = coefficients.copy()\n    for coeff in coefficients_unnormalized.index:\n        coefficients_unnormalized[coeff] = (\n            coefficients[coeff] / stdevs[coeff] if stdevs[coeff] != 0 else 0\n        )\n\n    return pd.DataFrame(\n        {\n            \"Candidate\": coefficients.index,\n            \"Slope\": coefficients_unnormalized.values,\n            \"P-value\": p_values.values,\n            \"Normalized Slope\": coefficients.values,\n            \"Absolute Normalized Slope\": coefficients.abs().values,\n        }\n    )\n</code></pre>"},{"location":"reference/logos/tag_utils/","title":"TagUtils","text":""},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagOrigin","title":"<code>TagOrigin</code>","text":"<p>               Bases: <code>IntEnum</code></p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>class TagOrigin(IntEnum):\n    PRECEDING: int = 0\n    \"\"\"Indicates that the tag was derived from the preceding tokens in the corresponding template.\"\"\"\n\n    GPT_3POINT5_TURBO: int = 1\n    \"\"\"Indicates that the tag was derived using gpt-3.5-turbo.\"\"\"\n\n    GPT_4: int = 2\n    \"\"\"Indicates that the tag was derived using gpt-4.\"\"\"\n\n    NAME: int = 3\n    \"\"\"Indicates that the tag was derived from the name of the variable.\"\"\"\n\n    REGEX_VARIABLE: int = 4\n    \"\"\"Indicates that the tag was derived from the name of the variable because the name was given by the user.\"\"\"\n</code></pre>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagOrigin.PRECEDING","title":"<code>PRECEDING: int = 0</code>  <code>class-attribute</code> <code>instance-attribute</code>","text":"<p>Indicates that the tag was derived from the preceding tokens in the corresponding template.</p>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagOrigin.GPT_3POINT5_TURBO","title":"<code>GPT_3POINT5_TURBO: int = 1</code>  <code>class-attribute</code> <code>instance-attribute</code>","text":"<p>Indicates that the tag was derived using gpt-3.5-turbo.</p>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagOrigin.GPT_4","title":"<code>GPT_4: int = 2</code>  <code>class-attribute</code> <code>instance-attribute</code>","text":"<p>Indicates that the tag was derived using gpt-4.</p>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagOrigin.NAME","title":"<code>NAME: int = 3</code>  <code>class-attribute</code> <code>instance-attribute</code>","text":"<p>Indicates that the tag was derived from the name of the variable.</p>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagOrigin.REGEX_VARIABLE","title":"<code>REGEX_VARIABLE: int = 4</code>  <code>class-attribute</code> <code>instance-attribute</code>","text":"<p>Indicates that the tag was derived from the name of the variable because the name was given by the user.</p>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagUtils","title":"<code>TagUtils</code>","text":"<p>A class for managing tags of parsed and prepared variables.</p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>class TagUtils:\n    \"\"\"\n    A class for managing tags of parsed and prepared variables.\n    \"\"\"\n\n    @staticmethod\n    def check_columns(df: pd.DataFrame, columns: list) -&gt; None:\n        \"\"\"\n        Check that the specified columns exist in the dataframe.\n\n        Parameters:\n            df: The dataframe to be checked.\n            columns: The columns to be checked.\n\n        Raises:\n            ValueError: If any of the columns are not present in the dataframe.\n        \"\"\"\n        if not set(columns).issubset(set(df.columns)):\n            raise ValueError(f\"Columns {columns} are not all present in the dataframe.\")\n\n    @staticmethod\n    def check_fields(series: pd.Series, fields: list) -&gt; None:\n        \"\"\"\n        Check that the specified fields exist in the specified series.\n\n        Parameters:\n            series: The series to be checked.\n            fields: The fields to be checked.\n\n        Raises:\n            ValueError: If any of the fields are not present in the series.\n        \"\"\"\n        if not set(fields).issubset(set(series.index)):\n            raise ValueError(f\"Fields {fields} are not all present in the series.\")\n\n    @staticmethod\n    def best_effort_tag(\n        templates_df: pd.DataFrame,\n        variable_row: pd.Series,\n        enable_gpt_tagging: bool,\n        gpt_model: str,\n    ) -&gt; tuple[str, bool]:\n        \"\"\"\n        Apply `gpt_tag` to `variable_row`, if possible, and return the result. If there is\n        no environment variable called OPENAI_API_KEY, or if `enable_gpt_tagging` is False,\n        apply `preceding_tokens_tag` instead.\n\n        Parameters:\n            templates_df: The dataframe containing information about the log templates.\n            variable_row: The row of the dataframe containing information about the parsed variable.\n            enable_gpt_tagging: A boolean indicating whether GPT-3.5 tagging should be enabled.\n            gpt_model: The GPT model to use.\n\n        Returns:\n            A tuple containing (i) the GPT-3.5 tag for the parsed variable name, if possible, or the\n            best-effort tag otherwise, and (ii) a boolean indicating whether the GPT-3.5 tag was used.\n        \"\"\"\n        if enable_gpt_tagging:\n            try:\n                return (TagUtils.gpt_tag(templates_df, variable_row, gpt_model), True)\n            except:\n                return (TagUtils.preceding_tokens_tag(variable_row), False)\n        else:\n            return (TagUtils.preceding_tokens_tag(variable_row), False)\n\n    @staticmethod\n    def waterfall_tag(\n        templates_df: pd.DataFrame,\n        variable_row: pd.Series,\n        banned_values: Optional[list[str]] = None,\n    ) -&gt; tuple[str, TagOrigin]:\n        \"\"\"\n        Apply each of the tagging methods in turn, in order of increasing cost, until a tag is found\n        that is not included in the banned values. In partidular, apply `preceding_tokens_tag` first,\n        then `gpt_tag` with the GPT-3.5 model, and finally `gpt_tag` with the GPT-4 model. If none of\n        these methods succeeds, return the name of the variable as the tag.\n\n        Parameters:\n            templates_df: The dataframe containing information about the log templates.\n            variable_row: The row of the dataframe containing information about the parsed variable.\n            banned_values: A list of values that should not be used as tags.\n\n        Returns:\n            A tuple containing (i) the tag for the parsed variable, and (ii) the origin of the tag.\n        \"\"\"\n        name = variable_row[\"Name\"]\n        if variable_row[\"From regex\"]:\n            return (name, TagOrigin.REGEX_VARIABLE)\n\n        # Try to derive a tag from the preceding tokens in the corresponding template\n        tag, origin = TagUtils.preceding_tokens_tag(variable_row, banned_values)\n        if tag != name:\n            return (tag, origin)\n\n        # Try to derive a tag using GPT-3.5\n        try:\n            tag = TagUtils.gpt_tag(\n                templates_df, variable_row, \"gpt-3.5-turbo\", banned_values\n            )\n            if tag != name:\n                return (tag, TagOrigin.GPT_3POINT5_TURBO)\n        except Exception as e:\n            print(f\"Exception {e} came up while tagging {name} with GPT-3.5.\")\n            pass\n\n        # Try to derive a tag using GPT-4\n        try:\n            tag = TagUtils.gpt_tag(templates_df, variable_row, \"gpt-4\", banned_values)\n            if tag != name:\n                return (tag, TagOrigin.GPT_4)\n        except Exception as e:\n            print(f\"Exception {e} came up while tagging {name} with GPT-4.\")\n            pass\n\n        return (name, TagOrigin.NAME)\n\n    @staticmethod\n    def preceding_tokens_tag(\n        variable_row: pd.Series, banned_values: Optional[list[str]] = None\n    ) -&gt; tuple[str, TagOrigin]:\n        \"\"\"\n        Try to derive a tag for a parsed variable name based on the preceding tokens in the corresponding template.\n\n        Parameters:\n            variable_row: The row of the dataframe containing information about the parsed variable.\n            banned_values: A list of values that should not be used as tags.\n\n        Returns:\n            A tuple containing (i) the tag for the parsed variable, and (ii) the origin of the tag.\n        \"\"\"\n\n        TagUtils.check_fields(variable_row, [\"Preceding 3 tokens\", \"Name\", \"From regex\"])\n        name = variable_row[\"Name\"]\n        if variable_row[\"From regex\"]:\n            return name, TagOrigin.REGEX_VARIABLE\n\n        pr = variable_row[\"Preceding 3 tokens\"]\n        tag = name\n        origin = TagOrigin.NAME\n        if len(pr) &gt;= 2 and (pr[-1] in \":=\") and (pr[-2][0] != \"&lt;\"):\n            tag = pr[-2]\n            origin = TagOrigin.PRECEDING\n        elif (\n            len(pr) == 3\n            and (pr[2] in \"\"\"\"'\"\"\")\n            and (pr[1] in \":=\")\n            and (pr[0][0] != \"&lt;\")\n        ):\n            tag = pr[0]\n            origin = TagOrigin.PRECEDING\n\n        # Double-check that the tag is not in the banned values\n        if banned_values is not None and tag in banned_values:\n            return name, TagOrigin.NAME\n\n        return tag, origin\n\n    @staticmethod\n    def gpt_tag(\n        templates_df: pd.DataFrame,\n        variable_row: pd.Series,\n        model: str = \"gpt-3.5-turbo\",\n        banned_values: Optional[list[str]] = None,\n    ) -&gt; str:\n        \"\"\"\n        Use GPT to derive a tag the variable described in `variable_row`,\n        using information about the corresponding log template, retrieved from `templates_df`.\n\n        Parameters:\n            templates_df: The dataframe containing information about the log templates.\n            variable_row: The row of the dataframe containing information about the parsed variable.\n            model: The GPT model to use.\n            banned_values: A list of values that should not be used as tags.\n\n        Returns:\n            The GPT-generated tag for the parsed variable name.\n        \"\"\"\n\n        TagUtils.check_fields(variable_row, [\"Name\", \"Examples\"])\n        TagUtils.check_columns(templates_df, [\"TemplateId\", \"TemplateExample\"])\n\n        template_id = ParsedVariableName(variable_row[\"Name\"]).template_id()\n        idx = ParsedVariableName(variable_row[\"Name\"]).index()\n\n        line = templates_df[templates_df[\"TemplateId\"] == template_id][\n            \"TemplateExample\"\n        ].values[0]\n        line_toks = line.split()\n\n        # Define the messages to send to the model\n        messages = [\n            {\n                \"role\": \"system\",\n                \"content\": \"You are a backend engineer that knows all about the logging infrastructure of a distributed system.\",\n            },\n            {\n                \"role\": \"user\",\n                \"content\": f\"\"\"Generate a tag for the variable that takes the value {line_toks[idx]} \"\"\"\n                f\"\"\"in the following log line:\\n {line}\\n\"\"\"\n                f\"\"\"Here are the 3 tokens that precede the variable: [{', '.join(line_toks[max(idx-3, 0):idx])} ]\\n\"\"\"\n                f\"\"\"Here are some more example values for this variable: [{', '.join(variable_row['Examples'])} ]\\n\"\"\"\n                #f\"\"\"Make sure the tag matches none of the following values: [{', '.join(banned_values) if banned_values is not None else ''} ]\\n\"\"\"\n                \"\"\"Return only the tag as a single word, possibly including underscores. DO NOT EVER REPLY WITH MORE THAN ONE WORD.\\n\"\"\",\n            },\n        ]\n\n        client = OpenAI()\n\n        tag = (\n            client.chat.completions.create(model=model, messages=messages)\n            .choices[0]\n            .message.content\n        )\n        tag_length = len(tag.split())\n        if tag_length &gt; 1:\n            # GPT didn't listen to us and returned a phrase describing the tag.\n            # Extract the word between the second-last and last occurrence of double quotes.\n            tag = tag.split('\"')[-2]\n\n\n        with open(\"gpt_log.txt\", \"a+\") as f:\n            f.write('----------------------------------\\n')\n            f.write(f\"Variable name: {variable_row['Name']}\\n\\n\")\n            f.write(f\"Model used: {model}\\n\\n\")\n            f.write(f\"Messages sent to the model:\\n{messages}\\n\\n\")\n            f.write(f\"Tag generated by the model:\\n{tag}\\n\\n\")\n            f.flush()\n\n        # Double-check that the tag is not in the banned values\n        if banned_values is not None and tag in banned_values:\n            with open(\"gpt_log.txt\", \"a+\") as f:\n                f.write('That tag is banned, returning name.\\n')\n            return variable_row[\"Name\"]\n\n        return tag\n\n    @staticmethod\n    def deduplicate_tags(df: pd.DataFrame) -&gt; pd.DataFrame:\n        \"\"\"\n        Ensure that the tags in df are unique, by making the tag column of any row\n        with a seen-before tag equal to the name column of that row.\n\n        Parameters:\n            df: The dataframe to be deduplicated.\n\n        Returns:\n            The deduplicated dataframe.\n        \"\"\"\n\n        TagUtils.check_columns(df, [\"Name\", \"Tag\", \"TagOrigin\"])\n        seen_tags = set()\n        for i, row in df.iterrows():\n            if row[\"Tag\"] in seen_tags:\n                df.loc[i, \"Tag\"] = row[\"Name\"]\n                df.loc[i, \"TagOrigin\"] = TagOrigin.NAME\n            else:\n                seen_tags.add(row[\"Tag\"])\n\n    @staticmethod\n    def set_tag(df: pd.DataFrame, name: str, tag: str, info: str = \"\") -&gt; None:\n        \"\"\"\n        Tag a parsed or prepared variable for easier access.\n\n        Parameters:\n            df: The dataframe containing the parsed or prepared variables.\n            name: The name of the parsed or prepared variable.\n            tag: The tag to be set.\n            info: A string describing the type of variable being tagged (parsed or prepared).\n\n        Raises:\n            ValueError: If the name is not the name of a parsed or prepared variable.\n        \"\"\"\n        TagUtils.check_columns(df, [\"Name\", \"Tag\"])\n        if name in df[\"Name\"].values:\n            df.loc[df[\"Name\"] == name, \"Tag\"] = tag\n            print(f\"Variable {name} tagged as {tag}\")\n        else:\n            raise ValueError(f\"{name} is not the name of a {info} variable.\")\n\n    @staticmethod\n    def get_tag(df: pd.DataFrame, name: str, info: str = \"\") -&gt; str:\n        \"\"\"\n        Retrieve the tag of a parsed or prepared variable.\n\n        Parameters:\n            df: The dataframe containing the parsed or prepared variables.\n            name: The name of the parsed or prepared variable.\n            info: A string describing the type of variable being tagged (parsed or prepared).\n\n        Raises:\n            ValueError: If the name is not the name of a parsed or prepared variable.\n        \"\"\"\n\n        TagUtils.check_columns(df, [\"Name\", \"Tag\"])\n        if name in df[\"Name\"].values:\n            return df.loc[df[\"Name\"] == name, \"Tag\"].values[0]\n        else:\n            raise ValueError(f\"{name} is not the name of a {info} variable.\")\n\n    @staticmethod\n    def name_of(df: pd.DataFrame, name_or_tag: str, info: str = \"\") -&gt; str:\n        \"\"\"\n        Determine the name of a parsed or prepared variable, given either itself or its tag.\n\n        Parameters:\n            df: The dataframe containing the parsed or prepared variables.\n            name_or_tag: The name or tag of the parsed or prepared variable.\n            info: A string describing the type of variable in question (parsed or prepared).\n\n        Returns:\n            The name of the parsed or prepared variable.\n        \"\"\"\n\n        TagUtils.check_columns(df, [\"Name\", \"Tag\"])\n        name_or_tag = name_or_tag.strip()\n        if name_or_tag in df[\"Name\"].values:\n            return name_or_tag\n        elif name_or_tag in df[\"Tag\"].values:\n            return df.loc[df[\"Tag\"] == name_or_tag, \"Name\"].values[0]\n        else:\n            raise ValueError(\n                f\"{name_or_tag} is not the name or tag of a {info} variable.\"\n            )\n\n    @staticmethod\n    def tag_of(df: pd.DataFrame, name_or_tag: Optional[str], info: str = \"\") -&gt; Optional[str]:\n        \"\"\"\n        Determine the tag of a parsed or prepared variable, given either itself or its name.\n        Retuirn None if the variable is None.\n\n        Parameters:\n            df: The dataframe containing the parsed or prepared variables.\n            name_or_tag: The name or tag of the parsed or prepared variable.\n            info: A string describing the type of variable in question (parsed or prepared).\n\n        Returns:\n            The tag of the parsed or prepared variable.\n        \"\"\"\n\n        if name_or_tag is None:\n            return None\n\n        TagUtils.check_columns(df, [\"Name\", \"Tag\"])\n        name_or_tag = name_or_tag.strip()\n        if name_or_tag in df[\"Tag\"].values:\n            return name_or_tag\n        elif name_or_tag in df[\"Name\"].values:\n            return df.loc[df[\"Name\"] == name_or_tag, \"Tag\"].values[0]\n        else:\n            raise ValueError(\n                f\"{name_or_tag} is not the name or tag of a {info} variable.\"\n            )\n</code></pre>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagUtils.check_columns","title":"<code>check_columns(df, columns)</code>  <code>staticmethod</code>","text":"<p>Check that the specified columns exist in the dataframe.</p> <p>Parameters:</p> Name Type Description Default <code>df</code> <code>DataFrame</code> <p>The dataframe to be checked.</p> required <code>columns</code> <code>list</code> <p>The columns to be checked.</p> required <p>Raises:</p> Type Description <code>ValueError</code> <p>If any of the columns are not present in the dataframe.</p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>@staticmethod\ndef check_columns(df: pd.DataFrame, columns: list) -&gt; None:\n    \"\"\"\n    Check that the specified columns exist in the dataframe.\n\n    Parameters:\n        df: The dataframe to be checked.\n        columns: The columns to be checked.\n\n    Raises:\n        ValueError: If any of the columns are not present in the dataframe.\n    \"\"\"\n    if not set(columns).issubset(set(df.columns)):\n        raise ValueError(f\"Columns {columns} are not all present in the dataframe.\")\n</code></pre>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagUtils.check_fields","title":"<code>check_fields(series, fields)</code>  <code>staticmethod</code>","text":"<p>Check that the specified fields exist in the specified series.</p> <p>Parameters:</p> Name Type Description Default <code>series</code> <code>Series</code> <p>The series to be checked.</p> required <code>fields</code> <code>list</code> <p>The fields to be checked.</p> required <p>Raises:</p> Type Description <code>ValueError</code> <p>If any of the fields are not present in the series.</p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>@staticmethod\ndef check_fields(series: pd.Series, fields: list) -&gt; None:\n    \"\"\"\n    Check that the specified fields exist in the specified series.\n\n    Parameters:\n        series: The series to be checked.\n        fields: The fields to be checked.\n\n    Raises:\n        ValueError: If any of the fields are not present in the series.\n    \"\"\"\n    if not set(fields).issubset(set(series.index)):\n        raise ValueError(f\"Fields {fields} are not all present in the series.\")\n</code></pre>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagUtils.best_effort_tag","title":"<code>best_effort_tag(templates_df, variable_row, enable_gpt_tagging, gpt_model)</code>  <code>staticmethod</code>","text":"<p>Apply <code>gpt_tag</code> to <code>variable_row</code>, if possible, and return the result. If there is no environment variable called OPENAI_API_KEY, or if <code>enable_gpt_tagging</code> is False, apply <code>preceding_tokens_tag</code> instead.</p> <p>Parameters:</p> Name Type Description Default <code>templates_df</code> <code>DataFrame</code> <p>The dataframe containing information about the log templates.</p> required <code>variable_row</code> <code>Series</code> <p>The row of the dataframe containing information about the parsed variable.</p> required <code>enable_gpt_tagging</code> <code>bool</code> <p>A boolean indicating whether GPT-3.5 tagging should be enabled.</p> required <code>gpt_model</code> <code>str</code> <p>The GPT model to use.</p> required <p>Returns:</p> Type Description <code>str</code> <p>A tuple containing (i) the GPT-3.5 tag for the parsed variable name, if possible, or the</p> <code>bool</code> <p>best-effort tag otherwise, and (ii) a boolean indicating whether the GPT-3.5 tag was used.</p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>@staticmethod\ndef best_effort_tag(\n    templates_df: pd.DataFrame,\n    variable_row: pd.Series,\n    enable_gpt_tagging: bool,\n    gpt_model: str,\n) -&gt; tuple[str, bool]:\n    \"\"\"\n    Apply `gpt_tag` to `variable_row`, if possible, and return the result. If there is\n    no environment variable called OPENAI_API_KEY, or if `enable_gpt_tagging` is False,\n    apply `preceding_tokens_tag` instead.\n\n    Parameters:\n        templates_df: The dataframe containing information about the log templates.\n        variable_row: The row of the dataframe containing information about the parsed variable.\n        enable_gpt_tagging: A boolean indicating whether GPT-3.5 tagging should be enabled.\n        gpt_model: The GPT model to use.\n\n    Returns:\n        A tuple containing (i) the GPT-3.5 tag for the parsed variable name, if possible, or the\n        best-effort tag otherwise, and (ii) a boolean indicating whether the GPT-3.5 tag was used.\n    \"\"\"\n    if enable_gpt_tagging:\n        try:\n            return (TagUtils.gpt_tag(templates_df, variable_row, gpt_model), True)\n        except:\n            return (TagUtils.preceding_tokens_tag(variable_row), False)\n    else:\n        return (TagUtils.preceding_tokens_tag(variable_row), False)\n</code></pre>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagUtils.waterfall_tag","title":"<code>waterfall_tag(templates_df, variable_row, banned_values=None)</code>  <code>staticmethod</code>","text":"<p>Apply each of the tagging methods in turn, in order of increasing cost, until a tag is found that is not included in the banned values. In partidular, apply <code>preceding_tokens_tag</code> first, then <code>gpt_tag</code> with the GPT-3.5 model, and finally <code>gpt_tag</code> with the GPT-4 model. If none of these methods succeeds, return the name of the variable as the tag.</p> <p>Parameters:</p> Name Type Description Default <code>templates_df</code> <code>DataFrame</code> <p>The dataframe containing information about the log templates.</p> required <code>variable_row</code> <code>Series</code> <p>The row of the dataframe containing information about the parsed variable.</p> required <code>banned_values</code> <code>Optional[list[str]]</code> <p>A list of values that should not be used as tags.</p> <code>None</code> <p>Returns:</p> Type Description <code>tuple[str, TagOrigin]</code> <p>A tuple containing (i) the tag for the parsed variable, and (ii) the origin of the tag.</p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>@staticmethod\ndef waterfall_tag(\n    templates_df: pd.DataFrame,\n    variable_row: pd.Series,\n    banned_values: Optional[list[str]] = None,\n) -&gt; tuple[str, TagOrigin]:\n    \"\"\"\n    Apply each of the tagging methods in turn, in order of increasing cost, until a tag is found\n    that is not included in the banned values. In partidular, apply `preceding_tokens_tag` first,\n    then `gpt_tag` with the GPT-3.5 model, and finally `gpt_tag` with the GPT-4 model. If none of\n    these methods succeeds, return the name of the variable as the tag.\n\n    Parameters:\n        templates_df: The dataframe containing information about the log templates.\n        variable_row: The row of the dataframe containing information about the parsed variable.\n        banned_values: A list of values that should not be used as tags.\n\n    Returns:\n        A tuple containing (i) the tag for the parsed variable, and (ii) the origin of the tag.\n    \"\"\"\n    name = variable_row[\"Name\"]\n    if variable_row[\"From regex\"]:\n        return (name, TagOrigin.REGEX_VARIABLE)\n\n    # Try to derive a tag from the preceding tokens in the corresponding template\n    tag, origin = TagUtils.preceding_tokens_tag(variable_row, banned_values)\n    if tag != name:\n        return (tag, origin)\n\n    # Try to derive a tag using GPT-3.5\n    try:\n        tag = TagUtils.gpt_tag(\n            templates_df, variable_row, \"gpt-3.5-turbo\", banned_values\n        )\n        if tag != name:\n            return (tag, TagOrigin.GPT_3POINT5_TURBO)\n    except Exception as e:\n        print(f\"Exception {e} came up while tagging {name} with GPT-3.5.\")\n        pass\n\n    # Try to derive a tag using GPT-4\n    try:\n        tag = TagUtils.gpt_tag(templates_df, variable_row, \"gpt-4\", banned_values)\n        if tag != name:\n            return (tag, TagOrigin.GPT_4)\n    except Exception as e:\n        print(f\"Exception {e} came up while tagging {name} with GPT-4.\")\n        pass\n\n    return (name, TagOrigin.NAME)\n</code></pre>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagUtils.preceding_tokens_tag","title":"<code>preceding_tokens_tag(variable_row, banned_values=None)</code>  <code>staticmethod</code>","text":"<p>Try to derive a tag for a parsed variable name based on the preceding tokens in the corresponding template.</p> <p>Parameters:</p> Name Type Description Default <code>variable_row</code> <code>Series</code> <p>The row of the dataframe containing information about the parsed variable.</p> required <code>banned_values</code> <code>Optional[list[str]]</code> <p>A list of values that should not be used as tags.</p> <code>None</code> <p>Returns:</p> Type Description <code>tuple[str, TagOrigin]</code> <p>A tuple containing (i) the tag for the parsed variable, and (ii) the origin of the tag.</p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>@staticmethod\ndef preceding_tokens_tag(\n    variable_row: pd.Series, banned_values: Optional[list[str]] = None\n) -&gt; tuple[str, TagOrigin]:\n    \"\"\"\n    Try to derive a tag for a parsed variable name based on the preceding tokens in the corresponding template.\n\n    Parameters:\n        variable_row: The row of the dataframe containing information about the parsed variable.\n        banned_values: A list of values that should not be used as tags.\n\n    Returns:\n        A tuple containing (i) the tag for the parsed variable, and (ii) the origin of the tag.\n    \"\"\"\n\n    TagUtils.check_fields(variable_row, [\"Preceding 3 tokens\", \"Name\", \"From regex\"])\n    name = variable_row[\"Name\"]\n    if variable_row[\"From regex\"]:\n        return name, TagOrigin.REGEX_VARIABLE\n\n    pr = variable_row[\"Preceding 3 tokens\"]\n    tag = name\n    origin = TagOrigin.NAME\n    if len(pr) &gt;= 2 and (pr[-1] in \":=\") and (pr[-2][0] != \"&lt;\"):\n        tag = pr[-2]\n        origin = TagOrigin.PRECEDING\n    elif (\n        len(pr) == 3\n        and (pr[2] in \"\"\"\"'\"\"\")\n        and (pr[1] in \":=\")\n        and (pr[0][0] != \"&lt;\")\n    ):\n        tag = pr[0]\n        origin = TagOrigin.PRECEDING\n\n    # Double-check that the tag is not in the banned values\n    if banned_values is not None and tag in banned_values:\n        return name, TagOrigin.NAME\n\n    return tag, origin\n</code></pre>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagUtils.gpt_tag","title":"<code>gpt_tag(templates_df, variable_row, model='gpt-3.5-turbo', banned_values=None)</code>  <code>staticmethod</code>","text":"<p>Use GPT to derive a tag the variable described in <code>variable_row</code>, using information about the corresponding log template, retrieved from <code>templates_df</code>.</p> <p>Parameters:</p> Name Type Description Default <code>templates_df</code> <code>DataFrame</code> <p>The dataframe containing information about the log templates.</p> required <code>variable_row</code> <code>Series</code> <p>The row of the dataframe containing information about the parsed variable.</p> required <code>model</code> <code>str</code> <p>The GPT model to use.</p> <code>'gpt-3.5-turbo'</code> <code>banned_values</code> <code>Optional[list[str]]</code> <p>A list of values that should not be used as tags.</p> <code>None</code> <p>Returns:</p> Type Description <code>str</code> <p>The GPT-generated tag for the parsed variable name.</p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>@staticmethod\ndef gpt_tag(\n    templates_df: pd.DataFrame,\n    variable_row: pd.Series,\n    model: str = \"gpt-3.5-turbo\",\n    banned_values: Optional[list[str]] = None,\n) -&gt; str:\n    \"\"\"\n    Use GPT to derive a tag the variable described in `variable_row`,\n    using information about the corresponding log template, retrieved from `templates_df`.\n\n    Parameters:\n        templates_df: The dataframe containing information about the log templates.\n        variable_row: The row of the dataframe containing information about the parsed variable.\n        model: The GPT model to use.\n        banned_values: A list of values that should not be used as tags.\n\n    Returns:\n        The GPT-generated tag for the parsed variable name.\n    \"\"\"\n\n    TagUtils.check_fields(variable_row, [\"Name\", \"Examples\"])\n    TagUtils.check_columns(templates_df, [\"TemplateId\", \"TemplateExample\"])\n\n    template_id = ParsedVariableName(variable_row[\"Name\"]).template_id()\n    idx = ParsedVariableName(variable_row[\"Name\"]).index()\n\n    line = templates_df[templates_df[\"TemplateId\"] == template_id][\n        \"TemplateExample\"\n    ].values[0]\n    line_toks = line.split()\n\n    # Define the messages to send to the model\n    messages = [\n        {\n            \"role\": \"system\",\n            \"content\": \"You are a backend engineer that knows all about the logging infrastructure of a distributed system.\",\n        },\n        {\n            \"role\": \"user\",\n            \"content\": f\"\"\"Generate a tag for the variable that takes the value {line_toks[idx]} \"\"\"\n            f\"\"\"in the following log line:\\n {line}\\n\"\"\"\n            f\"\"\"Here are the 3 tokens that precede the variable: [{', '.join(line_toks[max(idx-3, 0):idx])} ]\\n\"\"\"\n            f\"\"\"Here are some more example values for this variable: [{', '.join(variable_row['Examples'])} ]\\n\"\"\"\n            #f\"\"\"Make sure the tag matches none of the following values: [{', '.join(banned_values) if banned_values is not None else ''} ]\\n\"\"\"\n            \"\"\"Return only the tag as a single word, possibly including underscores. DO NOT EVER REPLY WITH MORE THAN ONE WORD.\\n\"\"\",\n        },\n    ]\n\n    client = OpenAI()\n\n    tag = (\n        client.chat.completions.create(model=model, messages=messages)\n        .choices[0]\n        .message.content\n    )\n    tag_length = len(tag.split())\n    if tag_length &gt; 1:\n        # GPT didn't listen to us and returned a phrase describing the tag.\n        # Extract the word between the second-last and last occurrence of double quotes.\n        tag = tag.split('\"')[-2]\n\n\n    with open(\"gpt_log.txt\", \"a+\") as f:\n        f.write('----------------------------------\\n')\n        f.write(f\"Variable name: {variable_row['Name']}\\n\\n\")\n        f.write(f\"Model used: {model}\\n\\n\")\n        f.write(f\"Messages sent to the model:\\n{messages}\\n\\n\")\n        f.write(f\"Tag generated by the model:\\n{tag}\\n\\n\")\n        f.flush()\n\n    # Double-check that the tag is not in the banned values\n    if banned_values is not None and tag in banned_values:\n        with open(\"gpt_log.txt\", \"a+\") as f:\n            f.write('That tag is banned, returning name.\\n')\n        return variable_row[\"Name\"]\n\n    return tag\n</code></pre>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagUtils.deduplicate_tags","title":"<code>deduplicate_tags(df)</code>  <code>staticmethod</code>","text":"<p>Ensure that the tags in df are unique, by making the tag column of any row with a seen-before tag equal to the name column of that row.</p> <p>Parameters:</p> Name Type Description Default <code>df</code> <code>DataFrame</code> <p>The dataframe to be deduplicated.</p> required <p>Returns:</p> Type Description <code>DataFrame</code> <p>The deduplicated dataframe.</p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>@staticmethod\ndef deduplicate_tags(df: pd.DataFrame) -&gt; pd.DataFrame:\n    \"\"\"\n    Ensure that the tags in df are unique, by making the tag column of any row\n    with a seen-before tag equal to the name column of that row.\n\n    Parameters:\n        df: The dataframe to be deduplicated.\n\n    Returns:\n        The deduplicated dataframe.\n    \"\"\"\n\n    TagUtils.check_columns(df, [\"Name\", \"Tag\", \"TagOrigin\"])\n    seen_tags = set()\n    for i, row in df.iterrows():\n        if row[\"Tag\"] in seen_tags:\n            df.loc[i, \"Tag\"] = row[\"Name\"]\n            df.loc[i, \"TagOrigin\"] = TagOrigin.NAME\n        else:\n            seen_tags.add(row[\"Tag\"])\n</code></pre>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagUtils.set_tag","title":"<code>set_tag(df, name, tag, info='')</code>  <code>staticmethod</code>","text":"<p>Tag a parsed or prepared variable for easier access.</p> <p>Parameters:</p> Name Type Description Default <code>df</code> <code>DataFrame</code> <p>The dataframe containing the parsed or prepared variables.</p> required <code>name</code> <code>str</code> <p>The name of the parsed or prepared variable.</p> required <code>tag</code> <code>str</code> <p>The tag to be set.</p> required <code>info</code> <code>str</code> <p>A string describing the type of variable being tagged (parsed or prepared).</p> <code>''</code> <p>Raises:</p> Type Description <code>ValueError</code> <p>If the name is not the name of a parsed or prepared variable.</p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>@staticmethod\ndef set_tag(df: pd.DataFrame, name: str, tag: str, info: str = \"\") -&gt; None:\n    \"\"\"\n    Tag a parsed or prepared variable for easier access.\n\n    Parameters:\n        df: The dataframe containing the parsed or prepared variables.\n        name: The name of the parsed or prepared variable.\n        tag: The tag to be set.\n        info: A string describing the type of variable being tagged (parsed or prepared).\n\n    Raises:\n        ValueError: If the name is not the name of a parsed or prepared variable.\n    \"\"\"\n    TagUtils.check_columns(df, [\"Name\", \"Tag\"])\n    if name in df[\"Name\"].values:\n        df.loc[df[\"Name\"] == name, \"Tag\"] = tag\n        print(f\"Variable {name} tagged as {tag}\")\n    else:\n        raise ValueError(f\"{name} is not the name of a {info} variable.\")\n</code></pre>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagUtils.get_tag","title":"<code>get_tag(df, name, info='')</code>  <code>staticmethod</code>","text":"<p>Retrieve the tag of a parsed or prepared variable.</p> <p>Parameters:</p> Name Type Description Default <code>df</code> <code>DataFrame</code> <p>The dataframe containing the parsed or prepared variables.</p> required <code>name</code> <code>str</code> <p>The name of the parsed or prepared variable.</p> required <code>info</code> <code>str</code> <p>A string describing the type of variable being tagged (parsed or prepared).</p> <code>''</code> <p>Raises:</p> Type Description <code>ValueError</code> <p>If the name is not the name of a parsed or prepared variable.</p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>@staticmethod\ndef get_tag(df: pd.DataFrame, name: str, info: str = \"\") -&gt; str:\n    \"\"\"\n    Retrieve the tag of a parsed or prepared variable.\n\n    Parameters:\n        df: The dataframe containing the parsed or prepared variables.\n        name: The name of the parsed or prepared variable.\n        info: A string describing the type of variable being tagged (parsed or prepared).\n\n    Raises:\n        ValueError: If the name is not the name of a parsed or prepared variable.\n    \"\"\"\n\n    TagUtils.check_columns(df, [\"Name\", \"Tag\"])\n    if name in df[\"Name\"].values:\n        return df.loc[df[\"Name\"] == name, \"Tag\"].values[0]\n    else:\n        raise ValueError(f\"{name} is not the name of a {info} variable.\")\n</code></pre>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagUtils.name_of","title":"<code>name_of(df, name_or_tag, info='')</code>  <code>staticmethod</code>","text":"<p>Determine the name of a parsed or prepared variable, given either itself or its tag.</p> <p>Parameters:</p> Name Type Description Default <code>df</code> <code>DataFrame</code> <p>The dataframe containing the parsed or prepared variables.</p> required <code>name_or_tag</code> <code>str</code> <p>The name or tag of the parsed or prepared variable.</p> required <code>info</code> <code>str</code> <p>A string describing the type of variable in question (parsed or prepared).</p> <code>''</code> <p>Returns:</p> Type Description <code>str</code> <p>The name of the parsed or prepared variable.</p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>@staticmethod\ndef name_of(df: pd.DataFrame, name_or_tag: str, info: str = \"\") -&gt; str:\n    \"\"\"\n    Determine the name of a parsed or prepared variable, given either itself or its tag.\n\n    Parameters:\n        df: The dataframe containing the parsed or prepared variables.\n        name_or_tag: The name or tag of the parsed or prepared variable.\n        info: A string describing the type of variable in question (parsed or prepared).\n\n    Returns:\n        The name of the parsed or prepared variable.\n    \"\"\"\n\n    TagUtils.check_columns(df, [\"Name\", \"Tag\"])\n    name_or_tag = name_or_tag.strip()\n    if name_or_tag in df[\"Name\"].values:\n        return name_or_tag\n    elif name_or_tag in df[\"Tag\"].values:\n        return df.loc[df[\"Tag\"] == name_or_tag, \"Name\"].values[0]\n    else:\n        raise ValueError(\n            f\"{name_or_tag} is not the name or tag of a {info} variable.\"\n        )\n</code></pre>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagUtils.tag_of","title":"<code>tag_of(df, name_or_tag, info='')</code>  <code>staticmethod</code>","text":"<p>Determine the tag of a parsed or prepared variable, given either itself or its name. Retuirn None if the variable is None.</p> <p>Parameters:</p> Name Type Description Default <code>df</code> <code>DataFrame</code> <p>The dataframe containing the parsed or prepared variables.</p> required <code>name_or_tag</code> <code>Optional[str]</code> <p>The name or tag of the parsed or prepared variable.</p> required <code>info</code> <code>str</code> <p>A string describing the type of variable in question (parsed or prepared).</p> <code>''</code> <p>Returns:</p> Type Description <code>Optional[str]</code> <p>The tag of the parsed or prepared variable.</p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>@staticmethod\ndef tag_of(df: pd.DataFrame, name_or_tag: Optional[str], info: str = \"\") -&gt; Optional[str]:\n    \"\"\"\n    Determine the tag of a parsed or prepared variable, given either itself or its name.\n    Retuirn None if the variable is None.\n\n    Parameters:\n        df: The dataframe containing the parsed or prepared variables.\n        name_or_tag: The name or tag of the parsed or prepared variable.\n        info: A string describing the type of variable in question (parsed or prepared).\n\n    Returns:\n        The tag of the parsed or prepared variable.\n    \"\"\"\n\n    if name_or_tag is None:\n        return None\n\n    TagUtils.check_columns(df, [\"Name\", \"Tag\"])\n    name_or_tag = name_or_tag.strip()\n    if name_or_tag in df[\"Tag\"].values:\n        return name_or_tag\n    elif name_or_tag in df[\"Name\"].values:\n        return df.loc[df[\"Name\"] == name_or_tag, \"Tag\"].values[0]\n    else:\n        raise ValueError(\n            f\"{name_or_tag} is not the name or tag of a {info} variable.\"\n        )\n</code></pre>"},{"location":"reference/logos/types/","title":"Types","text":""},{"location":"reference/logos/types/#logos.types.Types","title":"<code>Types</code>","text":"Source code in <code>src/logos/types.py</code> <pre><code>class Types:\n    Edge = tuple[str, str]\n    \"\"\"Type alias for a directed edge.\"\"\"\n\n    LeafLabelingFunction = Callable[[int], str]\n    \"\"\"Type alias for a leaf labeling function in `ATE`.\"\"\"\n\n    EdgeCountDict = defaultdict[Edge, int]\n    \"\"\"Type alias for a dictionary counting edge occurrences.\"\"\"\n</code></pre>"},{"location":"reference/logos/types/#logos.types.Types.Edge","title":"<code>Edge = tuple[str, str]</code>  <code>class-attribute</code> <code>instance-attribute</code>","text":"<p>Type alias for a directed edge.</p>"},{"location":"reference/logos/types/#logos.types.Types.LeafLabelingFunction","title":"<code>LeafLabelingFunction = Callable[[int], str]</code>  <code>class-attribute</code> <code>instance-attribute</code>","text":"<p>Type alias for a leaf labeling function in <code>ATE</code>.</p>"},{"location":"reference/logos/types/#logos.types.Types.EdgeCountDict","title":"<code>EdgeCountDict = defaultdict[Edge, int]</code>  <code>class-attribute</code> <code>instance-attribute</code>","text":"<p>Type alias for a dictionary counting edge occurrences.</p>"},{"location":"reference/logos/aggimp/","title":"Index","text":""},{"location":"reference/logos/aggimp/agg_funcs/","title":"Aggregation Functions","text":""},{"location":"reference/logos/aggimp/agg_funcs/#logos.aggimp.agg_funcs.mean","title":"<code>mean(x)</code>","text":"<p>Calculates the mean of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the mean will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The mean of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def mean(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the mean of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the mean will be calculated.\n\n    Returns:\n        The mean of the series, or None if the series is all NA.\n    \"\"\"\n    return x.mean(skipna=True) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggimp/agg_funcs/#logos.aggimp.agg_funcs.min","title":"<code>min(x)</code>","text":"<p>Calculates the minimum of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the minimum will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The minimum of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def min(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the minimum of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the minimum will be calculated.\n\n    Returns:\n        The minimum of the series, or None if the series is all NA.\n    \"\"\"\n    return x.min(skipna=True) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggimp/agg_funcs/#logos.aggimp.agg_funcs.max","title":"<code>max(x)</code>","text":"<p>Calculates the maximum of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the maximum will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The maximum of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def max(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the maximum of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the maximum will be calculated.\n\n    Returns:\n        The maximum of the series, or None if the series is all NA.\n    \"\"\"\n    return x.max(skipna=True) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggimp/agg_funcs/#logos.aggimp.agg_funcs.median","title":"<code>median(x)</code>","text":"<p>Calculates the median of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the median will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The median of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def median(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the median of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the median will be calculated.\n\n    Returns:\n        The median of the series, or None if the series is all NA.\n    \"\"\"\n    return x.median(skipna=True) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggimp/agg_funcs/#logos.aggimp.agg_funcs.mode","title":"<code>mode(x)</code>","text":"<p>Calculates the mode of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the mode will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The mode of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def mode(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the mode of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the mode will be calculated.\n\n    Returns:\n        The mode of the series, or None if the series is all NA.\n    \"\"\"\n    return x.mode(dropna=True)[0] if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggimp/agg_funcs/#logos.aggimp.agg_funcs.std","title":"<code>std(x)</code>","text":"<p>Calculates the standard deviation of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the standard deviation will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The standard deviation of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def std(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the standard deviation of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the standard deviation will be calculated.\n\n    Returns:\n        The standard deviation of the series, or None if the series is all NA.\n    \"\"\"\n    return x.std(skipna=True) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggimp/agg_funcs/#logos.aggimp.agg_funcs.last","title":"<code>last(x)</code>","text":"<p>Returns the last non-NA value in a series.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the last non-NA value will be returned.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The last non-NA value of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def last(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Returns the last non-NA value in a series.\n\n    Parameters:\n        x: The series for which the last non-NA value will be returned.\n\n    Returns:\n        The last non-NA value of the series, or None if the series is all NA.\n    \"\"\"\n    return x.dropna().tail(1) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggimp/agg_funcs/#logos.aggimp.agg_funcs.first","title":"<code>first(x)</code>","text":"<p>Returns the first non-NA value in a series.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the first non-NA value will be returned.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The first non-NA value of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def first(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Returns the first non-NA value in a series.\n\n    Parameters:\n        x: The series for which the first non-NA value will be returned.\n\n    Returns:\n        The first non-NA value of the series, or None if the series is all NA.\n    \"\"\"\n    return x.dropna().head(1) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggimp/agg_funcs/#logos.aggimp.agg_funcs.sum","title":"<code>sum(x)</code>","text":"<p>Calculates the sum of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the sum will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The sum of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def sum(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the sum of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the sum will be calculated.\n\n    Returns:\n        The sum of the series, or None if the series is all NA.\n    \"\"\"\n    return x.sum(skipna=True) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggimp/imp_funcs/","title":"Imputation Functions","text":""},{"location":"reference/logos/aggimp/imp_funcs/#logos.aggimp.imp_funcs.ffill_imp","title":"<code>ffill_imp(x)</code>","text":"<p>Impute the NA values in a series by forward-filling and return the series.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the NA values will be imputed.</p> required <p>Returns:</p> Type Description <code>Series</code> <p>The series, with NA values imputed.</p> Source code in <code>src/logos/aggimp/imp_funcs.py</code> <pre><code>def ffill_imp(x: pd.Series) -&gt; pd.Series:\n    \"\"\"\n    Impute the NA values in a series by forward-filling and return the series.\n\n    Parameters:\n        x: The series for which the NA values will be imputed.\n\n    Returns:\n        The series, with NA values imputed.\n    \"\"\"\n    return x.ffill()\n</code></pre>"},{"location":"reference/logos/aggimp/imp_funcs/#logos.aggimp.imp_funcs.zero_imp","title":"<code>zero_imp(x)</code>","text":"<p>Impute the NA values in a series with zeroes and return the series.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the NA values will be imputed.</p> required <p>Returns:</p> Type Description <code>Series</code> <p>The series, with NA values imputed.</p> Source code in <code>src/logos/aggimp/imp_funcs.py</code> <pre><code>def zero_imp(x: pd.Series) -&gt; pd.Series:\n    \"\"\"\n    Impute the NA values in a series with zeroes and return the series.\n\n    Parameters:\n        x: The series for which the NA values will be imputed.\n\n    Returns:\n        The series, with NA values imputed.\n    \"\"\"\n    return x.fillna(0)\n</code></pre>"},{"location":"reference/logos/aggimp/imp_funcs/#logos.aggimp.imp_funcs.no_imp","title":"<code>no_imp(x)</code>","text":"<p>No-op.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series to be returned.</p> required <p>Returns:</p> Type Description <code>Series</code> <p>The series passed as a parameter.</p> Source code in <code>src/logos/aggimp/imp_funcs.py</code> <pre><code>def no_imp(x: pd.Series) -&gt; pd.Series:\n    \"\"\"\n    No-op.\n\n    Parameters:\n        x: The series to be returned.\n\n    Returns:\n        The series passed as a parameter.\n    \"\"\"\n    return x\n</code></pre>"},{"location":"reference/logos/variable_name/","title":"Index","text":""},{"location":"reference/logos/variable_name/parsed_variable_name/","title":"ParsedVariableName","text":""},{"location":"reference/logos/variable_name/parsed_variable_name/#logos.variable_name.parsed_variable_name.ParsedVariableName","title":"<code>ParsedVariableName</code>","text":"<p>Performs operations on a atring interpreted as a parsed variable name.</p> <p>The relevant string format is {template_id}[_{index}].</p> Source code in <code>src/logos/variable_name/parsed_variable_name.py</code> <pre><code>class ParsedVariableName:\n    \"\"\"\n    Performs operations on a atring interpreted as a parsed variable name.\n\n    The relevant string format is {template_id}[_{index}].\n    \"\"\"\n    def __init__(self, s: str) -&gt; None:\n        \"\"\"\n        Initializes a ParsedVariableName object.\n\n        Parameters:\n            s: The string interpretation of the parsed variable name.\n        \"\"\"\n        toks = s.split(\"_\")\n        self._s = s\n        self._template_id = toks[0]\n        self._index = int(toks[1]) if len(toks) &gt; 1 else -1\n\n    def template_id(self) -&gt; str:\n        \"\"\"\n        Returns the template ID of the parsed variable name.\n\n        Returns:\n            The template ID of the parsed variable name.\n        \"\"\"\n        return self._template_id\n\n    def index(self) -&gt; Optional[int]:\n        \"\"\"\n        Returns the index of the parsed variable name.\n\n        Returns:\n            The index of the parsed variable name, or None if the index is not\n            present.\n        \"\"\"\n        return self._index if self._index != -1 else None\n\n    def str(self) -&gt; str:\n        \"\"\"\n        Returns the string representation of the parsed variable name.\n\n        Returns:\n            The string representation of the parsed variable name.\n        \"\"\"\n        return self._s\n</code></pre>"},{"location":"reference/logos/variable_name/parsed_variable_name/#logos.variable_name.parsed_variable_name.ParsedVariableName.__init__","title":"<code>__init__(s)</code>","text":"<p>Initializes a ParsedVariableName object.</p> <p>Parameters:</p> Name Type Description Default <code>s</code> <code>str</code> <p>The string interpretation of the parsed variable name.</p> required Source code in <code>src/logos/variable_name/parsed_variable_name.py</code> <pre><code>def __init__(self, s: str) -&gt; None:\n    \"\"\"\n    Initializes a ParsedVariableName object.\n\n    Parameters:\n        s: The string interpretation of the parsed variable name.\n    \"\"\"\n    toks = s.split(\"_\")\n    self._s = s\n    self._template_id = toks[0]\n    self._index = int(toks[1]) if len(toks) &gt; 1 else -1\n</code></pre>"},{"location":"reference/logos/variable_name/parsed_variable_name/#logos.variable_name.parsed_variable_name.ParsedVariableName.template_id","title":"<code>template_id()</code>","text":"<p>Returns the template ID of the parsed variable name.</p> <p>Returns:</p> Type Description <code>str</code> <p>The template ID of the parsed variable name.</p> Source code in <code>src/logos/variable_name/parsed_variable_name.py</code> <pre><code>def template_id(self) -&gt; str:\n    \"\"\"\n    Returns the template ID of the parsed variable name.\n\n    Returns:\n        The template ID of the parsed variable name.\n    \"\"\"\n    return self._template_id\n</code></pre>"},{"location":"reference/logos/variable_name/parsed_variable_name/#logos.variable_name.parsed_variable_name.ParsedVariableName.index","title":"<code>index()</code>","text":"<p>Returns the index of the parsed variable name.</p> <p>Returns:</p> Type Description <code>Optional[int]</code> <p>The index of the parsed variable name, or None if the index is not</p> <code>Optional[int]</code> <p>present.</p> Source code in <code>src/logos/variable_name/parsed_variable_name.py</code> <pre><code>def index(self) -&gt; Optional[int]:\n    \"\"\"\n    Returns the index of the parsed variable name.\n\n    Returns:\n        The index of the parsed variable name, or None if the index is not\n        present.\n    \"\"\"\n    return self._index if self._index != -1 else None\n</code></pre>"},{"location":"reference/logos/variable_name/parsed_variable_name/#logos.variable_name.parsed_variable_name.ParsedVariableName.str","title":"<code>str()</code>","text":"<p>Returns the string representation of the parsed variable name.</p> <p>Returns:</p> Type Description <code>str</code> <p>The string representation of the parsed variable name.</p> Source code in <code>src/logos/variable_name/parsed_variable_name.py</code> <pre><code>def str(self) -&gt; str:\n    \"\"\"\n    Returns the string representation of the parsed variable name.\n\n    Returns:\n        The string representation of the parsed variable name.\n    \"\"\"\n    return self._s\n</code></pre>"},{"location":"reference/logos/variable_name/prepared_variable_name/","title":"PreparedVariableName","text":""},{"location":"reference/logos/variable_name/prepared_variable_name/#logos.variable_name.prepared_variable_name.PreparedVariableName","title":"<code>PreparedVariableName</code>","text":"<p>Performs operations on a string interpreted as a prepared variable name.</p> <p>The relevant string format is {template_id}[_{index}][={pre-agg value}]+{aggregate}[={post_agg value}].</p> Source code in <code>src/logos/variable_name/prepared_variable_name.py</code> <pre><code>class PreparedVariableName:\n    \"\"\"\n    Performs operations on a string interpreted as a prepared variable name.\n\n    The relevant string format is {template_id}[_{index}][={pre-agg value}]+{aggregate}[={post_agg value}].\n    \"\"\"\n\n    def __init__(self, s: str) -&gt; None:\n        \"\"\"\n        Initializes a PreparedVariableName object.\n\n        Parameters:\n            s: The string representation of the prepared variable name.\n        \"\"\"\n        mid_split = s.split(\"+\")\n\n        left_split = mid_split[0].split(\"=\")\n        right_split = mid_split[1].split(\"=\") if len(mid_split) &gt; 1 else [\"\", \"\"]\n\n        self._base_var = left_split[0]\n        self._pre_agg_value = left_split[1] if len(left_split) &gt; 1 else \"\"\n        self._aggregate = right_split[0]\n        self._post_agg_value = right_split[1] if len(right_split) &gt; 1 else \"\"\n\n    def base_var(self) -&gt; str:\n        \"\"\"\n        Returns the base variable of the prepared variable name.\n\n        Returns:\n            The base variable of the prepared variable name.\n        \"\"\"\n        return self._base_var\n\n    def template_id(self) -&gt; str:\n        \"\"\"\n        Returns the template ID of the prepared variable name. If the base variable\n        is 'TemplateId', then this will match the pre_agg_value.\n\n        Returns:\n            The template ID of the prepared variable name.\n        \"\"\"\n        if self._base_var == \"TemplateId\":\n            return self._pre_agg_value\n        else:\n            return ParsedVariableName(self._base_var).template_id()\n\n    def index(self) -&gt; Optional[int]:\n        \"\"\"\n        Returns the index of the prepared variable name.\n\n        Returns:\n            The index of the prepared variable name, or None if the index is not\n            present.\n        \"\"\"\n        return ParsedVariableName(self._base_var).index()\n\n    def pre_agg_value(self) -&gt; str:\n        \"\"\"\n        Returns the pre-aggregate value of the prepared variable name.\n\n        Returns:\n            The pre-aggregate value of the prepared variable name.\n        \"\"\"\n        return self._pre_agg_value\n\n    def aggregate(self) -&gt; str:\n        \"\"\"\n        Returns the aggregate of the prepared variable name.\n\n        Returns:\n            The aggregation function implied by the prepared variable name.\n        \"\"\"\n        return self._aggregate\n\n    def post_agg_value(self) -&gt; str:\n        \"\"\"\n        Returns the post-aggregate value of the prepared variable name.\n\n        Returns:\n            The post-aggregate value of the prepared variable name.\n        \"\"\"\n        return self._post_agg_value\n\n    def no_pre_post_aggs(self) -&gt; bool:\n        \"\"\"\n        Check whether the prepared variable has no pre- or post-aggregates.\n\n        Returns:\n            Whether the prepared variable has no pre- or post-aggregates.\n        \"\"\"\n        return self.pre_agg_value() == \"\" and self.post_agg_value() == \"\"\n\n    def has_base_var(self, x: str | Self) -&gt; bool:\n        \"\"\"\n        Check whether the prepared variable has the given base variable.\n\n        Parameters:\n            x: The base variable to check.\n\n        Returns:\n            Whether the prepared variable has the given base variable.\n        \"\"\"\n        return PreparedVariableName.same_base_var(self, x)\n\n    @staticmethod\n    def same_base_var(var1: str | Self, var2: str | Self) -&gt; bool:\n        \"\"\"\n        Check whether two prepared variables have the same base variable.\n\n        Parameters:\n            var1: The first variable to check.\n            var2: The second variable to check.\n\n        Returns:\n            Whether the two variables have the same base variable.\n        \"\"\"\n\n        if isinstance(var1, str):\n            var1 = PreparedVariableName(var1)\n        if isinstance(var2, str):\n            var2 = PreparedVariableName(var2)\n\n        return var1.base_var() == var2.base_var()\n</code></pre>"},{"location":"reference/logos/variable_name/prepared_variable_name/#logos.variable_name.prepared_variable_name.PreparedVariableName.__init__","title":"<code>__init__(s)</code>","text":"<p>Initializes a PreparedVariableName object.</p> <p>Parameters:</p> Name Type Description Default <code>s</code> <code>str</code> <p>The string representation of the prepared variable name.</p> required Source code in <code>src/logos/variable_name/prepared_variable_name.py</code> <pre><code>def __init__(self, s: str) -&gt; None:\n    \"\"\"\n    Initializes a PreparedVariableName object.\n\n    Parameters:\n        s: The string representation of the prepared variable name.\n    \"\"\"\n    mid_split = s.split(\"+\")\n\n    left_split = mid_split[0].split(\"=\")\n    right_split = mid_split[1].split(\"=\") if len(mid_split) &gt; 1 else [\"\", \"\"]\n\n    self._base_var = left_split[0]\n    self._pre_agg_value = left_split[1] if len(left_split) &gt; 1 else \"\"\n    self._aggregate = right_split[0]\n    self._post_agg_value = right_split[1] if len(right_split) &gt; 1 else \"\"\n</code></pre>"},{"location":"reference/logos/variable_name/prepared_variable_name/#logos.variable_name.prepared_variable_name.PreparedVariableName.base_var","title":"<code>base_var()</code>","text":"<p>Returns the base variable of the prepared variable name.</p> <p>Returns:</p> Type Description <code>str</code> <p>The base variable of the prepared variable name.</p> Source code in <code>src/logos/variable_name/prepared_variable_name.py</code> <pre><code>def base_var(self) -&gt; str:\n    \"\"\"\n    Returns the base variable of the prepared variable name.\n\n    Returns:\n        The base variable of the prepared variable name.\n    \"\"\"\n    return self._base_var\n</code></pre>"},{"location":"reference/logos/variable_name/prepared_variable_name/#logos.variable_name.prepared_variable_name.PreparedVariableName.template_id","title":"<code>template_id()</code>","text":"<p>Returns the template ID of the prepared variable name. If the base variable is 'TemplateId', then this will match the pre_agg_value.</p> <p>Returns:</p> Type Description <code>str</code> <p>The template ID of the prepared variable name.</p> Source code in <code>src/logos/variable_name/prepared_variable_name.py</code> <pre><code>def template_id(self) -&gt; str:\n    \"\"\"\n    Returns the template ID of the prepared variable name. If the base variable\n    is 'TemplateId', then this will match the pre_agg_value.\n\n    Returns:\n        The template ID of the prepared variable name.\n    \"\"\"\n    if self._base_var == \"TemplateId\":\n        return self._pre_agg_value\n    else:\n        return ParsedVariableName(self._base_var).template_id()\n</code></pre>"},{"location":"reference/logos/variable_name/prepared_variable_name/#logos.variable_name.prepared_variable_name.PreparedVariableName.index","title":"<code>index()</code>","text":"<p>Returns the index of the prepared variable name.</p> <p>Returns:</p> Type Description <code>Optional[int]</code> <p>The index of the prepared variable name, or None if the index is not</p> <code>Optional[int]</code> <p>present.</p> Source code in <code>src/logos/variable_name/prepared_variable_name.py</code> <pre><code>def index(self) -&gt; Optional[int]:\n    \"\"\"\n    Returns the index of the prepared variable name.\n\n    Returns:\n        The index of the prepared variable name, or None if the index is not\n        present.\n    \"\"\"\n    return ParsedVariableName(self._base_var).index()\n</code></pre>"},{"location":"reference/logos/variable_name/prepared_variable_name/#logos.variable_name.prepared_variable_name.PreparedVariableName.pre_agg_value","title":"<code>pre_agg_value()</code>","text":"<p>Returns the pre-aggregate value of the prepared variable name.</p> <p>Returns:</p> Type Description <code>str</code> <p>The pre-aggregate value of the prepared variable name.</p> Source code in <code>src/logos/variable_name/prepared_variable_name.py</code> <pre><code>def pre_agg_value(self) -&gt; str:\n    \"\"\"\n    Returns the pre-aggregate value of the prepared variable name.\n\n    Returns:\n        The pre-aggregate value of the prepared variable name.\n    \"\"\"\n    return self._pre_agg_value\n</code></pre>"},{"location":"reference/logos/variable_name/prepared_variable_name/#logos.variable_name.prepared_variable_name.PreparedVariableName.aggregate","title":"<code>aggregate()</code>","text":"<p>Returns the aggregate of the prepared variable name.</p> <p>Returns:</p> Type Description <code>str</code> <p>The aggregation function implied by the prepared variable name.</p> Source code in <code>src/logos/variable_name/prepared_variable_name.py</code> <pre><code>def aggregate(self) -&gt; str:\n    \"\"\"\n    Returns the aggregate of the prepared variable name.\n\n    Returns:\n        The aggregation function implied by the prepared variable name.\n    \"\"\"\n    return self._aggregate\n</code></pre>"},{"location":"reference/logos/variable_name/prepared_variable_name/#logos.variable_name.prepared_variable_name.PreparedVariableName.post_agg_value","title":"<code>post_agg_value()</code>","text":"<p>Returns the post-aggregate value of the prepared variable name.</p> <p>Returns:</p> Type Description <code>str</code> <p>The post-aggregate value of the prepared variable name.</p> Source code in <code>src/logos/variable_name/prepared_variable_name.py</code> <pre><code>def post_agg_value(self) -&gt; str:\n    \"\"\"\n    Returns the post-aggregate value of the prepared variable name.\n\n    Returns:\n        The post-aggregate value of the prepared variable name.\n    \"\"\"\n    return self._post_agg_value\n</code></pre>"},{"location":"reference/logos/variable_name/prepared_variable_name/#logos.variable_name.prepared_variable_name.PreparedVariableName.no_pre_post_aggs","title":"<code>no_pre_post_aggs()</code>","text":"<p>Check whether the prepared variable has no pre- or post-aggregates.</p> <p>Returns:</p> Type Description <code>bool</code> <p>Whether the prepared variable has no pre- or post-aggregates.</p> Source code in <code>src/logos/variable_name/prepared_variable_name.py</code> <pre><code>def no_pre_post_aggs(self) -&gt; bool:\n    \"\"\"\n    Check whether the prepared variable has no pre- or post-aggregates.\n\n    Returns:\n        Whether the prepared variable has no pre- or post-aggregates.\n    \"\"\"\n    return self.pre_agg_value() == \"\" and self.post_agg_value() == \"\"\n</code></pre>"},{"location":"reference/logos/variable_name/prepared_variable_name/#logos.variable_name.prepared_variable_name.PreparedVariableName.has_base_var","title":"<code>has_base_var(x)</code>","text":"<p>Check whether the prepared variable has the given base variable.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>str | Self</code> <p>The base variable to check.</p> required <p>Returns:</p> Type Description <code>bool</code> <p>Whether the prepared variable has the given base variable.</p> Source code in <code>src/logos/variable_name/prepared_variable_name.py</code> <pre><code>def has_base_var(self, x: str | Self) -&gt; bool:\n    \"\"\"\n    Check whether the prepared variable has the given base variable.\n\n    Parameters:\n        x: The base variable to check.\n\n    Returns:\n        Whether the prepared variable has the given base variable.\n    \"\"\"\n    return PreparedVariableName.same_base_var(self, x)\n</code></pre>"},{"location":"reference/logos/variable_name/prepared_variable_name/#logos.variable_name.prepared_variable_name.PreparedVariableName.same_base_var","title":"<code>same_base_var(var1, var2)</code>  <code>staticmethod</code>","text":"<p>Check whether two prepared variables have the same base variable.</p> <p>Parameters:</p> Name Type Description Default <code>var1</code> <code>str | Self</code> <p>The first variable to check.</p> required <code>var2</code> <code>str | Self</code> <p>The second variable to check.</p> required <p>Returns:</p> Type Description <code>bool</code> <p>Whether the two variables have the same base variable.</p> Source code in <code>src/logos/variable_name/prepared_variable_name.py</code> <pre><code>@staticmethod\ndef same_base_var(var1: str | Self, var2: str | Self) -&gt; bool:\n    \"\"\"\n    Check whether two prepared variables have the same base variable.\n\n    Parameters:\n        var1: The first variable to check.\n        var2: The second variable to check.\n\n    Returns:\n        Whether the two variables have the same base variable.\n    \"\"\"\n\n    if isinstance(var1, str):\n        var1 = PreparedVariableName(var1)\n    if isinstance(var2, str):\n        var2 = PreparedVariableName(var2)\n\n    return var1.base_var() == var2.base_var()\n</code></pre>"}]}
\ No newline at end of file
+{"config":{"lang":["en"],"separator":"[\\s\\-]+","pipeline":["stopWordFilter"]},"docs":[{"location":"","title":"LOGos","text":"<p>Utilizing system logs to perform causal analysis. You can access the documentation here.</p> <p>Please begin by installing the Python packages required for this project by running <code>pip install -r requirements.txt</code>.</p>"},{"location":"#openai-integration","title":"OpenAI integration","text":"<p>In order to use the LLM-powered capabilites of LOGos, please add a <code>.env</code> file to the root of this repo and define <code>OPENAI_API_KEY</code> appropriately.</p>"},{"location":"#trying-out-logos","title":"Trying out LOGos","text":"<p>For an introduction to our Python-based interface at <code>demo/demo.ipynb</code>.</p> <p>We also offer a UI-based demo, which you can launch by running </p>"},{"location":"#reproducing-our-evaluation","title":"Reproducing our evaluation","text":"<p>To reproduce the evaluation from our VLDB paper, please follow the following steps:</p> <ol> <li>Follow the instructions in <code>dataset_files/README.md</code> to gain access to our datasets.</li> <li>Within <code>evaluation/</code>, you will find directories based on each experiment presented in our paper. Based on the experiment you would like to reproduce, switch into the appropriate directory and run the <code>reproduce.sh</code> script (you may need to edit file permissions to make it executable). This will run the experiment and plot the results.</li> <li>Find the resulting plots in <code>evaluation/repro_plots/</code>. The raw data for each plot will be saved in <code>evaluation/repro_plots_data/</code>.</li> </ol>"},{"location":"reference/SUMMARY/","title":"SUMMARY","text":"<ul> <li>logos<ul> <li>aggimp<ul> <li>agg_funcs</li> <li>imp_funcs</li> </ul> </li> <li>aggregate_selector</li> <li>ate_calculator</li> <li>candidate_cause_ranker</li> <li>causal_discoverer</li> <li>causal_unit_suggester</li> <li>clustering_params</li> <li>drain</li> <li>edge_occurrence_tree</li> <li>edge_state_matrix</li> <li>graph_renderer</li> <li>interactive_causal_graph_refiner</li> <li>logos</li> <li>pickler</li> <li>printer</li> <li>pruner</li> <li>regression</li> <li>tag_utils</li> <li>types</li> <li>variable_name<ul> <li>parsed_variable_name</li> <li>prepared_variable_name</li> </ul> </li> </ul> </li> </ul>"},{"location":"reference/logos/","title":"Index","text":""},{"location":"reference/logos/aggregate_selector/","title":"AggregateSelector","text":""},{"location":"reference/logos/aggregate_selector/#logos.aggregate_selector.AggregateSelector","title":"<code>AggregateSelector</code>","text":"Source code in <code>src/logos/aggregate_selector.py</code> <pre><code>class AggregateSelector:\n    DEFAULT_AGGREGATES = {\n        \"num\": [\n            \"mean\",\n            \"max\",\n            \"min\",\n        ],\n        \"str\": [\n            \"last\",\n            \"mode\",\n            \"first\",\n        ],\n    }\n\n    def _entropy(col: pd.Series) -&gt; float:\n        \"\"\"\n        Calculates the entropy of a column.\n\n        Parameters:\n            col: The column for which to calculate the entropy.\n\n        Returns:\n            The entropy of `col`.\n        \"\"\"\n\n        rel_value_counts = col.value_counts(normalize=True)\n        if rel_value_counts.empty:\n            return 0\n        return -np.sum(rel_value_counts * np.log2(rel_value_counts))\n\n    def find_uninformative_aggregates(\n        prepared_log: pd.DataFrame, parsed_variables: pd.DataFrame, causal_unit_var: str\n    ) -&gt; list[str]:\n        \"\"\"\n        Find aggregates that are uninformative for each column in `prepared_log`.\n        Aggregates are uninformative unless they maximize the empirical entropy across causal units.\n\n        Parameters:\n            prepared_log: The prepared log.\n            parsed_variables: The parsed variables.\n            causal_unit_var: The name of the causal unit variable.\n\n        Returns:\n            A list of uninformative aggregates for `prepared_log`.\n        \"\"\"\n\n        drop_list = []\n\n        for row in parsed_variables.itertuples():\n            aggs = row.Aggregates\n            if len(aggs) == 0 or row.Name == causal_unit_var:\n                continue\n\n            vars = [f\"{row.Name}+{agg}\" for agg in aggs]\n            best_var = f\"{row.Name}+{AggregateSelector.DEFAULT_AGGREGATES[row.Type][0]}\"\n            max_entropy = -np.inf\n\n            for var in vars:\n                entropy = AggregateSelector._entropy(prepared_log[var])\n\n                if entropy &gt; max_entropy:\n                    best_var = var\n                    max_entropy = entropy\n\n            drop_list.extend([var for var in vars if var != best_var])\n\n        return drop_list\n</code></pre>"},{"location":"reference/logos/aggregate_selector/#logos.aggregate_selector.AggregateSelector._entropy","title":"<code>_entropy(col)</code>","text":"<p>Calculates the entropy of a column.</p> <p>Parameters:</p> Name Type Description Default <code>col</code> <code>Series</code> <p>The column for which to calculate the entropy.</p> required <p>Returns:</p> Type Description <code>float</code> <p>The entropy of <code>col</code>.</p> Source code in <code>src/logos/aggregate_selector.py</code> <pre><code>def _entropy(col: pd.Series) -&gt; float:\n    \"\"\"\n    Calculates the entropy of a column.\n\n    Parameters:\n        col: The column for which to calculate the entropy.\n\n    Returns:\n        The entropy of `col`.\n    \"\"\"\n\n    rel_value_counts = col.value_counts(normalize=True)\n    if rel_value_counts.empty:\n        return 0\n    return -np.sum(rel_value_counts * np.log2(rel_value_counts))\n</code></pre>"},{"location":"reference/logos/aggregate_selector/#logos.aggregate_selector.AggregateSelector.find_uninformative_aggregates","title":"<code>find_uninformative_aggregates(prepared_log, parsed_variables, causal_unit_var)</code>","text":"<p>Find aggregates that are uninformative for each column in <code>prepared_log</code>. Aggregates are uninformative unless they maximize the empirical entropy across causal units.</p> <p>Parameters:</p> Name Type Description Default <code>prepared_log</code> <code>DataFrame</code> <p>The prepared log.</p> required <code>parsed_variables</code> <code>DataFrame</code> <p>The parsed variables.</p> required <code>causal_unit_var</code> <code>str</code> <p>The name of the causal unit variable.</p> required <p>Returns:</p> Type Description <code>list[str]</code> <p>A list of uninformative aggregates for <code>prepared_log</code>.</p> Source code in <code>src/logos/aggregate_selector.py</code> <pre><code>def find_uninformative_aggregates(\n    prepared_log: pd.DataFrame, parsed_variables: pd.DataFrame, causal_unit_var: str\n) -&gt; list[str]:\n    \"\"\"\n    Find aggregates that are uninformative for each column in `prepared_log`.\n    Aggregates are uninformative unless they maximize the empirical entropy across causal units.\n\n    Parameters:\n        prepared_log: The prepared log.\n        parsed_variables: The parsed variables.\n        causal_unit_var: The name of the causal unit variable.\n\n    Returns:\n        A list of uninformative aggregates for `prepared_log`.\n    \"\"\"\n\n    drop_list = []\n\n    for row in parsed_variables.itertuples():\n        aggs = row.Aggregates\n        if len(aggs) == 0 or row.Name == causal_unit_var:\n            continue\n\n        vars = [f\"{row.Name}+{agg}\" for agg in aggs]\n        best_var = f\"{row.Name}+{AggregateSelector.DEFAULT_AGGREGATES[row.Type][0]}\"\n        max_entropy = -np.inf\n\n        for var in vars:\n            entropy = AggregateSelector._entropy(prepared_log[var])\n\n            if entropy &gt; max_entropy:\n                best_var = var\n                max_entropy = entropy\n\n        drop_list.extend([var for var in vars if var != best_var])\n\n    return drop_list\n</code></pre>"},{"location":"reference/logos/aggregate_selector/#logos.aggregate_selector.mean","title":"<code>mean(x)</code>","text":"<p>Calculates the mean of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the mean will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The mean of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def mean(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the mean of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the mean will be calculated.\n\n    Returns:\n        The mean of the series, or None if the series is all NA.\n    \"\"\"\n    return x.mean(skipna=True) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggregate_selector/#logos.aggregate_selector.min","title":"<code>min(x)</code>","text":"<p>Calculates the minimum of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the minimum will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The minimum of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def min(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the minimum of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the minimum will be calculated.\n\n    Returns:\n        The minimum of the series, or None if the series is all NA.\n    \"\"\"\n    return x.min(skipna=True) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggregate_selector/#logos.aggregate_selector.max","title":"<code>max(x)</code>","text":"<p>Calculates the maximum of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the maximum will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The maximum of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def max(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the maximum of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the maximum will be calculated.\n\n    Returns:\n        The maximum of the series, or None if the series is all NA.\n    \"\"\"\n    return x.max(skipna=True) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggregate_selector/#logos.aggregate_selector.median","title":"<code>median(x)</code>","text":"<p>Calculates the median of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the median will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The median of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def median(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the median of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the median will be calculated.\n\n    Returns:\n        The median of the series, or None if the series is all NA.\n    \"\"\"\n    return x.median(skipna=True) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggregate_selector/#logos.aggregate_selector.mode","title":"<code>mode(x)</code>","text":"<p>Calculates the mode of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the mode will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The mode of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def mode(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the mode of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the mode will be calculated.\n\n    Returns:\n        The mode of the series, or None if the series is all NA.\n    \"\"\"\n    return x.mode(dropna=True)[0] if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggregate_selector/#logos.aggregate_selector.std","title":"<code>std(x)</code>","text":"<p>Calculates the standard deviation of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the standard deviation will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The standard deviation of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def std(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the standard deviation of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the standard deviation will be calculated.\n\n    Returns:\n        The standard deviation of the series, or None if the series is all NA.\n    \"\"\"\n    return x.std(skipna=True) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggregate_selector/#logos.aggregate_selector.last","title":"<code>last(x)</code>","text":"<p>Returns the last non-NA value in a series.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the last non-NA value will be returned.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The last non-NA value of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def last(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Returns the last non-NA value in a series.\n\n    Parameters:\n        x: The series for which the last non-NA value will be returned.\n\n    Returns:\n        The last non-NA value of the series, or None if the series is all NA.\n    \"\"\"\n    return x.dropna().tail(1) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggregate_selector/#logos.aggregate_selector.first","title":"<code>first(x)</code>","text":"<p>Returns the first non-NA value in a series.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the first non-NA value will be returned.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The first non-NA value of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def first(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Returns the first non-NA value in a series.\n\n    Parameters:\n        x: The series for which the first non-NA value will be returned.\n\n    Returns:\n        The first non-NA value of the series, or None if the series is all NA.\n    \"\"\"\n    return x.dropna().head(1) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggregate_selector/#logos.aggregate_selector.sum","title":"<code>sum(x)</code>","text":"<p>Calculates the sum of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the sum will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The sum of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def sum(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the sum of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the sum will be calculated.\n\n    Returns:\n        The sum of the series, or None if the series is all NA.\n    \"\"\"\n    return x.sum(skipna=True) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/ate_calculator/","title":"ATECalculator","text":""},{"location":"reference/logos/ate_calculator/#logos.ate_calculator.ATECalculator","title":"<code>ATECalculator</code>","text":"<p>A class to calculate ATEs and determine the impact of adding/removing/reversing DAG edges on these calculations.</p> Source code in <code>src/logos/ate_calculator.py</code> <pre><code>class ATECalculator:\n    \"\"\"\n    A class to calculate ATEs and determine the impact of adding/removing/reversing DAG edges\n    on these calculations.\n    \"\"\"\n\n    @staticmethod\n    def get_ate_and_confidence(\n        data: pd.DataFrame,\n        vars: pd.DataFrame,\n        treatment: str,\n        outcome: str,\n        confounder: Optional[str] = None,\n        graph: Optional[nx.DiGraph] = None,\n        calculate_p_value: bool = True,\n        calculate_std_error: bool = True,\n        get_estimand: bool = False,\n    ) -&gt; dict[str, Any]:\n        \"\"\"\n        Calculate the ATE of `treatment` on `outcome`, alongside confidence measures.\n\n        Parameters:\n            treatment: The name or tag of the treatment variable.\n            outcome: The name or tag of the outcome variable.\n            confounder: The name or tag of a confounder variable. If specified, overrides the current partial\n                causal graph in favor of a three-node graph with `treatment`, `outcome` and `confounder`.\n            graph: The graph to be used for causal analysis. If not specified, a two-node graph with just\n                `treatment` and `outcome` is used.\n            calculate_p_value: Whether to calculate the P-value of the ATE.\n            calculate_std_error: Whether to calculate the standard error of the ATE.\n            get_estimand: Whether to return the estimand used to calculate the ATE, as part of the returned dictionary.\n\n        Returns:\n            A dictionary containing the ATE of `treatment` on `outcome`, alongside confidence measures. If\n            `get_estimand` is True, the estimand used to calculate the ATE is also returned.\n        \"\"\"\n\n        # If the user provided the tag of any variable, retrieve their names\n        treatment = TagUtils.name_of(vars, treatment, \"prepared\")\n        outcome = TagUtils.name_of(vars, outcome, \"prepared\")\n        if confounder is not None:\n            confounder = TagUtils.name_of(vars, confounder, \"prepared\")\n\n        # Should the effects be calculated based on the current partial causal graph,\n        # some other graph provided as a function parameter,\n        # or on an ad-hoc subset relevant for the question at hand?\n        if graph is None:\n            graph = nx.DiGraph()\n            graph.add_node(treatment)\n            graph.add_node(outcome)\n            graph.add_edge(treatment, outcome)\n\n            if confounder is not None:\n                graph.add_node(confounder)\n                graph.add_edge(confounder, outcome)\n                graph.add_edge(confounder, treatment)\n\n        # Use dowhy to get the ATE, P-value and standard error.\n        with open(\"/dev/null\", \"w+\") as f:\n            try:\n                with contextlib.redirect_stdout(f), contextlib.redirect_stderr(f):\n                    model = CausalModel(\n                        data=data[list(graph.nodes)],\n                        treatment=treatment,\n                        outcome=outcome,\n                        graph=nx.nx_pydot.to_pydot(graph).to_string(),\n                    )\n                    identified_estimand = model.identify_effect(\n                        proceed_when_unidentifiable=True\n                    )\n                    estimate = model.estimate_effect(\n                        identified_estimand,\n                        method_name=\"backdoor.linear_regression\",\n                        test_significance=True,\n                    )\n                    p_value = (\n                        estimate.test_stat_significance()[\"p_value\"].astype(float)[0]\n                        if calculate_p_value\n                        else None\n                    )\n                    stderr = (\n                        estimate.get_standard_error() if calculate_std_error else None\n                    )\n                    d = {\n                        \"ATE\": float(estimate.value),\n                        \"P-value\": p_value,\n                        \"Standard Error\": stderr,\n                    }\n                    if get_estimand:\n                        d[\"Estimand\"] = identified_estimand\n                    return d\n            except:\n                raise ValueError\n</code></pre>"},{"location":"reference/logos/ate_calculator/#logos.ate_calculator.ATECalculator.get_ate_and_confidence","title":"<code>get_ate_and_confidence(data, vars, treatment, outcome, confounder=None, graph=None, calculate_p_value=True, calculate_std_error=True, get_estimand=False)</code>  <code>staticmethod</code>","text":"<p>Calculate the ATE of <code>treatment</code> on <code>outcome</code>, alongside confidence measures.</p> <p>Parameters:</p> Name Type Description Default <code>treatment</code> <code>str</code> <p>The name or tag of the treatment variable.</p> required <code>outcome</code> <code>str</code> <p>The name or tag of the outcome variable.</p> required <code>confounder</code> <code>Optional[str]</code> <p>The name or tag of a confounder variable. If specified, overrides the current partial causal graph in favor of a three-node graph with <code>treatment</code>, <code>outcome</code> and <code>confounder</code>.</p> <code>None</code> <code>graph</code> <code>Optional[DiGraph]</code> <p>The graph to be used for causal analysis. If not specified, a two-node graph with just <code>treatment</code> and <code>outcome</code> is used.</p> <code>None</code> <code>calculate_p_value</code> <code>bool</code> <p>Whether to calculate the P-value of the ATE.</p> <code>True</code> <code>calculate_std_error</code> <code>bool</code> <p>Whether to calculate the standard error of the ATE.</p> <code>True</code> <code>get_estimand</code> <code>bool</code> <p>Whether to return the estimand used to calculate the ATE, as part of the returned dictionary.</p> <code>False</code> <p>Returns:</p> Type Description <code>dict[str, Any]</code> <p>A dictionary containing the ATE of <code>treatment</code> on <code>outcome</code>, alongside confidence measures. If</p> <code>dict[str, Any]</code> <p><code>get_estimand</code> is True, the estimand used to calculate the ATE is also returned.</p> Source code in <code>src/logos/ate_calculator.py</code> <pre><code>@staticmethod\ndef get_ate_and_confidence(\n    data: pd.DataFrame,\n    vars: pd.DataFrame,\n    treatment: str,\n    outcome: str,\n    confounder: Optional[str] = None,\n    graph: Optional[nx.DiGraph] = None,\n    calculate_p_value: bool = True,\n    calculate_std_error: bool = True,\n    get_estimand: bool = False,\n) -&gt; dict[str, Any]:\n    \"\"\"\n    Calculate the ATE of `treatment` on `outcome`, alongside confidence measures.\n\n    Parameters:\n        treatment: The name or tag of the treatment variable.\n        outcome: The name or tag of the outcome variable.\n        confounder: The name or tag of a confounder variable. If specified, overrides the current partial\n            causal graph in favor of a three-node graph with `treatment`, `outcome` and `confounder`.\n        graph: The graph to be used for causal analysis. If not specified, a two-node graph with just\n            `treatment` and `outcome` is used.\n        calculate_p_value: Whether to calculate the P-value of the ATE.\n        calculate_std_error: Whether to calculate the standard error of the ATE.\n        get_estimand: Whether to return the estimand used to calculate the ATE, as part of the returned dictionary.\n\n    Returns:\n        A dictionary containing the ATE of `treatment` on `outcome`, alongside confidence measures. If\n        `get_estimand` is True, the estimand used to calculate the ATE is also returned.\n    \"\"\"\n\n    # If the user provided the tag of any variable, retrieve their names\n    treatment = TagUtils.name_of(vars, treatment, \"prepared\")\n    outcome = TagUtils.name_of(vars, outcome, \"prepared\")\n    if confounder is not None:\n        confounder = TagUtils.name_of(vars, confounder, \"prepared\")\n\n    # Should the effects be calculated based on the current partial causal graph,\n    # some other graph provided as a function parameter,\n    # or on an ad-hoc subset relevant for the question at hand?\n    if graph is None:\n        graph = nx.DiGraph()\n        graph.add_node(treatment)\n        graph.add_node(outcome)\n        graph.add_edge(treatment, outcome)\n\n        if confounder is not None:\n            graph.add_node(confounder)\n            graph.add_edge(confounder, outcome)\n            graph.add_edge(confounder, treatment)\n\n    # Use dowhy to get the ATE, P-value and standard error.\n    with open(\"/dev/null\", \"w+\") as f:\n        try:\n            with contextlib.redirect_stdout(f), contextlib.redirect_stderr(f):\n                model = CausalModel(\n                    data=data[list(graph.nodes)],\n                    treatment=treatment,\n                    outcome=outcome,\n                    graph=nx.nx_pydot.to_pydot(graph).to_string(),\n                )\n                identified_estimand = model.identify_effect(\n                    proceed_when_unidentifiable=True\n                )\n                estimate = model.estimate_effect(\n                    identified_estimand,\n                    method_name=\"backdoor.linear_regression\",\n                    test_significance=True,\n                )\n                p_value = (\n                    estimate.test_stat_significance()[\"p_value\"].astype(float)[0]\n                    if calculate_p_value\n                    else None\n                )\n                stderr = (\n                    estimate.get_standard_error() if calculate_std_error else None\n                )\n                d = {\n                    \"ATE\": float(estimate.value),\n                    \"P-value\": p_value,\n                    \"Standard Error\": stderr,\n                }\n                if get_estimand:\n                    d[\"Estimand\"] = identified_estimand\n                return d\n        except:\n            raise ValueError\n</code></pre>"},{"location":"reference/logos/candidate_cause_ranker/","title":"CandidateCauseRanker","text":""},{"location":"reference/logos/candidate_cause_ranker/#logos.candidate_cause_ranker.CandidateCauseRanker","title":"<code>CandidateCauseRanker</code>","text":"Source code in <code>src/logos/candidate_cause_ranker.py</code> <pre><code>class CandidateCauseRanker:\n    COLUMN_ORDER = [\n        \"Candidate\",\n        \"Candidate Tag\",\n        \"Target Tag\",\n        \"Slope\",\n        \"P-value\",\n        \"Candidate-&gt;Target Edge Status\",\n        \"Target-&gt;Candidate Edge Status\",\n    ]\n\n    INTERNAL_COLUMN_ORDER = [\n        \"Candidate\",\n        \"Candidate Tag\",\n        \"Target Tag\",\n        \"Slope\",\n        \"P-value\",\n    ]\n\n    @staticmethod\n    def rank(\n        data: pd.DataFrame,\n        data_tags_df: pd.DataFrame = None,\n        target_name: Optional[str] = None,\n        ignore: Optional[list[str]] = None,\n        method: CandidateCauseRankerMethod = CandidateCauseRankerMethod.LOGOS,\n        prune_candidates: bool = True,\n        lasso_alpha: float = Pruner.LASSO_DEFAULT_ALPHA,\n        lasso_max_iter: int = Pruner.LASSO_DEFAULT_MAX_ITER,\n        model: str = \"gpt-4o-mini-2024-07-18\",\n        gpt_log_path: Optional[str] = None,\n    ) -&gt; Tuple[pd.DataFrame, list[str]]:\n        \"\"\"\n        Present the user with candidate causal graph neighbors for `target`. If no `target`\n        is specified, the most recent suggestion of `suggest_next_exploration()` is used, if any.\n        If `ignore` is specified, the variables in `ignore` are not considered as candidate causes.\n\n        Parameters:\n            data: The data based on which to explore candidate causes.\n            data_tags_df: A dataframe containing tags for the data.\n            target_name: The name of the target variable.\n            ignore: A list of variables to ignore.\n            method: The method to use for ranking candidate causes.\n            prune_candidates: Whether to prune the candidate causes using Lasso regression. Only\n                applies if `method` is `CandidateCauseRankerMethod.LOGOS`.\n            lasso_alpha: The alpha parameter to be used for Lasso regression. Only applies if\n                `method` is `CandidateCauseRankerMethod.LOGOS` and `prune_candidates` is True.\n            lasso_max_iter: The maximum number of iterations to be used for Lasso regression. Only\n                applies if `method` is `CandidateCauseRankerMethod.LOGOS` and `prune_candidates` is True.\n            model: The model to use for the langmodel method. Only applies if the method is\n                `CandidateCauseRankerMethod.LANGMODEL`.\n            gpt_log_path: The path to the log file for the prompt and reply. Only applies if the\n                method is `CandidateCauseRankerMethod.LANGMODEL`.\n\n        Returns:\n            results_df: A dataframe containing the candidate causal graph neighbors for `target`\n            pruned: A list of pruned candidate causes, if any.\n        \"\"\"\n        if ignore is None:\n            ignore = []\n        non_ignore = [col for col in data.columns if col not in ignore]\n\n        if method == CandidateCauseRankerMethod.LOGOS:\n            return CandidateCauseRanker._rank_logos(\n                data[non_ignore],\n                data_tags_df,\n                target_name,\n                prune_candidates,\n                lasso_alpha,\n                lasso_max_iter,\n            )\n        elif method == CandidateCauseRankerMethod.REGRESSION:\n            return CandidateCauseRanker._rank_regression(data[non_ignore], data_tags_df, target_name)\n        elif method == CandidateCauseRankerMethod.LANGMODEL:\n            return CandidateCauseRanker._rank_langmodel(\n                data[non_ignore], data_tags_df, target_name, model, gpt_log_path\n            )\n        else:\n            raise ValueError(f\"Unknown method: {method}\")\n\n    @staticmethod\n    def _rank_logos(\n        data: pd.DataFrame,\n        data_tags_df: pd.DataFrame = None,\n        target_name: Optional[str] = None,\n        prune_candidates: bool = True,\n        lasso_alpha: float = Pruner.LASSO_DEFAULT_ALPHA,\n        lasso_max_iter: int = Pruner.LASSO_DEFAULT_MAX_ITER,\n    ) -&gt; Tuple[pd.DataFrame, list[str]]:\n        \"\"\"\n        Implement `rank()` for the LOGOS method.\n\n        Parameters:\n            data: The data based on which to explore candidate causes.\n            data_tags_df: A dataframe containing tags for the data.\n            target_name: The name of the target variable.\n            prune_candidates: Whether to prune the candidate causes using Lasso regression.\n            lasso_alpha: The alpha parameter to be used for Lasso regression.\n            lasso_max_iter: The maximum number of iterations to be used for Lasso regression.\n\n        Returns:\n            results_df: A dataframe containing the candidate causal graph neighbors for `target`\n            pruned: A list of pruned candidate causes, if any.\n        \"\"\"\n\n        # Use Lasso to get a pruned list of neighbors\n        candidates = (\n            Pruner.prune_with_lasso(\n                data,\n                [target_name],\n                alpha=lasso_alpha,\n                max_iter=lasso_max_iter,\n            )\n            if prune_candidates\n            else [c for c in data.columns if c != target_name]\n        )\n        Printer.printv(f\"Candidates: {candidates}\")\n\n        # Stop if there are no candidates\n        if len(candidates) == 0:\n            print(\"No candidates found.\")\n            return pd.DataFrame(columns=CandidateCauseRanker.COLUMN_ORDER), pruned\n\n        # For each candidate, calculate the slope and p-value of a linear regression with target (in parallel)\n        num_processors = multiprocessing.cpu_count()\n        with multiprocessing.Pool(processes=num_processors) as pool:\n            results = pool.starmap(\n                Regression.ols,\n                [(col, data[col], data[target_name]) for col in candidates],\n            )\n\n        # Prepare return values.\n        result_df = (\n            pd.DataFrame(results)\n            .sort_values(by=\"P-value\", ascending=True)\n            .reset_index(drop=True)\n        )\n        result_df[\"Target Tag\"] = TagUtils.tag_of(data_tags_df, target_name, \"prepared\")\n        result_df[\"Candidate Tag\"] = result_df[\"Candidate\"].apply(\n            lambda x: TagUtils.tag_of(data_tags_df, x, \"prepared\")\n        )\n        result_df = result_df[CandidateCauseRanker.INTERNAL_COLUMN_ORDER]\n\n        pruned = set(data.columns) - set(candidates) - set([target_name])\n\n        return result_df, pruned\n\n    @staticmethod\n    def _rank_regression(\n        data: pd.DataFrame,\n        data_tags_df: pd.DataFrame = None,\n        target_name: Optional[str] = None,\n    ) -&gt; Tuple[pd.DataFrame, list[str]]:\n        \"\"\"\n        Implement `rank()` for the REGRESSION method.\n\n        Parameters:\n            data: The data based on which to explore candidate causes.\n            data_tags_df: A dataframe containing tags for the data.\n            target_name: The name of the target variable.\n\n        Returns:\n            results_df: A dataframe containing the candidate causal graph neighbors for `target`\n            pruned: A list of pruned candidate causes, if any. #TODO: Prune based on cutoff?\n        \"\"\"\n\n        candidates = [c for c in data.columns if c != target_name]\n        result_df = Regression.multi_ols(\n            candidates, data[candidates], data[target_name]\n        )\n        result_df = (\n            result_df.sort_values(by=\"Absolute Normalized Slope\", ascending=False)\n            .drop(columns=[\"Normalized Slope\", \"Absolute Normalized Slope\"])\n            .reset_index(drop=True)\n        )\n\n        result_df[\"Target Tag\"] = TagUtils.tag_of(data_tags_df, target_name, \"prepared\")\n        result_df[\"Candidate Tag\"] = result_df[\"Candidate\"].apply(\n            lambda x: TagUtils.tag_of(data_tags_df, x, \"prepared\")\n        )\n        result_df = result_df[CandidateCauseRanker.INTERNAL_COLUMN_ORDER]\n\n        return result_df, []\n\n    @staticmethod\n    def _rank_langmodel(\n        data: pd.DataFrame,\n        data_tags_df: pd.DataFrame = None,\n        target_name: Optional[str] = None,\n        model: str = \"gpt-4o-mini-2024-07-18\",\n        gpt_log_path: Optional[str] = None,\n    ) -&gt; Tuple[pd.DataFrame, list[str]]:\n        \"\"\"\n        Implement `rank()` for the LANGMODEL method.\n\n        Parameters:\n            data: The data based on which to explore candidate causes.\n            data_tags_df: A dataframe containing tags for the data.\n            target_name: The name of the target variable.\n            model: The model to use for the langmodel method.\n            gpt_log_path: The path to the log file for the prompt and reply.\n\n        Returns:\n            results_df: A dataframe containing the candidate causal graph neighbors for `target`\n            pruned: A list of pruned candidate causes, if any.\n        \"\"\"\n\n        client = OpenAI()\n\n        target_tag = TagUtils.tag_of(data_tags_df, target_name, \"prepared\")\n        num_samples_per_var = 3\n\n        if gpt_log_path == None:\n            gpt_log_path = f\"ranker-gpt-{datetime.now().strftime('%Y-%m-%d-%H-%M-%S')}.log\"\n        with open(gpt_log_path, \"w+\") as f:\n\n            # Define the messages to send to the model\n            messages = [\n                {\n                    \"role\": \"system\",\n                    \"content\": \"You are a helpful assistant for causal reasoning.\",\n                },\n                {\n                    \"role\": \"user\",\n                    \"content\": f\"\"\"Below is a list of variable names and some example distinct values for each. \"\"\"\n                    f\"\"\"The lists are not sorted in compatible ways, so that elements in the same position may not correspond to the same entity. \"\"\"\n                    f\"\"\"I want you to assess the likelihood of each of these variables as a cause for variable '{target_tag}' and return them as a ranked list. \"\"\"\n                    \"\"\"I understand that you may think this is speculative, but I want you to do your best to come up with such a list ALWAYS. \"\"\"\n                    \"\"\"I will interpret any results you give me knowing that you may not be sure about them. \"\"\"\n                    \"\"\"Only return the ranked answers, one per line, preceded by a number and a period. Rank as many of the given variables as you see fit,\"\"\"\n                    f\"\"\" except '{target_tag}' itself. Do not return any other text before or after the list.\"\"\"\n                    \"\"\"Here are the variables: \"\"\"\n                    f\"\"\"{', '.join([f'{TagUtils.tag_of(data_tags_df, v, \"prepared\")}: [{\", \".join(str(x) for x in data[v].unique().tolist()[:num_samples_per_var])}]' for v in data.columns])}\"\"\",\n                },\n            ]\n\n            reply = (\n                client.chat.completions.create(model=model, messages=messages)\n                .choices[0]\n                .message.content\n            )\n\n            # Log the messages and the reply\n            f.write(f\"{datetime.now()}\\n\")\n            f.write(\"Messages:\\n\")\n            for message in messages:\n                f.write(f\"{message['role']}: {message['content']}\\n\")\n            f.write(\"----------------\\n\")\n            f.write(f\"Reply: {reply}\\n\\n\")\n            f.write(\"================\\n\")\n            f.flush()\n            f.close()\n\n        # Combat hallucinations\n        reply_rows = reply.split(\"\\n\")\n        reply_rows = [row for row in reply_rows if row.strip() != \"\" and row[0].isdigit()]\n        possibly_candidate_tags = [\".\".join(row.split(\".\")[1:]).split(':')[0].strip() for row in reply_rows]\n        candidate_tags = [tag for tag in possibly_candidate_tags if tag in data_tags_df['Tag'].values]\n\n        d = {\n            \"Candidate Tag\": candidate_tags,\n            \"Slope\": [None for _ in range(len(candidate_tags))],\n            \"P-value\": [None for _ in range(len(candidate_tags))],\n        }\n        result_df = pd.DataFrame(d)\n        result_df[\"Target Tag\"] = TagUtils.tag_of(data_tags_df, target_name, \"prepared\")\n        result_df[\"Candidate\"] = result_df[\"Candidate Tag\"].apply(\n            lambda x: TagUtils.name_of(data_tags_df, x.split(':')[0], \"prepared\")\n        )\n        result_df = result_df[CandidateCauseRanker.INTERNAL_COLUMN_ORDER]\n\n        pruned = set(data.columns) - set(result_df[\"Candidate\"]) - set([target_name])\n\n        return result_df, pruned\n</code></pre>"},{"location":"reference/logos/candidate_cause_ranker/#logos.candidate_cause_ranker.CandidateCauseRanker.rank","title":"<code>rank(data, data_tags_df=None, target_name=None, ignore=None, method=CandidateCauseRankerMethod.LOGOS, prune_candidates=True, lasso_alpha=Pruner.LASSO_DEFAULT_ALPHA, lasso_max_iter=Pruner.LASSO_DEFAULT_MAX_ITER, model='gpt-4o-mini-2024-07-18', gpt_log_path=None)</code>  <code>staticmethod</code>","text":"<p>Present the user with candidate causal graph neighbors for <code>target</code>. If no <code>target</code> is specified, the most recent suggestion of <code>suggest_next_exploration()</code> is used, if any. If <code>ignore</code> is specified, the variables in <code>ignore</code> are not considered as candidate causes.</p> <p>Parameters:</p> Name Type Description Default <code>data</code> <code>DataFrame</code> <p>The data based on which to explore candidate causes.</p> required <code>data_tags_df</code> <code>DataFrame</code> <p>A dataframe containing tags for the data.</p> <code>None</code> <code>target_name</code> <code>Optional[str]</code> <p>The name of the target variable.</p> <code>None</code> <code>ignore</code> <code>Optional[list[str]]</code> <p>A list of variables to ignore.</p> <code>None</code> <code>method</code> <code>CandidateCauseRankerMethod</code> <p>The method to use for ranking candidate causes.</p> <code>LOGOS</code> <code>prune_candidates</code> <code>bool</code> <p>Whether to prune the candidate causes using Lasso regression. Only applies if <code>method</code> is <code>CandidateCauseRankerMethod.LOGOS</code>.</p> <code>True</code> <code>lasso_alpha</code> <code>float</code> <p>The alpha parameter to be used for Lasso regression. Only applies if <code>method</code> is <code>CandidateCauseRankerMethod.LOGOS</code> and <code>prune_candidates</code> is True.</p> <code>LASSO_DEFAULT_ALPHA</code> <code>lasso_max_iter</code> <code>int</code> <p>The maximum number of iterations to be used for Lasso regression. Only applies if <code>method</code> is <code>CandidateCauseRankerMethod.LOGOS</code> and <code>prune_candidates</code> is True.</p> <code>LASSO_DEFAULT_MAX_ITER</code> <code>model</code> <code>str</code> <p>The model to use for the langmodel method. Only applies if the method is <code>CandidateCauseRankerMethod.LANGMODEL</code>.</p> <code>'gpt-4o-mini-2024-07-18'</code> <code>gpt_log_path</code> <code>Optional[str]</code> <p>The path to the log file for the prompt and reply. Only applies if the method is <code>CandidateCauseRankerMethod.LANGMODEL</code>.</p> <code>None</code> <p>Returns:</p> Name Type Description <code>results_df</code> <code>DataFrame</code> <p>A dataframe containing the candidate causal graph neighbors for <code>target</code></p> <code>pruned</code> <code>list[str]</code> <p>A list of pruned candidate causes, if any.</p> Source code in <code>src/logos/candidate_cause_ranker.py</code> <pre><code>@staticmethod\ndef rank(\n    data: pd.DataFrame,\n    data_tags_df: pd.DataFrame = None,\n    target_name: Optional[str] = None,\n    ignore: Optional[list[str]] = None,\n    method: CandidateCauseRankerMethod = CandidateCauseRankerMethod.LOGOS,\n    prune_candidates: bool = True,\n    lasso_alpha: float = Pruner.LASSO_DEFAULT_ALPHA,\n    lasso_max_iter: int = Pruner.LASSO_DEFAULT_MAX_ITER,\n    model: str = \"gpt-4o-mini-2024-07-18\",\n    gpt_log_path: Optional[str] = None,\n) -&gt; Tuple[pd.DataFrame, list[str]]:\n    \"\"\"\n    Present the user with candidate causal graph neighbors for `target`. If no `target`\n    is specified, the most recent suggestion of `suggest_next_exploration()` is used, if any.\n    If `ignore` is specified, the variables in `ignore` are not considered as candidate causes.\n\n    Parameters:\n        data: The data based on which to explore candidate causes.\n        data_tags_df: A dataframe containing tags for the data.\n        target_name: The name of the target variable.\n        ignore: A list of variables to ignore.\n        method: The method to use for ranking candidate causes.\n        prune_candidates: Whether to prune the candidate causes using Lasso regression. Only\n            applies if `method` is `CandidateCauseRankerMethod.LOGOS`.\n        lasso_alpha: The alpha parameter to be used for Lasso regression. Only applies if\n            `method` is `CandidateCauseRankerMethod.LOGOS` and `prune_candidates` is True.\n        lasso_max_iter: The maximum number of iterations to be used for Lasso regression. Only\n            applies if `method` is `CandidateCauseRankerMethod.LOGOS` and `prune_candidates` is True.\n        model: The model to use for the langmodel method. Only applies if the method is\n            `CandidateCauseRankerMethod.LANGMODEL`.\n        gpt_log_path: The path to the log file for the prompt and reply. Only applies if the\n            method is `CandidateCauseRankerMethod.LANGMODEL`.\n\n    Returns:\n        results_df: A dataframe containing the candidate causal graph neighbors for `target`\n        pruned: A list of pruned candidate causes, if any.\n    \"\"\"\n    if ignore is None:\n        ignore = []\n    non_ignore = [col for col in data.columns if col not in ignore]\n\n    if method == CandidateCauseRankerMethod.LOGOS:\n        return CandidateCauseRanker._rank_logos(\n            data[non_ignore],\n            data_tags_df,\n            target_name,\n            prune_candidates,\n            lasso_alpha,\n            lasso_max_iter,\n        )\n    elif method == CandidateCauseRankerMethod.REGRESSION:\n        return CandidateCauseRanker._rank_regression(data[non_ignore], data_tags_df, target_name)\n    elif method == CandidateCauseRankerMethod.LANGMODEL:\n        return CandidateCauseRanker._rank_langmodel(\n            data[non_ignore], data_tags_df, target_name, model, gpt_log_path\n        )\n    else:\n        raise ValueError(f\"Unknown method: {method}\")\n</code></pre>"},{"location":"reference/logos/candidate_cause_ranker/#logos.candidate_cause_ranker.CandidateCauseRanker._rank_logos","title":"<code>_rank_logos(data, data_tags_df=None, target_name=None, prune_candidates=True, lasso_alpha=Pruner.LASSO_DEFAULT_ALPHA, lasso_max_iter=Pruner.LASSO_DEFAULT_MAX_ITER)</code>  <code>staticmethod</code>","text":"<p>Implement <code>rank()</code> for the LOGOS method.</p> <p>Parameters:</p> Name Type Description Default <code>data</code> <code>DataFrame</code> <p>The data based on which to explore candidate causes.</p> required <code>data_tags_df</code> <code>DataFrame</code> <p>A dataframe containing tags for the data.</p> <code>None</code> <code>target_name</code> <code>Optional[str]</code> <p>The name of the target variable.</p> <code>None</code> <code>prune_candidates</code> <code>bool</code> <p>Whether to prune the candidate causes using Lasso regression.</p> <code>True</code> <code>lasso_alpha</code> <code>float</code> <p>The alpha parameter to be used for Lasso regression.</p> <code>LASSO_DEFAULT_ALPHA</code> <code>lasso_max_iter</code> <code>int</code> <p>The maximum number of iterations to be used for Lasso regression.</p> <code>LASSO_DEFAULT_MAX_ITER</code> <p>Returns:</p> Name Type Description <code>results_df</code> <code>DataFrame</code> <p>A dataframe containing the candidate causal graph neighbors for <code>target</code></p> <code>pruned</code> <code>list[str]</code> <p>A list of pruned candidate causes, if any.</p> Source code in <code>src/logos/candidate_cause_ranker.py</code> <pre><code>@staticmethod\ndef _rank_logos(\n    data: pd.DataFrame,\n    data_tags_df: pd.DataFrame = None,\n    target_name: Optional[str] = None,\n    prune_candidates: bool = True,\n    lasso_alpha: float = Pruner.LASSO_DEFAULT_ALPHA,\n    lasso_max_iter: int = Pruner.LASSO_DEFAULT_MAX_ITER,\n) -&gt; Tuple[pd.DataFrame, list[str]]:\n    \"\"\"\n    Implement `rank()` for the LOGOS method.\n\n    Parameters:\n        data: The data based on which to explore candidate causes.\n        data_tags_df: A dataframe containing tags for the data.\n        target_name: The name of the target variable.\n        prune_candidates: Whether to prune the candidate causes using Lasso regression.\n        lasso_alpha: The alpha parameter to be used for Lasso regression.\n        lasso_max_iter: The maximum number of iterations to be used for Lasso regression.\n\n    Returns:\n        results_df: A dataframe containing the candidate causal graph neighbors for `target`\n        pruned: A list of pruned candidate causes, if any.\n    \"\"\"\n\n    # Use Lasso to get a pruned list of neighbors\n    candidates = (\n        Pruner.prune_with_lasso(\n            data,\n            [target_name],\n            alpha=lasso_alpha,\n            max_iter=lasso_max_iter,\n        )\n        if prune_candidates\n        else [c for c in data.columns if c != target_name]\n    )\n    Printer.printv(f\"Candidates: {candidates}\")\n\n    # Stop if there are no candidates\n    if len(candidates) == 0:\n        print(\"No candidates found.\")\n        return pd.DataFrame(columns=CandidateCauseRanker.COLUMN_ORDER), pruned\n\n    # For each candidate, calculate the slope and p-value of a linear regression with target (in parallel)\n    num_processors = multiprocessing.cpu_count()\n    with multiprocessing.Pool(processes=num_processors) as pool:\n        results = pool.starmap(\n            Regression.ols,\n            [(col, data[col], data[target_name]) for col in candidates],\n        )\n\n    # Prepare return values.\n    result_df = (\n        pd.DataFrame(results)\n        .sort_values(by=\"P-value\", ascending=True)\n        .reset_index(drop=True)\n    )\n    result_df[\"Target Tag\"] = TagUtils.tag_of(data_tags_df, target_name, \"prepared\")\n    result_df[\"Candidate Tag\"] = result_df[\"Candidate\"].apply(\n        lambda x: TagUtils.tag_of(data_tags_df, x, \"prepared\")\n    )\n    result_df = result_df[CandidateCauseRanker.INTERNAL_COLUMN_ORDER]\n\n    pruned = set(data.columns) - set(candidates) - set([target_name])\n\n    return result_df, pruned\n</code></pre>"},{"location":"reference/logos/candidate_cause_ranker/#logos.candidate_cause_ranker.CandidateCauseRanker._rank_regression","title":"<code>_rank_regression(data, data_tags_df=None, target_name=None)</code>  <code>staticmethod</code>","text":"<p>Implement <code>rank()</code> for the REGRESSION method.</p> <p>Parameters:</p> Name Type Description Default <code>data</code> <code>DataFrame</code> <p>The data based on which to explore candidate causes.</p> required <code>data_tags_df</code> <code>DataFrame</code> <p>A dataframe containing tags for the data.</p> <code>None</code> <code>target_name</code> <code>Optional[str]</code> <p>The name of the target variable.</p> <code>None</code> <p>Returns:</p> Name Type Description <code>results_df</code> <code>DataFrame</code> <p>A dataframe containing the candidate causal graph neighbors for <code>target</code></p> <code>pruned</code> <code>list[str]</code> <p>A list of pruned candidate causes, if any. #TODO: Prune based on cutoff?</p> Source code in <code>src/logos/candidate_cause_ranker.py</code> <pre><code>@staticmethod\ndef _rank_regression(\n    data: pd.DataFrame,\n    data_tags_df: pd.DataFrame = None,\n    target_name: Optional[str] = None,\n) -&gt; Tuple[pd.DataFrame, list[str]]:\n    \"\"\"\n    Implement `rank()` for the REGRESSION method.\n\n    Parameters:\n        data: The data based on which to explore candidate causes.\n        data_tags_df: A dataframe containing tags for the data.\n        target_name: The name of the target variable.\n\n    Returns:\n        results_df: A dataframe containing the candidate causal graph neighbors for `target`\n        pruned: A list of pruned candidate causes, if any. #TODO: Prune based on cutoff?\n    \"\"\"\n\n    candidates = [c for c in data.columns if c != target_name]\n    result_df = Regression.multi_ols(\n        candidates, data[candidates], data[target_name]\n    )\n    result_df = (\n        result_df.sort_values(by=\"Absolute Normalized Slope\", ascending=False)\n        .drop(columns=[\"Normalized Slope\", \"Absolute Normalized Slope\"])\n        .reset_index(drop=True)\n    )\n\n    result_df[\"Target Tag\"] = TagUtils.tag_of(data_tags_df, target_name, \"prepared\")\n    result_df[\"Candidate Tag\"] = result_df[\"Candidate\"].apply(\n        lambda x: TagUtils.tag_of(data_tags_df, x, \"prepared\")\n    )\n    result_df = result_df[CandidateCauseRanker.INTERNAL_COLUMN_ORDER]\n\n    return result_df, []\n</code></pre>"},{"location":"reference/logos/candidate_cause_ranker/#logos.candidate_cause_ranker.CandidateCauseRanker._rank_langmodel","title":"<code>_rank_langmodel(data, data_tags_df=None, target_name=None, model='gpt-4o-mini-2024-07-18', gpt_log_path=None)</code>  <code>staticmethod</code>","text":"<p>Implement <code>rank()</code> for the LANGMODEL method.</p> <p>Parameters:</p> Name Type Description Default <code>data</code> <code>DataFrame</code> <p>The data based on which to explore candidate causes.</p> required <code>data_tags_df</code> <code>DataFrame</code> <p>A dataframe containing tags for the data.</p> <code>None</code> <code>target_name</code> <code>Optional[str]</code> <p>The name of the target variable.</p> <code>None</code> <code>model</code> <code>str</code> <p>The model to use for the langmodel method.</p> <code>'gpt-4o-mini-2024-07-18'</code> <code>gpt_log_path</code> <code>Optional[str]</code> <p>The path to the log file for the prompt and reply.</p> <code>None</code> <p>Returns:</p> Name Type Description <code>results_df</code> <code>DataFrame</code> <p>A dataframe containing the candidate causal graph neighbors for <code>target</code></p> <code>pruned</code> <code>list[str]</code> <p>A list of pruned candidate causes, if any.</p> Source code in <code>src/logos/candidate_cause_ranker.py</code> <pre><code>@staticmethod\ndef _rank_langmodel(\n    data: pd.DataFrame,\n    data_tags_df: pd.DataFrame = None,\n    target_name: Optional[str] = None,\n    model: str = \"gpt-4o-mini-2024-07-18\",\n    gpt_log_path: Optional[str] = None,\n) -&gt; Tuple[pd.DataFrame, list[str]]:\n    \"\"\"\n    Implement `rank()` for the LANGMODEL method.\n\n    Parameters:\n        data: The data based on which to explore candidate causes.\n        data_tags_df: A dataframe containing tags for the data.\n        target_name: The name of the target variable.\n        model: The model to use for the langmodel method.\n        gpt_log_path: The path to the log file for the prompt and reply.\n\n    Returns:\n        results_df: A dataframe containing the candidate causal graph neighbors for `target`\n        pruned: A list of pruned candidate causes, if any.\n    \"\"\"\n\n    client = OpenAI()\n\n    target_tag = TagUtils.tag_of(data_tags_df, target_name, \"prepared\")\n    num_samples_per_var = 3\n\n    if gpt_log_path == None:\n        gpt_log_path = f\"ranker-gpt-{datetime.now().strftime('%Y-%m-%d-%H-%M-%S')}.log\"\n    with open(gpt_log_path, \"w+\") as f:\n\n        # Define the messages to send to the model\n        messages = [\n            {\n                \"role\": \"system\",\n                \"content\": \"You are a helpful assistant for causal reasoning.\",\n            },\n            {\n                \"role\": \"user\",\n                \"content\": f\"\"\"Below is a list of variable names and some example distinct values for each. \"\"\"\n                f\"\"\"The lists are not sorted in compatible ways, so that elements in the same position may not correspond to the same entity. \"\"\"\n                f\"\"\"I want you to assess the likelihood of each of these variables as a cause for variable '{target_tag}' and return them as a ranked list. \"\"\"\n                \"\"\"I understand that you may think this is speculative, but I want you to do your best to come up with such a list ALWAYS. \"\"\"\n                \"\"\"I will interpret any results you give me knowing that you may not be sure about them. \"\"\"\n                \"\"\"Only return the ranked answers, one per line, preceded by a number and a period. Rank as many of the given variables as you see fit,\"\"\"\n                f\"\"\" except '{target_tag}' itself. Do not return any other text before or after the list.\"\"\"\n                \"\"\"Here are the variables: \"\"\"\n                f\"\"\"{', '.join([f'{TagUtils.tag_of(data_tags_df, v, \"prepared\")}: [{\", \".join(str(x) for x in data[v].unique().tolist()[:num_samples_per_var])}]' for v in data.columns])}\"\"\",\n            },\n        ]\n\n        reply = (\n            client.chat.completions.create(model=model, messages=messages)\n            .choices[0]\n            .message.content\n        )\n\n        # Log the messages and the reply\n        f.write(f\"{datetime.now()}\\n\")\n        f.write(\"Messages:\\n\")\n        for message in messages:\n            f.write(f\"{message['role']}: {message['content']}\\n\")\n        f.write(\"----------------\\n\")\n        f.write(f\"Reply: {reply}\\n\\n\")\n        f.write(\"================\\n\")\n        f.flush()\n        f.close()\n\n    # Combat hallucinations\n    reply_rows = reply.split(\"\\n\")\n    reply_rows = [row for row in reply_rows if row.strip() != \"\" and row[0].isdigit()]\n    possibly_candidate_tags = [\".\".join(row.split(\".\")[1:]).split(':')[0].strip() for row in reply_rows]\n    candidate_tags = [tag for tag in possibly_candidate_tags if tag in data_tags_df['Tag'].values]\n\n    d = {\n        \"Candidate Tag\": candidate_tags,\n        \"Slope\": [None for _ in range(len(candidate_tags))],\n        \"P-value\": [None for _ in range(len(candidate_tags))],\n    }\n    result_df = pd.DataFrame(d)\n    result_df[\"Target Tag\"] = TagUtils.tag_of(data_tags_df, target_name, \"prepared\")\n    result_df[\"Candidate\"] = result_df[\"Candidate Tag\"].apply(\n        lambda x: TagUtils.name_of(data_tags_df, x.split(':')[0], \"prepared\")\n    )\n    result_df = result_df[CandidateCauseRanker.INTERNAL_COLUMN_ORDER]\n\n    pruned = set(data.columns) - set(result_df[\"Candidate\"]) - set([target_name])\n\n    return result_df, pruned\n</code></pre>"},{"location":"reference/logos/causal_discoverer/","title":"CausalDiscoverer","text":""},{"location":"reference/logos/causal_discoverer/#logos.causal_discoverer.CausalDiscoverer","title":"<code>CausalDiscoverer</code>","text":"<p>Provides various methods for automatic causal discovery based on a dataframe.</p> <p>Within LOGos, the expectation is that the passed dataframe will contain the prepared variables.</p> Source code in <code>src/logos/causal_discoverer.py</code> <pre><code>class CausalDiscoverer:\n    \"\"\"\n    Provides various methods for automatic causal discovery based on a dataframe.\n\n    Within LOGos, the expectation is that the passed dataframe will contain the prepared variables.\n    \"\"\"\n\n    @staticmethod\n    def _pgmpy_dag_to_digraph(dag: DAG) -&gt; nx.DiGraph:\n        \"\"\"\n        Converts a pgmpy DAG to a networkx DiGraph.\n\n        Parameters:\n            dag: The pgmpy DAG.\n\n        Returns:\n            The networkx DiGraph.\n        \"\"\"\n\n        return nx.DiGraph(dag.edges())\n\n    @staticmethod\n    def pc(df: pd.DataFrame, max_cond_vars: int = 3) -&gt; nx.DiGraph:\n        \"\"\"\n        Runs the PC algorithm on a dataframe.\n\n        Parameters:\n            df: The dataframe on which to run the PC algorithm.\n            max_cond_vars: The maximum number of conditioning variables to use.\n\n        Returns:\n            The causal graph learned by the PC algorithm.\n        \"\"\"\n\n        pc = PC(data=df)\n        model = pc.estimate(variant=\"parallel\", max_cond_vars=max_cond_vars)\n        return CausalDiscoverer._pgmpy_dag_to_digraph(model)\n\n    @staticmethod\n    def hill_climb(df: pd.DataFrame) -&gt; nx.DiGraph:\n        \"\"\"\n        Runs the hill climb algorithm on a dataframe.\n\n        Parameters:\n            df: The dataframe on which to run the hill climb algorithm.\n\n        Returns:\n            The causal graph learned by the hill climb algorithm.\n        \"\"\"\n\n        scoring_method = K2Score(data=df)\n        hcs = HillClimbSearch(data=df)\n        model = hcs.estimate(\n            scoring_method=scoring_method, max_indegree=4, max_iter=int(1e4)\n        )\n        return CausalDiscoverer._pgmpy_dag_to_digraph(model)\n\n    @staticmethod\n    def exhaustive(df: pd.DataFrame) -&gt; nx.DiGraph:\n        \"\"\"\n        Runs the exhaustive search algorithm on a dataframe.\n\n        Parameters:\n            df: The dataframe on which to run the exhaustive search algorithm.\n\n        Returns:\n            The causal graph learned by the exhaustive search algorithm.\n        \"\"\"\n\n        scoring_method = K2Score(data=df)\n        exh = ExhaustiveSearch(data=df, complete_samples_only=False)\n        model = exh.estimate()\n        return CausalDiscoverer._pgmpy_dag_to_digraph(model)\n\n    @staticmethod\n    def gpt(\n        data_df: pd.DataFrame,\n        model: str = \"gpt-3.5-turbo\",\n        vars_df: Optional[pd.DataFrame] = None,\n    ) -&gt; nx.DiGraph:\n        \"\"\"\n        Consults GPT to determine the causal graph of the variables in the dataframe.\n\n        Parameters:\n            data_df: The dataframe based on which to construct a causal graph.\n            model: The GPT model to use.\n            vars_df: The dataframe containing the variable names and tags.\n\n        Returns:\n            The causal graph learned by consulting GPT.\n        \"\"\"\n\n        # Open a file for logging, with the model and the timestamp in the name\n        log_file = open(\n            f\"/../../evaluation/gpt-logs/{model}-{datetime.now().strftime('%Y-%m-%d-%H-%M-%S')}.txt\",\n            \"w\",\n        )\n\n        client = OpenAI()\n        graph = nx.DiGraph()\n\n        for i in tqdm(\n            range(len(data_df.columns)), desc=\"Outer edge-finding loop using GPT...\"\n        ):\n            for j in range(i + 1, len(data_df.columns)):\n                var_a = data_df.columns[i]\n                var_b = data_df.columns[j]\n\n                example_rows = data_df[[var_a, var_b]].dropna().sample(3)\n                examples_a = \", \".join(str(x) for x in example_rows[var_a].tolist())\n                examples_b = \", \".join(str(x) for x in example_rows[var_b].tolist())\n\n                tag_a = (\n                    var_a\n                    if vars_df is None\n                    else TagUtils.get_tag(vars_df, var_a, \"prepared\")\n                )\n                tag_b = (\n                    var_b\n                    if vars_df is None\n                    else TagUtils.get_tag(vars_df, var_b, \"prepared\")\n                )\n\n                # Define the messages to send to the model\n                messages = [\n                    {\n                        \"role\": \"system\",\n                        \"content\": \"You are a helpful assistant for causal reasoning.\",\n                    },\n                    {\n                        \"role\": \"user\",\n                        \"content\": f\"\"\"Which cause-and-effect relationship is more likely? \"\"\"\n                        f\"\"\"A. changing {tag_a} causes a change in {tag_b}. \"\"\"\n                        f\"\"\"B. changing {tag_b} causes a change in {tag_a}. \"\"\"\n                        f\"\"\"C. Neither of the two. \"\"\"\n                        f\"\"\" Here are some example values of {tag_a} : [{examples_a}]\"\"\"\n                        f\"\"\" Here are the corresponding values of {tag_b} : [{examples_b}]\"\"\"\n                        \"\"\"Let's work this out in a step by step way to be sure that we have the right answer. \"\"\"\n                        \"\"\"Then provide your \ufb01nal answer within the tags &lt;Answer&gt;A/B/C&lt;/Answer&gt;.\"\"\",\n                    },\n                ]\n\n                reply = (\n                    client.chat.completions.create(model=model, messages=messages)\n                    .choices[0]\n                    .message.content\n                )\n\n                # Log the messages and the reply\n                log_file.write(f\"{datetime.now()}\\n\")\n                log_file.write(\"Messages:\\n\")\n                for message in messages:\n                    log_file.write(f\"{message['role']}: {message['content']}\\n\")\n                log_file.write(\"----------------\\n\")\n                log_file.write(f\"Reply: {reply}\\n\\n\")\n                log_file.write(\"================\\n\")\n                log_file.flush()\n\n                # Find the part of the reply that contains the answer\n                start_idx = reply.find(\"&lt;Answer&gt;\") + len(\"&lt;Answer&gt;\")\n                end_idx = reply.find(\"&lt;/Answer&gt;\")\n                answer = reply[start_idx:end_idx]\n\n                # Add the edge to the graph\n                if answer == \"A\":\n                    graph.add_edge(var_a, var_b)\n                elif answer == \"B\":\n                    graph.add_edge(var_b, var_a)\n        log_file.close()\n        return graph\n</code></pre>"},{"location":"reference/logos/causal_discoverer/#logos.causal_discoverer.CausalDiscoverer._pgmpy_dag_to_digraph","title":"<code>_pgmpy_dag_to_digraph(dag)</code>  <code>staticmethod</code>","text":"<p>Converts a pgmpy DAG to a networkx DiGraph.</p> <p>Parameters:</p> Name Type Description Default <code>dag</code> <code>DAG</code> <p>The pgmpy DAG.</p> required <p>Returns:</p> Type Description <code>DiGraph</code> <p>The networkx DiGraph.</p> Source code in <code>src/logos/causal_discoverer.py</code> <pre><code>@staticmethod\ndef _pgmpy_dag_to_digraph(dag: DAG) -&gt; nx.DiGraph:\n    \"\"\"\n    Converts a pgmpy DAG to a networkx DiGraph.\n\n    Parameters:\n        dag: The pgmpy DAG.\n\n    Returns:\n        The networkx DiGraph.\n    \"\"\"\n\n    return nx.DiGraph(dag.edges())\n</code></pre>"},{"location":"reference/logos/causal_discoverer/#logos.causal_discoverer.CausalDiscoverer.pc","title":"<code>pc(df, max_cond_vars=3)</code>  <code>staticmethod</code>","text":"<p>Runs the PC algorithm on a dataframe.</p> <p>Parameters:</p> Name Type Description Default <code>df</code> <code>DataFrame</code> <p>The dataframe on which to run the PC algorithm.</p> required <code>max_cond_vars</code> <code>int</code> <p>The maximum number of conditioning variables to use.</p> <code>3</code> <p>Returns:</p> Type Description <code>DiGraph</code> <p>The causal graph learned by the PC algorithm.</p> Source code in <code>src/logos/causal_discoverer.py</code> <pre><code>@staticmethod\ndef pc(df: pd.DataFrame, max_cond_vars: int = 3) -&gt; nx.DiGraph:\n    \"\"\"\n    Runs the PC algorithm on a dataframe.\n\n    Parameters:\n        df: The dataframe on which to run the PC algorithm.\n        max_cond_vars: The maximum number of conditioning variables to use.\n\n    Returns:\n        The causal graph learned by the PC algorithm.\n    \"\"\"\n\n    pc = PC(data=df)\n    model = pc.estimate(variant=\"parallel\", max_cond_vars=max_cond_vars)\n    return CausalDiscoverer._pgmpy_dag_to_digraph(model)\n</code></pre>"},{"location":"reference/logos/causal_discoverer/#logos.causal_discoverer.CausalDiscoverer.hill_climb","title":"<code>hill_climb(df)</code>  <code>staticmethod</code>","text":"<p>Runs the hill climb algorithm on a dataframe.</p> <p>Parameters:</p> Name Type Description Default <code>df</code> <code>DataFrame</code> <p>The dataframe on which to run the hill climb algorithm.</p> required <p>Returns:</p> Type Description <code>DiGraph</code> <p>The causal graph learned by the hill climb algorithm.</p> Source code in <code>src/logos/causal_discoverer.py</code> <pre><code>@staticmethod\ndef hill_climb(df: pd.DataFrame) -&gt; nx.DiGraph:\n    \"\"\"\n    Runs the hill climb algorithm on a dataframe.\n\n    Parameters:\n        df: The dataframe on which to run the hill climb algorithm.\n\n    Returns:\n        The causal graph learned by the hill climb algorithm.\n    \"\"\"\n\n    scoring_method = K2Score(data=df)\n    hcs = HillClimbSearch(data=df)\n    model = hcs.estimate(\n        scoring_method=scoring_method, max_indegree=4, max_iter=int(1e4)\n    )\n    return CausalDiscoverer._pgmpy_dag_to_digraph(model)\n</code></pre>"},{"location":"reference/logos/causal_discoverer/#logos.causal_discoverer.CausalDiscoverer.exhaustive","title":"<code>exhaustive(df)</code>  <code>staticmethod</code>","text":"<p>Runs the exhaustive search algorithm on a dataframe.</p> <p>Parameters:</p> Name Type Description Default <code>df</code> <code>DataFrame</code> <p>The dataframe on which to run the exhaustive search algorithm.</p> required <p>Returns:</p> Type Description <code>DiGraph</code> <p>The causal graph learned by the exhaustive search algorithm.</p> Source code in <code>src/logos/causal_discoverer.py</code> <pre><code>@staticmethod\ndef exhaustive(df: pd.DataFrame) -&gt; nx.DiGraph:\n    \"\"\"\n    Runs the exhaustive search algorithm on a dataframe.\n\n    Parameters:\n        df: The dataframe on which to run the exhaustive search algorithm.\n\n    Returns:\n        The causal graph learned by the exhaustive search algorithm.\n    \"\"\"\n\n    scoring_method = K2Score(data=df)\n    exh = ExhaustiveSearch(data=df, complete_samples_only=False)\n    model = exh.estimate()\n    return CausalDiscoverer._pgmpy_dag_to_digraph(model)\n</code></pre>"},{"location":"reference/logos/causal_discoverer/#logos.causal_discoverer.CausalDiscoverer.gpt","title":"<code>gpt(data_df, model='gpt-3.5-turbo', vars_df=None)</code>  <code>staticmethod</code>","text":"<p>Consults GPT to determine the causal graph of the variables in the dataframe.</p> <p>Parameters:</p> Name Type Description Default <code>data_df</code> <code>DataFrame</code> <p>The dataframe based on which to construct a causal graph.</p> required <code>model</code> <code>str</code> <p>The GPT model to use.</p> <code>'gpt-3.5-turbo'</code> <code>vars_df</code> <code>Optional[DataFrame]</code> <p>The dataframe containing the variable names and tags.</p> <code>None</code> <p>Returns:</p> Type Description <code>DiGraph</code> <p>The causal graph learned by consulting GPT.</p> Source code in <code>src/logos/causal_discoverer.py</code> <pre><code>@staticmethod\ndef gpt(\n    data_df: pd.DataFrame,\n    model: str = \"gpt-3.5-turbo\",\n    vars_df: Optional[pd.DataFrame] = None,\n) -&gt; nx.DiGraph:\n    \"\"\"\n    Consults GPT to determine the causal graph of the variables in the dataframe.\n\n    Parameters:\n        data_df: The dataframe based on which to construct a causal graph.\n        model: The GPT model to use.\n        vars_df: The dataframe containing the variable names and tags.\n\n    Returns:\n        The causal graph learned by consulting GPT.\n    \"\"\"\n\n    # Open a file for logging, with the model and the timestamp in the name\n    log_file = open(\n        f\"/../../evaluation/gpt-logs/{model}-{datetime.now().strftime('%Y-%m-%d-%H-%M-%S')}.txt\",\n        \"w\",\n    )\n\n    client = OpenAI()\n    graph = nx.DiGraph()\n\n    for i in tqdm(\n        range(len(data_df.columns)), desc=\"Outer edge-finding loop using GPT...\"\n    ):\n        for j in range(i + 1, len(data_df.columns)):\n            var_a = data_df.columns[i]\n            var_b = data_df.columns[j]\n\n            example_rows = data_df[[var_a, var_b]].dropna().sample(3)\n            examples_a = \", \".join(str(x) for x in example_rows[var_a].tolist())\n            examples_b = \", \".join(str(x) for x in example_rows[var_b].tolist())\n\n            tag_a = (\n                var_a\n                if vars_df is None\n                else TagUtils.get_tag(vars_df, var_a, \"prepared\")\n            )\n            tag_b = (\n                var_b\n                if vars_df is None\n                else TagUtils.get_tag(vars_df, var_b, \"prepared\")\n            )\n\n            # Define the messages to send to the model\n            messages = [\n                {\n                    \"role\": \"system\",\n                    \"content\": \"You are a helpful assistant for causal reasoning.\",\n                },\n                {\n                    \"role\": \"user\",\n                    \"content\": f\"\"\"Which cause-and-effect relationship is more likely? \"\"\"\n                    f\"\"\"A. changing {tag_a} causes a change in {tag_b}. \"\"\"\n                    f\"\"\"B. changing {tag_b} causes a change in {tag_a}. \"\"\"\n                    f\"\"\"C. Neither of the two. \"\"\"\n                    f\"\"\" Here are some example values of {tag_a} : [{examples_a}]\"\"\"\n                    f\"\"\" Here are the corresponding values of {tag_b} : [{examples_b}]\"\"\"\n                    \"\"\"Let's work this out in a step by step way to be sure that we have the right answer. \"\"\"\n                    \"\"\"Then provide your \ufb01nal answer within the tags &lt;Answer&gt;A/B/C&lt;/Answer&gt;.\"\"\",\n                },\n            ]\n\n            reply = (\n                client.chat.completions.create(model=model, messages=messages)\n                .choices[0]\n                .message.content\n            )\n\n            # Log the messages and the reply\n            log_file.write(f\"{datetime.now()}\\n\")\n            log_file.write(\"Messages:\\n\")\n            for message in messages:\n                log_file.write(f\"{message['role']}: {message['content']}\\n\")\n            log_file.write(\"----------------\\n\")\n            log_file.write(f\"Reply: {reply}\\n\\n\")\n            log_file.write(\"================\\n\")\n            log_file.flush()\n\n            # Find the part of the reply that contains the answer\n            start_idx = reply.find(\"&lt;Answer&gt;\") + len(\"&lt;Answer&gt;\")\n            end_idx = reply.find(\"&lt;/Answer&gt;\")\n            answer = reply[start_idx:end_idx]\n\n            # Add the edge to the graph\n            if answer == \"A\":\n                graph.add_edge(var_a, var_b)\n            elif answer == \"B\":\n                graph.add_edge(var_b, var_a)\n    log_file.close()\n    return graph\n</code></pre>"},{"location":"reference/logos/causal_unit_suggester/","title":"CausalUnitSuggester","text":""},{"location":"reference/logos/causal_unit_suggester/#logos.causal_unit_suggester.CausalUnitSuggester","title":"<code>CausalUnitSuggester</code>","text":"<p>This class is responsible for suggesting causal units to the user.</p> Source code in <code>src/logos/causal_unit_suggester.py</code> <pre><code>class CausalUnitSuggester:\n    \"\"\"\n    This class is responsible for suggesting causal units to the user.\n    \"\"\"\n\n    @staticmethod\n    def _discretize(col: pd.Series, col_type: str, bins: int = 0) -&gt; pd.Series:\n        \"\"\"\n        Discretize an unsorted `col` based on its type. If `col_type` is 'num', then\n        return labels for each of `bins` equi-depth bins. If `col_type` is 'str,\n        then return a unique label for each unique value. Nulls in `col` are assigned\n        to bin -1.\n\n        Parameters:\n            col: The column to discretize.\n            col_type: The type of the column.\n            bins: The number of bins to use when discretizing the column.\n\n        Returns:\n            A vector of length len(`col`) with the labels of each value in `col`.\n        \"\"\"\n        if col_type == \"num\":\n            return (\n                pd.qcut(col, bins, labels=False, duplicates=\"drop\")\n                .fillna(-1)\n                .astype(int)\n            )\n        elif col_type == \"str\":\n            return pd.factorize(col, use_na_sentinel=True)[0]\n        else:\n            raise ValueError(f\"Unknown column type: {col_type}\")\n\n    @staticmethod\n    def _get_all_discretizations(\n        col: pd.Series, col_type: str, k: int\n    ) -&gt; list[pd.Series]:\n        \"\"\"\n        Return a list of all possible discretizations of `col` based on its type.\n        If `col_type` is 'num', then return discretizations with `k`, `2k` and `10k` bins.\n        If `col_type` is 'str', then return a discretization with a unique label for\n        each unique value in `col`.\n\n        Parameters:\n            col: The column to discretize.\n            col_type: The type of the column.\n            k: A parameter indirectly controlling the number of bins to use when discretizing\n                a numeric column (see above).\n\n        Returns:\n            A list of all desired discretizations of `col`.\n        \"\"\"\n\n        if col_type == \"num\":\n            l = []\n            if len(col) &gt;= k:\n                l.append(CausalUnitSuggester._discretize(col, col_type, k))\n            if len(col) &gt;= 2 * k:\n                l.append(CausalUnitSuggester._discretize(col, col_type, 2 * k))\n            if len(col) &gt;= 10 * k:\n                l.append(CausalUnitSuggester._discretize(col, col_type, 10 * k))\n            return l\n        elif col_type == \"str\":\n            return [CausalUnitSuggester._discretize(col, col_type)]\n        else:\n            raise ValueError(f\"Unknown column type: {col_type}\")\n\n    @staticmethod\n    def _calculate_IUS(df: pd.DataFrame, discretization: pd.Series) -&gt; float:\n        \"\"\"\n        Calculate the Information Utilization Score of `df` if each row belongs\n        to the causal unit specified by `discretization`. The unit labelled -1\n        contails rows with null value for the causal unit column, so the corresponding\n        rows in `df` are ignored.\n\n        Parameters:\n            df: The DataFrame to calculate the Information Utilization Score of.\n            discretization: The causal unit of each row.\n\n        Returns:\n            The Information Utilization Score of `df`.\n        \"\"\"\n\n        grouped = df.groupby(discretization)  # TODO: handle nulls\n        ius = 0\n\n        for group_id, group_data in grouped:\n            if group_id == -1:\n                continue\n            columns_with_non_nulls = group_data.notna().any(axis=0).sum()\n            ius += columns_with_non_nulls * len(group_data)\n\n        return ius / (len(df.columns) * len(df))\n\n    @staticmethod\n    def suggest_causal_unit_defs(\n        data_df: pd.DataFrame,\n        var_df: pd.DataFrame,\n        min_causal_units: int = 4,\n        num_suggestions: int = 10,\n    ) -&gt; Optional[pd.DataFrame]:\n        \"\"\"\n        Suggest at most `num_suggestions` causal unit definitions for `data_df` based on ius\n        maximization, while returning at least `min_causal_units` causal units. `var_df` provides\n        information on the type of each variable.\n\n        Parameters:\n            data_df: The DataFrame to suggest causal unit definitions for.\n            var_df: A DataFrame with one row for each variable in `data_df` that includes variable type information.\n            min_causal_units: The minimum number of causal units that a suggested definition should create.\n            num_suggestions: The maximum number of causal unit definitions to suggest.\n\n        Returns:\n            A DataFrame with one row for each suggested causal unit definition, or `None` if no suggestions were made.\n        \"\"\"\n\n        list_of_suggestions = []\n\n        for col in data_df.columns:\n            discretizations = CausalUnitSuggester._get_all_discretizations(\n                data_df[col],\n                var_df[var_df[\"Name\"] == col][\"Type\"].values[0],\n                k=min_causal_units,\n            )\n            for disc in discretizations:\n                # Ensure that the unique values in disc, excluding -1 if it exists, are at least min_causal_units\n                if disc.max() &gt;= (min_causal_units - 1):\n                    list_of_suggestions.append(\n                        {\n                            \"Variable\": col,\n                            \"Type\": var_df[var_df[\"Name\"] == col][\"Type\"].values[0],\n                            \"Num Units\": disc.max() + 1,\n                            \"IUS\": CausalUnitSuggester._calculate_IUS(data_df, disc),\n                        }\n                    )\n\n        df_of_suggestions = pd.DataFrame(list_of_suggestions)\n        if len(df_of_suggestions) == 0:\n            return None\n        return df_of_suggestions.sort_values(by=[\"IUS\"], ascending=False).head(\n            num_suggestions\n        )\n</code></pre>"},{"location":"reference/logos/causal_unit_suggester/#logos.causal_unit_suggester.CausalUnitSuggester._discretize","title":"<code>_discretize(col, col_type, bins=0)</code>  <code>staticmethod</code>","text":"<p>Discretize an unsorted <code>col</code> based on its type. If <code>col_type</code> is 'num', then return labels for each of <code>bins</code> equi-depth bins. If <code>col_type</code> is 'str, then return a unique label for each unique value. Nulls in <code>col</code> are assigned to bin -1.</p> <p>Parameters:</p> Name Type Description Default <code>col</code> <code>Series</code> <p>The column to discretize.</p> required <code>col_type</code> <code>str</code> <p>The type of the column.</p> required <code>bins</code> <code>int</code> <p>The number of bins to use when discretizing the column.</p> <code>0</code> <p>Returns:</p> Type Description <code>Series</code> <p>A vector of length len(<code>col</code>) with the labels of each value in <code>col</code>.</p> Source code in <code>src/logos/causal_unit_suggester.py</code> <pre><code>@staticmethod\ndef _discretize(col: pd.Series, col_type: str, bins: int = 0) -&gt; pd.Series:\n    \"\"\"\n    Discretize an unsorted `col` based on its type. If `col_type` is 'num', then\n    return labels for each of `bins` equi-depth bins. If `col_type` is 'str,\n    then return a unique label for each unique value. Nulls in `col` are assigned\n    to bin -1.\n\n    Parameters:\n        col: The column to discretize.\n        col_type: The type of the column.\n        bins: The number of bins to use when discretizing the column.\n\n    Returns:\n        A vector of length len(`col`) with the labels of each value in `col`.\n    \"\"\"\n    if col_type == \"num\":\n        return (\n            pd.qcut(col, bins, labels=False, duplicates=\"drop\")\n            .fillna(-1)\n            .astype(int)\n        )\n    elif col_type == \"str\":\n        return pd.factorize(col, use_na_sentinel=True)[0]\n    else:\n        raise ValueError(f\"Unknown column type: {col_type}\")\n</code></pre>"},{"location":"reference/logos/causal_unit_suggester/#logos.causal_unit_suggester.CausalUnitSuggester._get_all_discretizations","title":"<code>_get_all_discretizations(col, col_type, k)</code>  <code>staticmethod</code>","text":"<p>Return a list of all possible discretizations of <code>col</code> based on its type. If <code>col_type</code> is 'num', then return discretizations with <code>k</code>, <code>2k</code> and <code>10k</code> bins. If <code>col_type</code> is 'str', then return a discretization with a unique label for each unique value in <code>col</code>.</p> <p>Parameters:</p> Name Type Description Default <code>col</code> <code>Series</code> <p>The column to discretize.</p> required <code>col_type</code> <code>str</code> <p>The type of the column.</p> required <code>k</code> <code>int</code> <p>A parameter indirectly controlling the number of bins to use when discretizing a numeric column (see above).</p> required <p>Returns:</p> Type Description <code>list[Series]</code> <p>A list of all desired discretizations of <code>col</code>.</p> Source code in <code>src/logos/causal_unit_suggester.py</code> <pre><code>@staticmethod\ndef _get_all_discretizations(\n    col: pd.Series, col_type: str, k: int\n) -&gt; list[pd.Series]:\n    \"\"\"\n    Return a list of all possible discretizations of `col` based on its type.\n    If `col_type` is 'num', then return discretizations with `k`, `2k` and `10k` bins.\n    If `col_type` is 'str', then return a discretization with a unique label for\n    each unique value in `col`.\n\n    Parameters:\n        col: The column to discretize.\n        col_type: The type of the column.\n        k: A parameter indirectly controlling the number of bins to use when discretizing\n            a numeric column (see above).\n\n    Returns:\n        A list of all desired discretizations of `col`.\n    \"\"\"\n\n    if col_type == \"num\":\n        l = []\n        if len(col) &gt;= k:\n            l.append(CausalUnitSuggester._discretize(col, col_type, k))\n        if len(col) &gt;= 2 * k:\n            l.append(CausalUnitSuggester._discretize(col, col_type, 2 * k))\n        if len(col) &gt;= 10 * k:\n            l.append(CausalUnitSuggester._discretize(col, col_type, 10 * k))\n        return l\n    elif col_type == \"str\":\n        return [CausalUnitSuggester._discretize(col, col_type)]\n    else:\n        raise ValueError(f\"Unknown column type: {col_type}\")\n</code></pre>"},{"location":"reference/logos/causal_unit_suggester/#logos.causal_unit_suggester.CausalUnitSuggester._calculate_IUS","title":"<code>_calculate_IUS(df, discretization)</code>  <code>staticmethod</code>","text":"<p>Calculate the Information Utilization Score of <code>df</code> if each row belongs to the causal unit specified by <code>discretization</code>. The unit labelled -1 contails rows with null value for the causal unit column, so the corresponding rows in <code>df</code> are ignored.</p> <p>Parameters:</p> Name Type Description Default <code>df</code> <code>DataFrame</code> <p>The DataFrame to calculate the Information Utilization Score of.</p> required <code>discretization</code> <code>Series</code> <p>The causal unit of each row.</p> required <p>Returns:</p> Type Description <code>float</code> <p>The Information Utilization Score of <code>df</code>.</p> Source code in <code>src/logos/causal_unit_suggester.py</code> <pre><code>@staticmethod\ndef _calculate_IUS(df: pd.DataFrame, discretization: pd.Series) -&gt; float:\n    \"\"\"\n    Calculate the Information Utilization Score of `df` if each row belongs\n    to the causal unit specified by `discretization`. The unit labelled -1\n    contails rows with null value for the causal unit column, so the corresponding\n    rows in `df` are ignored.\n\n    Parameters:\n        df: The DataFrame to calculate the Information Utilization Score of.\n        discretization: The causal unit of each row.\n\n    Returns:\n        The Information Utilization Score of `df`.\n    \"\"\"\n\n    grouped = df.groupby(discretization)  # TODO: handle nulls\n    ius = 0\n\n    for group_id, group_data in grouped:\n        if group_id == -1:\n            continue\n        columns_with_non_nulls = group_data.notna().any(axis=0).sum()\n        ius += columns_with_non_nulls * len(group_data)\n\n    return ius / (len(df.columns) * len(df))\n</code></pre>"},{"location":"reference/logos/causal_unit_suggester/#logos.causal_unit_suggester.CausalUnitSuggester.suggest_causal_unit_defs","title":"<code>suggest_causal_unit_defs(data_df, var_df, min_causal_units=4, num_suggestions=10)</code>  <code>staticmethod</code>","text":"<p>Suggest at most <code>num_suggestions</code> causal unit definitions for <code>data_df</code> based on ius maximization, while returning at least <code>min_causal_units</code> causal units. <code>var_df</code> provides information on the type of each variable.</p> <p>Parameters:</p> Name Type Description Default <code>data_df</code> <code>DataFrame</code> <p>The DataFrame to suggest causal unit definitions for.</p> required <code>var_df</code> <code>DataFrame</code> <p>A DataFrame with one row for each variable in <code>data_df</code> that includes variable type information.</p> required <code>min_causal_units</code> <code>int</code> <p>The minimum number of causal units that a suggested definition should create.</p> <code>4</code> <code>num_suggestions</code> <code>int</code> <p>The maximum number of causal unit definitions to suggest.</p> <code>10</code> <p>Returns:</p> Type Description <code>Optional[DataFrame]</code> <p>A DataFrame with one row for each suggested causal unit definition, or <code>None</code> if no suggestions were made.</p> Source code in <code>src/logos/causal_unit_suggester.py</code> <pre><code>@staticmethod\ndef suggest_causal_unit_defs(\n    data_df: pd.DataFrame,\n    var_df: pd.DataFrame,\n    min_causal_units: int = 4,\n    num_suggestions: int = 10,\n) -&gt; Optional[pd.DataFrame]:\n    \"\"\"\n    Suggest at most `num_suggestions` causal unit definitions for `data_df` based on ius\n    maximization, while returning at least `min_causal_units` causal units. `var_df` provides\n    information on the type of each variable.\n\n    Parameters:\n        data_df: The DataFrame to suggest causal unit definitions for.\n        var_df: A DataFrame with one row for each variable in `data_df` that includes variable type information.\n        min_causal_units: The minimum number of causal units that a suggested definition should create.\n        num_suggestions: The maximum number of causal unit definitions to suggest.\n\n    Returns:\n        A DataFrame with one row for each suggested causal unit definition, or `None` if no suggestions were made.\n    \"\"\"\n\n    list_of_suggestions = []\n\n    for col in data_df.columns:\n        discretizations = CausalUnitSuggester._get_all_discretizations(\n            data_df[col],\n            var_df[var_df[\"Name\"] == col][\"Type\"].values[0],\n            k=min_causal_units,\n        )\n        for disc in discretizations:\n            # Ensure that the unique values in disc, excluding -1 if it exists, are at least min_causal_units\n            if disc.max() &gt;= (min_causal_units - 1):\n                list_of_suggestions.append(\n                    {\n                        \"Variable\": col,\n                        \"Type\": var_df[var_df[\"Name\"] == col][\"Type\"].values[0],\n                        \"Num Units\": disc.max() + 1,\n                        \"IUS\": CausalUnitSuggester._calculate_IUS(data_df, disc),\n                    }\n                )\n\n    df_of_suggestions = pd.DataFrame(list_of_suggestions)\n    if len(df_of_suggestions) == 0:\n        return None\n    return df_of_suggestions.sort_values(by=[\"IUS\"], ascending=False).head(\n        num_suggestions\n    )\n</code></pre>"},{"location":"reference/logos/clustering_params/","title":"ClusteringParams","text":""},{"location":"reference/logos/clustering_params/#logos.clustering_params.ClusteringParams","title":"<code>ClusteringParams</code>","text":"<p>A class to conveniently hold all the parameters required by the clustering approach to challenging the ATE.</p> Source code in <code>src/logos/clustering_params.py</code> <pre><code>class ClusteringParams:\n    \"\"\"\n    A class to conveniently hold all the parameters required by the clustering\n    approach to challenging the ATE.\n    \"\"\"\n\n    def __init__(\n        self,\n        top_n: int = 10,\n        num_edges: int = 3,\n        ignore_ts: bool = True,\n        var_pruning_method: Optional[str] = None,\n        triangle_n: int = 6,\n        force: bool = False,\n        force_triangle: bool = False,\n        num_clusters: Optional[int] = None,\n        threshold: float = 0,\n    ) -&gt; None:\n        \"\"\"\n        Initializes a ClusteringParams object.\n\n        Parameters:\n            top_n: The number of top edges to identify.\n            num_edges: The maximum number of edges to use when enumerating DAGs.\n            ignore_ts: Whether to ignore timestamp variables.\n            var_pruning_method: The pruning method to use. Can be either \"lasso\" or \"triangle\".\n            triangle_n: The number of variables to use for the triangle method.\n            force: Whether to force recalculation.\n            force_triangle: Whether to force the triangle method to be recalculated, if selected.\n            num_clusters: The number of clusters to use. If None, will try to find the optimal number.\n            threshold: The threshold to use when finding outlier edges.\n\n        \"\"\"\n        self.top_n = top_n\n        self.num_edges = num_edges\n        self.ignore_ts = ignore_ts\n        self.var_pruning_method = var_pruning_method\n        self.triangle_n = triangle_n\n        self.force = force\n        self.force_triangle = force_triangle\n        self.num_clusters = num_clusters\n        self.threshold = threshold\n</code></pre>"},{"location":"reference/logos/clustering_params/#logos.clustering_params.ClusteringParams.__init__","title":"<code>__init__(top_n=10, num_edges=3, ignore_ts=True, var_pruning_method=None, triangle_n=6, force=False, force_triangle=False, num_clusters=None, threshold=0)</code>","text":"<p>Initializes a ClusteringParams object.</p> <p>Parameters:</p> Name Type Description Default <code>top_n</code> <code>int</code> <p>The number of top edges to identify.</p> <code>10</code> <code>num_edges</code> <code>int</code> <p>The maximum number of edges to use when enumerating DAGs.</p> <code>3</code> <code>ignore_ts</code> <code>bool</code> <p>Whether to ignore timestamp variables.</p> <code>True</code> <code>var_pruning_method</code> <code>Optional[str]</code> <p>The pruning method to use. Can be either \"lasso\" or \"triangle\".</p> <code>None</code> <code>triangle_n</code> <code>int</code> <p>The number of variables to use for the triangle method.</p> <code>6</code> <code>force</code> <code>bool</code> <p>Whether to force recalculation.</p> <code>False</code> <code>force_triangle</code> <code>bool</code> <p>Whether to force the triangle method to be recalculated, if selected.</p> <code>False</code> <code>num_clusters</code> <code>Optional[int]</code> <p>The number of clusters to use. If None, will try to find the optimal number.</p> <code>None</code> <code>threshold</code> <code>float</code> <p>The threshold to use when finding outlier edges.</p> <code>0</code> Source code in <code>src/logos/clustering_params.py</code> <pre><code>def __init__(\n    self,\n    top_n: int = 10,\n    num_edges: int = 3,\n    ignore_ts: bool = True,\n    var_pruning_method: Optional[str] = None,\n    triangle_n: int = 6,\n    force: bool = False,\n    force_triangle: bool = False,\n    num_clusters: Optional[int] = None,\n    threshold: float = 0,\n) -&gt; None:\n    \"\"\"\n    Initializes a ClusteringParams object.\n\n    Parameters:\n        top_n: The number of top edges to identify.\n        num_edges: The maximum number of edges to use when enumerating DAGs.\n        ignore_ts: Whether to ignore timestamp variables.\n        var_pruning_method: The pruning method to use. Can be either \"lasso\" or \"triangle\".\n        triangle_n: The number of variables to use for the triangle method.\n        force: Whether to force recalculation.\n        force_triangle: Whether to force the triangle method to be recalculated, if selected.\n        num_clusters: The number of clusters to use. If None, will try to find the optimal number.\n        threshold: The threshold to use when finding outlier edges.\n\n    \"\"\"\n    self.top_n = top_n\n    self.num_edges = num_edges\n    self.ignore_ts = ignore_ts\n    self.var_pruning_method = var_pruning_method\n    self.triangle_n = triangle_n\n    self.force = force\n    self.force_triangle = force_triangle\n    self.num_clusters = num_clusters\n    self.threshold = threshold\n</code></pre>"},{"location":"reference/logos/drain/","title":"Drain","text":"<p>Inspired by the LogPAI implementation of the Drain algorithm for log parsing,  available under the MIT license here: https://github.com/HelenGuohx/logbert/blob/main/logparser/Drain.py</p>"},{"location":"reference/logos/drain/#logos.drain.Cluster","title":"<code>Cluster</code>","text":"<p>A cluster in the Drain parse tree.</p> Source code in <code>src/logos/drain.py</code> <pre><code>class Cluster:\n    \"\"\"\n    A cluster in the Drain parse tree.\n    \"\"\"\n\n    def __init__(self, template: str = \"\", message_ids: list[int] = []):\n        \"\"\"\n        Parameters:\n            template : the template of log messages in this cluster\n            message_ids : the list of log message IDs in this cluster\n        \"\"\"\n\n        self.template = template\n        self.message_ids = message_ids\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Cluster.__init__","title":"<code>__init__(template='', message_ids=[])</code>","text":"<p>Parameters:</p> Name Type Description Default <code>template</code> <p>the template of log messages in this cluster</p> <code>''</code> <code>message_ids</code> <p>the list of log message IDs in this cluster</p> <code>[]</code> Source code in <code>src/logos/drain.py</code> <pre><code>def __init__(self, template: str = \"\", message_ids: list[int] = []):\n    \"\"\"\n    Parameters:\n        template : the template of log messages in this cluster\n        message_ids : the list of log message IDs in this cluster\n    \"\"\"\n\n    self.template = template\n    self.message_ids = message_ids\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Node","title":"<code>Node</code>","text":"<p>A node in the Drain parse tree.</p> Source code in <code>src/logos/drain.py</code> <pre><code>class Node:\n    \"\"\"\n    A node in the Drain parse tree.\n    \"\"\"\n\n    def __init__(self, children=None, depth=0, id=None):\n        \"\"\"\n        Parameters:\n            children : the dictionary of children nodes\n            depth : the depth of this node in the tree\n            id : the digit or token that this node represents\n        \"\"\"\n        if children is None:\n            children = dict()\n        self.children = children\n        self.depth = depth\n        self.id = id\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Node.__init__","title":"<code>__init__(children=None, depth=0, id=None)</code>","text":"<p>Parameters:</p> Name Type Description Default <code>children</code> <p>the dictionary of children nodes</p> <code>None</code> <code>depth</code> <p>the depth of this node in the tree</p> <code>0</code> <code>id</code> <p>the digit or token that this node represents</p> <code>None</code> Source code in <code>src/logos/drain.py</code> <pre><code>def __init__(self, children=None, depth=0, id=None):\n    \"\"\"\n    Parameters:\n        children : the dictionary of children nodes\n        depth : the depth of this node in the tree\n        id : the digit or token that this node represents\n    \"\"\"\n    if children is None:\n        children = dict()\n    self.children = children\n    self.depth = depth\n    self.id = id\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain","title":"<code>Drain</code>","text":"<p>A class implementing the Drain log parsing algorithm.</p> Source code in <code>src/logos/drain.py</code> <pre><code>class Drain:\n    \"\"\"\n    A class implementing the Drain log parsing algorithm.\n    \"\"\"\n\n    def __init__(\n        self,\n        indir: str = \".\",\n        depth: int = 4,\n        st: float = 0.4,\n        max_children: int = 100,\n        rex: dict = {},\n        skip_writeout: bool = False,\n        message_prefix: str = r\".*\",\n    ):\n        \"\"\"\n        Initialize a Drain-based parser.\n\n        Parameters:\n            indir: the input directory stores the input log file name\n            depth: depth of all leaf nodes\n            st: similarity threshold\n            max_children: max number of children of an internal node\n            rex: regular expressions used in preprocessing, provided as a dictionary from field name to field regex\n            skip_writeout: whether to skip writing out the parsed log file, templates and variables.\n            message_prefix: prefix that starts each message of the log file - lines are merged to their preceding line if they do not start with this prefix.\n        \"\"\"\n        self.indir = indir\n        self.depth = depth - 2\n        self.st = st\n        self.max_children = max_children\n        self.rex = rex\n        self.skip_writeout = skip_writeout\n        self.message_prefix = message_prefix\n\n    def parse(self, filename: str) -&gt; tuple[pd.DataFrame, pd.DataFrame, pd.DataFrame]:\n        \"\"\"\n        Parse a log file.\n\n        Parameters:\n            filename: The name of the log file to parse (without path).\n\n        Returns:\n            A tuple of three dataframes, containing the parsed log file, the parsed log templates,\n            and the parsed variables respectively.\n        \"\"\"\n\n        full_path = os.path.join(self.indir, filename)\n        Printer.printv(f\"Parsing file: {full_path}\")\n        self.filename = filename\n        self.root = Node()\n        self.cluster_list = []\n        self.logdf = self._to_df(full_path)\n\n        tqdm.pandas(desc=\"Determining template for each line...\")\n        self.logdf.progress_apply(self._parse_message, axis=1)\n\n        return self._postprocess()\n\n    def _to_df(self, log_file: str) -&gt; pd.DataFrame:\n        \"\"\"\n        Transform a log file into a dataframe.\n\n        Parameters:\n            log_file: The path to the log file.\n\n        Returns:\n            A dataframe containing the log file's lines, tokenized and with regexes replaced.\n        \"\"\"\n\n        log_messages = []\n        linecount = 0\n\n        with open(log_file, \"r\") as f:\n            log_message = \"\"\n\n            for line in tqdm(f.readlines(), desc=\"Reading and tokenizing log lines...\"):\n                line = line.strip()\n\n                if re.match(self.message_prefix, line):\n                    if log_message:\n                        try:\n                            log_messages.append(self._preprocess(log_message))\n                            linecount += 1\n                        except Exception as e:\n                            raise ValueError\n                    log_message = line\n                else:\n                    log_message += \" \" + line\n\n            if log_message:\n                try:\n                    log_messages.append(self._preprocess(log_message))\n                    linecount += 1\n                except Exception as e:\n                    raise ValueError\n\n        logdf = pd.DataFrame(\n            log_messages, columns=[\"Message\", \"Tokenized\", \"Replaced by regex\"]\n        )\n        logdf[\"MsgId\"] = range(len(logdf))\n        return logdf\n\n    def _preprocess(self, msg: str) -&gt; tuple[str, list[str], list[str]]:\n        \"\"\"\n        Preprocess a message of a log file.\n\n        Parameters:\n            msg: The message to preprocess.\n\n        Returns:\n            A tuple containing the original message, the tokenized message, and a list of the values replaced by regexes.\n        \"\"\"\n\n        msg = msg.strip()\n\n        regex_matches = []\n        for i, rex in enumerate(self.rex.values()):\n            matches = re.findall(rex, msg)  ##### ASSUMPTION: only 1 match of interest\n            regex_matches.append(matches[0] if matches else \"\")\n            msg = re.sub(rex, \"&lt;*\" + str(i) + \"&gt;\", msg, count=1)\n\n        pattern = r'([=,\\{\\}\\[\\]\\(\\);\"\\'])'  # Add spaces around punctuation\n        msg = re.sub(pattern, r\" \\1 \", msg)\n        pattern = r\"(?&lt;=\\D):|:(?=\\D)\"  # Colons not in timestamps\n        msg = re.sub(pattern, \" : \", msg)\n\n        return (msg, msg.strip().split(), regex_matches)\n\n    def _parse_message(self, msg: pd.Series) -&gt; None:\n        \"\"\"\n        Parse a single log message and add it to the Drain parse tree in the appropriate cluster.\n\n        Parameters:\n            msg: The log message to parse.\n        \"\"\"\n\n        line_id = msg[\"MsgId\"]\n        tokenized = msg[\"Tokenized\"]\n        cluster = self._tree_search(self.root, tokenized)\n\n        if cluster is None:\n            new_cluster = Cluster(template=tokenized, message_ids=[line_id])\n            self.cluster_list.append(new_cluster)\n            self._add_cluster_to_tree(self.root, new_cluster)\n        else:\n            new_template = self._get_updated_template(tokenized, cluster.template)\n            cluster.message_ids.append(line_id)\n            if \" \".join(new_template) != \" \".join(cluster.template):\n                cluster.template = new_template\n\n    def _tree_search(self, root: Node, tokenized: list[str]) -&gt; Optional[Cluster]:\n        \"\"\"\n        Search the Drain parse tree for a cluster matching `tokenized`.\n\n        Parameters:\n            root: The root of the Drain parse tree.\n            tokenized: The tokenized log message to search for.\n\n        Returns:\n            The cluster in the Drain parse tree that matches `tokenized`,\n            or None if no such cluster exists.\n        \"\"\"\n\n        num_toks = len(tokenized)\n        if num_toks not in root.children:\n            return None\n\n        node = root.children[num_toks]\n\n        depth = 1\n        for token in tokenized:\n            if depth &gt;= self.depth or depth &gt; num_toks:\n                break\n            if token in node.children:\n                node = node.children[token]\n            elif \"&lt;*&gt;\" in node.children:\n                node = node.children[\"&lt;*&gt;\"]\n            else:\n                return None\n            depth += 1\n\n        cluster_list = node.children\n        returned_cluster = self._find_cluster(cluster_list, tokenized)\n\n        return returned_cluster\n\n    def _add_cluster_to_tree(self, root: Node, cluster: Cluster) -&gt; None:\n        \"\"\"\n        Add a cluster to the Drain parse tree.\n\n        Parameters:\n            root: The root of the Drain parse tree.\n            cluster: The cluster to add.\n        \"\"\"\n\n        # Add a node to the first layer of the tree representing the length of the log message.\n        length = len(cluster.template)\n        first_layer_node = None\n        if length not in root.children:\n            first_layer_node = Node(depth=1, id=length)\n            root.children[length] = first_layer_node\n        else:\n            first_layer_node = root.children[length]\n\n        # Traverse the tree to add the new cluster.\n        node = first_layer_node\n        depth = 1\n        for token in cluster.template:\n            # If out of depth, add current log cluster to the leaf node\n            if depth &gt;= self.depth or depth &gt; length:\n                if len(node.children) == 0:\n                    node.children = [cluster]\n                else:\n                    node.children.append(cluster)\n                break\n\n            # If token not matched in this layer of existing tree.\n            if token not in node.children:\n                if not any(char.isdigit() for char in token):\n                    if \"&lt;*&gt;\" in node.children:\n                        if len(node.children) &lt; self.max_children:\n                            new_node = Node(depth=depth + 1, id=token)\n                            node.children[token] = new_node\n                            node = new_node\n                        else:\n                            node = node.children[\"&lt;*&gt;\"]\n                    else:\n                        if len(node.children) + 1 &lt; self.max_children:\n                            new_node = Node(depth=depth + 1, id=token)\n                            node.children[token] = new_node\n                            node = new_node\n                        elif len(node.children) + 1 == self.max_children:\n                            new_node = Node(depth=depth + 1, id=\"&lt;*&gt;\")\n                            node.children[\"&lt;*&gt;\"] = new_node\n                            node = new_node\n                        else:\n                            node = node.children[\"&lt;*&gt;\"]\n                else:\n                    if \"&lt;*&gt;\" not in node.children:\n                        node.children[\"&lt;*&gt;\"] = Node(depth=depth + 1, id=\"&lt;*&gt;\")\n                    node = node.children[\"&lt;*&gt;\"]\n\n            # If the token is matched\n            else:\n                node = node.children[token]\n\n            depth += 1\n\n    def _similarity(self, seq1: list[str], seq2: list[str]) -&gt; tuple[float, int]:\n        \"\"\"\n        Determine the fraction of tokens in `seq1` that are identical to the corresponding token in `seq2`.\n        Also return the number of parameters in `seq1`.\n\n        Parameters:\n            seq1: The first sequence.\n            seq2: The second sequence.\n\n        Returns:\n            A tuple containing the fraction of identical tokens and the number of parameters in `seq1`.\n        \"\"\"\n        assert len(seq1) == len(seq2)\n        matches = 0\n        num_params = 0\n\n        for token1, token2 in zip(seq1, seq2):\n            if token1 == \"&lt;*&gt;\":\n                num_params += 1\n            if token1 == token2:\n                matches += 1\n\n        similarity = float(matches) / len(seq1)\n\n        return similarity, num_params\n\n    def _find_cluster(\n        self, cluster_list: list[Cluster], seq: list[str]\n    ) -&gt; Optional[Cluster]:\n        \"\"\"\n        Find the cluster in `cluster_list` that is most similar to `seq`.\n\n        Parameters:\n            cluster_list: The list of clusters to search.\n            seq: The sequence of tokens to compare to.\n\n        Returns:\n            The cluster in `cluster_list` that is most similar to `seq`,\n            or None if no cluster is sufficiently similar.\n        \"\"\"\n\n        max_similarity = -1\n        max_num_params = -1\n        max_cluster = None\n\n        for cluster in cluster_list:\n            similarity, num_params = self._similarity(cluster.template, seq)\n            if similarity &gt; max_similarity or (\n                similarity == max_similarity and num_params &gt; max_num_params\n            ):\n                max_similarity = similarity\n                max_num_params = num_params\n                max_cluster = cluster\n\n        if max_similarity &gt;= self.st:\n            return max_cluster\n        else:\n            return None\n\n    def _get_updated_template(self, template: list[str], msg: list[str]) -&gt; list[str]:\n        \"\"\"\n        Get the updated template from matching `msg` to `template`.\n\n        Parameters:\n            template: The template to match to.\n            msg: The message to match.\n\n        Returns:\n            The updated template.\n        \"\"\"\n\n        assert len(template) == len(msg)\n        updated_template = []\n\n        for i, word in enumerate(template):\n            if word == msg[i]:\n                updated_template.append(word)\n            else:\n                updated_template.append(\"&lt;*&gt;\")\n\n        return updated_template\n\n    @staticmethod\n    def _preceding_3(parsed_templates: pd.DataFrame, x: str) -&gt; list[str]:\n        \"\"\"\n        Get the 3 tokens preceding the variable `x` in the template.\n\n        Parameters:\n            parsed_templates: The dataframe containing information about the parsed templates.\n            x: The name of the variable.\n\n        Returns:\n            The 3 tokens preceding the variable `x` in the template.\n        \"\"\"\n\n        splitx = x.split(\"_\")\n        if len(splitx) != 2:\n            return []\n        id = splitx[0]\n        position = int(splitx[1])\n        start_position = max(0, position - 3)\n        return (\n            parsed_templates[parsed_templates[\"TemplateId\"] == id][\"TemplateText\"]\n            .values[0]\n            .split()[start_position:position]\n        )\n\n    def _postprocess(\n        self,\n    ) -&gt; tuple[pd.DataFrame, pd.DataFrame, pd.DataFrame]:\n        template_id_per_msg = [0] * self.logdf.shape[0]\n        parsed_templates_list = []\n\n        regex_tokens = [\"&lt;*\" + str(i) + \"&gt;\" for i in range(len(self.rex))]\n\n        # Process each cluster to determine template information.\n        for cluster in self.cluster_list:\n            d = {}\n\n            # Determine the template ID\n            d[\"TemplateText\"] = \" \".join(cluster.template)\n            d[\"TemplateId\"] = hashlib.md5(\n                d[\"TemplateText\"].encode(\"utf-8\")\n            ).hexdigest()[0:8]\n\n            # Determine the indices of the variables and regexes in the template.\n            d[\"VariableIndices\"] = [\n                i for i, x in enumerate(cluster.template) if x == \"&lt;*&gt;\"\n            ]\n            d[\"RegexIndices\"] = []\n            for i in regex_tokens:\n                try:\n                    d[\"RegexIndices\"].append(cluster.template.index(str(i)))\n                except:\n                    pass\n\n            # Update the template ID for each log message in the cluster.\n            for i, line_id in enumerate(cluster.message_ids):\n                self.logdf.loc[line_id, \"TemplateId\"] = d[\"TemplateId\"]\n\n                if i == 0:\n                    d[\"TemplateExample\"] = self.logdf.loc[line_id, \"Message\"]\n\n            parsed_templates_list.append(d.copy())\n\n        # Create a dataframe of the parsed templates.\n        self.parsed_templates = pd.DataFrame(parsed_templates_list)\n        template_occurences = dict(self.logdf[\"TemplateId\"].value_counts())\n        self.parsed_templates[\"Occurrences\"] = self.parsed_templates[\"TemplateId\"].map(\n            template_occurences\n        )\n\n        # Create columns for each variable (parsed or regex-derived) and extract them from each log message.\n        variable_columns = list(self.rex.keys())\n        variable_columns.extend(\n            [\n                str(i) + \"_\" + str(j)\n                for i in self.parsed_templates[\"TemplateId\"].values\n                for j in self.parsed_templates.loc[\n                    self.parsed_templates[\"TemplateId\"] == i, \"VariableIndices\"\n                ].values[0]\n            ]\n        )\n        par_df = pd.DataFrame(\n            columns=variable_columns, index=range(self.logdf.shape[0])\n        )\n        self.logdf = pd.concat((self.logdf, par_df), axis=1)\n        self._extract_variables()\n\n        # Create a dataframe of the parsed variables.\n        parsed_variables = pd.DataFrame()\n        parsed_variables[\"Name\"] = variable_columns\n        parsed_variables[\"Occurrences\"] = parsed_variables[\"Name\"].map(\n            lambda x: self.logdf[x].notna().sum()\n        )\n        parsed_variables[\"Preceding 3 tokens\"] = parsed_variables[\"Name\"].map(\n            lambda x: Drain._preceding_3(self.parsed_templates, x)\n        )\n        parsed_variables[\"Examples\"] = parsed_variables[\"Name\"].map(\n            lambda x: self.logdf[x].loc[self.logdf[x].notna()].unique()[:5].tolist()\n        )\n        parsed_variables[\"From regex\"] = parsed_variables[\"Name\"].map(\n            lambda x: True if x in self.rex.keys() else False\n        )\n\n        # Drop unnecessary columns from the parsed log.\n        to_drop = [\"MsgId\", \"Message\", \"Tokenized\", \"Replaced by regex\"]\n        to_drop.extend(\n            parsed_variables[parsed_variables[\"Occurrences\"] == 0][\"Name\"].tolist()\n        )\n        parsed_log = self.logdf.drop(columns=to_drop)\n        parsed_variables = (\n            parsed_variables[~parsed_variables.isin(to_drop)[\"Name\"]]\n            .reset_index()\n            .drop(columns=\"index\")\n        )\n\n        return parsed_log, self.parsed_templates, parsed_variables\n\n    def _extract_variables(self) -&gt; None:\n        \"\"\"\n        Extract the variables from the log messages.\n        \"\"\"\n\n        for row in tqdm(\n            self.parsed_templates.itertuples(),\n            desc=\"Extracting variables from each log message...\",\n            total=len(self.parsed_templates),\n        ):\n            template_id = row.TemplateId\n            variable_indices = row.VariableIndices\n\n            mask = self.logdf[\"TemplateId\"] == template_id\n            for i in variable_indices:\n                col_name = f\"{template_id}_{str(i)}\"\n                self.logdf.loc[mask, col_name] = self.logdf.loc[mask, \"Tokenized\"].str[\n                    i\n                ]\n\n            for i, col_name in enumerate(self.rex.keys()):\n                self.logdf.loc[mask, col_name] = self.logdf.loc[\n                    mask, \"Replaced by regex\"\n                ].str[i]\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain.__init__","title":"<code>__init__(indir='.', depth=4, st=0.4, max_children=100, rex={}, skip_writeout=False, message_prefix='.*')</code>","text":"<p>Initialize a Drain-based parser.</p> <p>Parameters:</p> Name Type Description Default <code>indir</code> <code>str</code> <p>the input directory stores the input log file name</p> <code>'.'</code> <code>depth</code> <code>int</code> <p>depth of all leaf nodes</p> <code>4</code> <code>st</code> <code>float</code> <p>similarity threshold</p> <code>0.4</code> <code>max_children</code> <code>int</code> <p>max number of children of an internal node</p> <code>100</code> <code>rex</code> <code>dict</code> <p>regular expressions used in preprocessing, provided as a dictionary from field name to field regex</p> <code>{}</code> <code>skip_writeout</code> <code>bool</code> <p>whether to skip writing out the parsed log file, templates and variables.</p> <code>False</code> <code>message_prefix</code> <code>str</code> <p>prefix that starts each message of the log file - lines are merged to their preceding line if they do not start with this prefix.</p> <code>'.*'</code> Source code in <code>src/logos/drain.py</code> <pre><code>def __init__(\n    self,\n    indir: str = \".\",\n    depth: int = 4,\n    st: float = 0.4,\n    max_children: int = 100,\n    rex: dict = {},\n    skip_writeout: bool = False,\n    message_prefix: str = r\".*\",\n):\n    \"\"\"\n    Initialize a Drain-based parser.\n\n    Parameters:\n        indir: the input directory stores the input log file name\n        depth: depth of all leaf nodes\n        st: similarity threshold\n        max_children: max number of children of an internal node\n        rex: regular expressions used in preprocessing, provided as a dictionary from field name to field regex\n        skip_writeout: whether to skip writing out the parsed log file, templates and variables.\n        message_prefix: prefix that starts each message of the log file - lines are merged to their preceding line if they do not start with this prefix.\n    \"\"\"\n    self.indir = indir\n    self.depth = depth - 2\n    self.st = st\n    self.max_children = max_children\n    self.rex = rex\n    self.skip_writeout = skip_writeout\n    self.message_prefix = message_prefix\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain.parse","title":"<code>parse(filename)</code>","text":"<p>Parse a log file.</p> <p>Parameters:</p> Name Type Description Default <code>filename</code> <code>str</code> <p>The name of the log file to parse (without path).</p> required <p>Returns:</p> Type Description <code>DataFrame</code> <p>A tuple of three dataframes, containing the parsed log file, the parsed log templates,</p> <code>DataFrame</code> <p>and the parsed variables respectively.</p> Source code in <code>src/logos/drain.py</code> <pre><code>def parse(self, filename: str) -&gt; tuple[pd.DataFrame, pd.DataFrame, pd.DataFrame]:\n    \"\"\"\n    Parse a log file.\n\n    Parameters:\n        filename: The name of the log file to parse (without path).\n\n    Returns:\n        A tuple of three dataframes, containing the parsed log file, the parsed log templates,\n        and the parsed variables respectively.\n    \"\"\"\n\n    full_path = os.path.join(self.indir, filename)\n    Printer.printv(f\"Parsing file: {full_path}\")\n    self.filename = filename\n    self.root = Node()\n    self.cluster_list = []\n    self.logdf = self._to_df(full_path)\n\n    tqdm.pandas(desc=\"Determining template for each line...\")\n    self.logdf.progress_apply(self._parse_message, axis=1)\n\n    return self._postprocess()\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain._to_df","title":"<code>_to_df(log_file)</code>","text":"<p>Transform a log file into a dataframe.</p> <p>Parameters:</p> Name Type Description Default <code>log_file</code> <code>str</code> <p>The path to the log file.</p> required <p>Returns:</p> Type Description <code>DataFrame</code> <p>A dataframe containing the log file's lines, tokenized and with regexes replaced.</p> Source code in <code>src/logos/drain.py</code> <pre><code>def _to_df(self, log_file: str) -&gt; pd.DataFrame:\n    \"\"\"\n    Transform a log file into a dataframe.\n\n    Parameters:\n        log_file: The path to the log file.\n\n    Returns:\n        A dataframe containing the log file's lines, tokenized and with regexes replaced.\n    \"\"\"\n\n    log_messages = []\n    linecount = 0\n\n    with open(log_file, \"r\") as f:\n        log_message = \"\"\n\n        for line in tqdm(f.readlines(), desc=\"Reading and tokenizing log lines...\"):\n            line = line.strip()\n\n            if re.match(self.message_prefix, line):\n                if log_message:\n                    try:\n                        log_messages.append(self._preprocess(log_message))\n                        linecount += 1\n                    except Exception as e:\n                        raise ValueError\n                log_message = line\n            else:\n                log_message += \" \" + line\n\n        if log_message:\n            try:\n                log_messages.append(self._preprocess(log_message))\n                linecount += 1\n            except Exception as e:\n                raise ValueError\n\n    logdf = pd.DataFrame(\n        log_messages, columns=[\"Message\", \"Tokenized\", \"Replaced by regex\"]\n    )\n    logdf[\"MsgId\"] = range(len(logdf))\n    return logdf\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain._preprocess","title":"<code>_preprocess(msg)</code>","text":"<p>Preprocess a message of a log file.</p> <p>Parameters:</p> Name Type Description Default <code>msg</code> <code>str</code> <p>The message to preprocess.</p> required <p>Returns:</p> Type Description <code>tuple[str, list[str], list[str]]</code> <p>A tuple containing the original message, the tokenized message, and a list of the values replaced by regexes.</p> Source code in <code>src/logos/drain.py</code> <pre><code>def _preprocess(self, msg: str) -&gt; tuple[str, list[str], list[str]]:\n    \"\"\"\n    Preprocess a message of a log file.\n\n    Parameters:\n        msg: The message to preprocess.\n\n    Returns:\n        A tuple containing the original message, the tokenized message, and a list of the values replaced by regexes.\n    \"\"\"\n\n    msg = msg.strip()\n\n    regex_matches = []\n    for i, rex in enumerate(self.rex.values()):\n        matches = re.findall(rex, msg)  ##### ASSUMPTION: only 1 match of interest\n        regex_matches.append(matches[0] if matches else \"\")\n        msg = re.sub(rex, \"&lt;*\" + str(i) + \"&gt;\", msg, count=1)\n\n    pattern = r'([=,\\{\\}\\[\\]\\(\\);\"\\'])'  # Add spaces around punctuation\n    msg = re.sub(pattern, r\" \\1 \", msg)\n    pattern = r\"(?&lt;=\\D):|:(?=\\D)\"  # Colons not in timestamps\n    msg = re.sub(pattern, \" : \", msg)\n\n    return (msg, msg.strip().split(), regex_matches)\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain._parse_message","title":"<code>_parse_message(msg)</code>","text":"<p>Parse a single log message and add it to the Drain parse tree in the appropriate cluster.</p> <p>Parameters:</p> Name Type Description Default <code>msg</code> <code>Series</code> <p>The log message to parse.</p> required Source code in <code>src/logos/drain.py</code> <pre><code>def _parse_message(self, msg: pd.Series) -&gt; None:\n    \"\"\"\n    Parse a single log message and add it to the Drain parse tree in the appropriate cluster.\n\n    Parameters:\n        msg: The log message to parse.\n    \"\"\"\n\n    line_id = msg[\"MsgId\"]\n    tokenized = msg[\"Tokenized\"]\n    cluster = self._tree_search(self.root, tokenized)\n\n    if cluster is None:\n        new_cluster = Cluster(template=tokenized, message_ids=[line_id])\n        self.cluster_list.append(new_cluster)\n        self._add_cluster_to_tree(self.root, new_cluster)\n    else:\n        new_template = self._get_updated_template(tokenized, cluster.template)\n        cluster.message_ids.append(line_id)\n        if \" \".join(new_template) != \" \".join(cluster.template):\n            cluster.template = new_template\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain._tree_search","title":"<code>_tree_search(root, tokenized)</code>","text":"<p>Search the Drain parse tree for a cluster matching <code>tokenized</code>.</p> <p>Parameters:</p> Name Type Description Default <code>root</code> <code>Node</code> <p>The root of the Drain parse tree.</p> required <code>tokenized</code> <code>list[str]</code> <p>The tokenized log message to search for.</p> required <p>Returns:</p> Type Description <code>Optional[Cluster]</code> <p>The cluster in the Drain parse tree that matches <code>tokenized</code>,</p> <code>Optional[Cluster]</code> <p>or None if no such cluster exists.</p> Source code in <code>src/logos/drain.py</code> <pre><code>def _tree_search(self, root: Node, tokenized: list[str]) -&gt; Optional[Cluster]:\n    \"\"\"\n    Search the Drain parse tree for a cluster matching `tokenized`.\n\n    Parameters:\n        root: The root of the Drain parse tree.\n        tokenized: The tokenized log message to search for.\n\n    Returns:\n        The cluster in the Drain parse tree that matches `tokenized`,\n        or None if no such cluster exists.\n    \"\"\"\n\n    num_toks = len(tokenized)\n    if num_toks not in root.children:\n        return None\n\n    node = root.children[num_toks]\n\n    depth = 1\n    for token in tokenized:\n        if depth &gt;= self.depth or depth &gt; num_toks:\n            break\n        if token in node.children:\n            node = node.children[token]\n        elif \"&lt;*&gt;\" in node.children:\n            node = node.children[\"&lt;*&gt;\"]\n        else:\n            return None\n        depth += 1\n\n    cluster_list = node.children\n    returned_cluster = self._find_cluster(cluster_list, tokenized)\n\n    return returned_cluster\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain._add_cluster_to_tree","title":"<code>_add_cluster_to_tree(root, cluster)</code>","text":"<p>Add a cluster to the Drain parse tree.</p> <p>Parameters:</p> Name Type Description Default <code>root</code> <code>Node</code> <p>The root of the Drain parse tree.</p> required <code>cluster</code> <code>Cluster</code> <p>The cluster to add.</p> required Source code in <code>src/logos/drain.py</code> <pre><code>def _add_cluster_to_tree(self, root: Node, cluster: Cluster) -&gt; None:\n    \"\"\"\n    Add a cluster to the Drain parse tree.\n\n    Parameters:\n        root: The root of the Drain parse tree.\n        cluster: The cluster to add.\n    \"\"\"\n\n    # Add a node to the first layer of the tree representing the length of the log message.\n    length = len(cluster.template)\n    first_layer_node = None\n    if length not in root.children:\n        first_layer_node = Node(depth=1, id=length)\n        root.children[length] = first_layer_node\n    else:\n        first_layer_node = root.children[length]\n\n    # Traverse the tree to add the new cluster.\n    node = first_layer_node\n    depth = 1\n    for token in cluster.template:\n        # If out of depth, add current log cluster to the leaf node\n        if depth &gt;= self.depth or depth &gt; length:\n            if len(node.children) == 0:\n                node.children = [cluster]\n            else:\n                node.children.append(cluster)\n            break\n\n        # If token not matched in this layer of existing tree.\n        if token not in node.children:\n            if not any(char.isdigit() for char in token):\n                if \"&lt;*&gt;\" in node.children:\n                    if len(node.children) &lt; self.max_children:\n                        new_node = Node(depth=depth + 1, id=token)\n                        node.children[token] = new_node\n                        node = new_node\n                    else:\n                        node = node.children[\"&lt;*&gt;\"]\n                else:\n                    if len(node.children) + 1 &lt; self.max_children:\n                        new_node = Node(depth=depth + 1, id=token)\n                        node.children[token] = new_node\n                        node = new_node\n                    elif len(node.children) + 1 == self.max_children:\n                        new_node = Node(depth=depth + 1, id=\"&lt;*&gt;\")\n                        node.children[\"&lt;*&gt;\"] = new_node\n                        node = new_node\n                    else:\n                        node = node.children[\"&lt;*&gt;\"]\n            else:\n                if \"&lt;*&gt;\" not in node.children:\n                    node.children[\"&lt;*&gt;\"] = Node(depth=depth + 1, id=\"&lt;*&gt;\")\n                node = node.children[\"&lt;*&gt;\"]\n\n        # If the token is matched\n        else:\n            node = node.children[token]\n\n        depth += 1\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain._similarity","title":"<code>_similarity(seq1, seq2)</code>","text":"<p>Determine the fraction of tokens in <code>seq1</code> that are identical to the corresponding token in <code>seq2</code>. Also return the number of parameters in <code>seq1</code>.</p> <p>Parameters:</p> Name Type Description Default <code>seq1</code> <code>list[str]</code> <p>The first sequence.</p> required <code>seq2</code> <code>list[str]</code> <p>The second sequence.</p> required <p>Returns:</p> Type Description <code>tuple[float, int]</code> <p>A tuple containing the fraction of identical tokens and the number of parameters in <code>seq1</code>.</p> Source code in <code>src/logos/drain.py</code> <pre><code>def _similarity(self, seq1: list[str], seq2: list[str]) -&gt; tuple[float, int]:\n    \"\"\"\n    Determine the fraction of tokens in `seq1` that are identical to the corresponding token in `seq2`.\n    Also return the number of parameters in `seq1`.\n\n    Parameters:\n        seq1: The first sequence.\n        seq2: The second sequence.\n\n    Returns:\n        A tuple containing the fraction of identical tokens and the number of parameters in `seq1`.\n    \"\"\"\n    assert len(seq1) == len(seq2)\n    matches = 0\n    num_params = 0\n\n    for token1, token2 in zip(seq1, seq2):\n        if token1 == \"&lt;*&gt;\":\n            num_params += 1\n        if token1 == token2:\n            matches += 1\n\n    similarity = float(matches) / len(seq1)\n\n    return similarity, num_params\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain._find_cluster","title":"<code>_find_cluster(cluster_list, seq)</code>","text":"<p>Find the cluster in <code>cluster_list</code> that is most similar to <code>seq</code>.</p> <p>Parameters:</p> Name Type Description Default <code>cluster_list</code> <code>list[Cluster]</code> <p>The list of clusters to search.</p> required <code>seq</code> <code>list[str]</code> <p>The sequence of tokens to compare to.</p> required <p>Returns:</p> Type Description <code>Optional[Cluster]</code> <p>The cluster in <code>cluster_list</code> that is most similar to <code>seq</code>,</p> <code>Optional[Cluster]</code> <p>or None if no cluster is sufficiently similar.</p> Source code in <code>src/logos/drain.py</code> <pre><code>def _find_cluster(\n    self, cluster_list: list[Cluster], seq: list[str]\n) -&gt; Optional[Cluster]:\n    \"\"\"\n    Find the cluster in `cluster_list` that is most similar to `seq`.\n\n    Parameters:\n        cluster_list: The list of clusters to search.\n        seq: The sequence of tokens to compare to.\n\n    Returns:\n        The cluster in `cluster_list` that is most similar to `seq`,\n        or None if no cluster is sufficiently similar.\n    \"\"\"\n\n    max_similarity = -1\n    max_num_params = -1\n    max_cluster = None\n\n    for cluster in cluster_list:\n        similarity, num_params = self._similarity(cluster.template, seq)\n        if similarity &gt; max_similarity or (\n            similarity == max_similarity and num_params &gt; max_num_params\n        ):\n            max_similarity = similarity\n            max_num_params = num_params\n            max_cluster = cluster\n\n    if max_similarity &gt;= self.st:\n        return max_cluster\n    else:\n        return None\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain._get_updated_template","title":"<code>_get_updated_template(template, msg)</code>","text":"<p>Get the updated template from matching <code>msg</code> to <code>template</code>.</p> <p>Parameters:</p> Name Type Description Default <code>template</code> <code>list[str]</code> <p>The template to match to.</p> required <code>msg</code> <code>list[str]</code> <p>The message to match.</p> required <p>Returns:</p> Type Description <code>list[str]</code> <p>The updated template.</p> Source code in <code>src/logos/drain.py</code> <pre><code>def _get_updated_template(self, template: list[str], msg: list[str]) -&gt; list[str]:\n    \"\"\"\n    Get the updated template from matching `msg` to `template`.\n\n    Parameters:\n        template: The template to match to.\n        msg: The message to match.\n\n    Returns:\n        The updated template.\n    \"\"\"\n\n    assert len(template) == len(msg)\n    updated_template = []\n\n    for i, word in enumerate(template):\n        if word == msg[i]:\n            updated_template.append(word)\n        else:\n            updated_template.append(\"&lt;*&gt;\")\n\n    return updated_template\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain._preceding_3","title":"<code>_preceding_3(parsed_templates, x)</code>  <code>staticmethod</code>","text":"<p>Get the 3 tokens preceding the variable <code>x</code> in the template.</p> <p>Parameters:</p> Name Type Description Default <code>parsed_templates</code> <code>DataFrame</code> <p>The dataframe containing information about the parsed templates.</p> required <code>x</code> <code>str</code> <p>The name of the variable.</p> required <p>Returns:</p> Type Description <code>list[str]</code> <p>The 3 tokens preceding the variable <code>x</code> in the template.</p> Source code in <code>src/logos/drain.py</code> <pre><code>@staticmethod\ndef _preceding_3(parsed_templates: pd.DataFrame, x: str) -&gt; list[str]:\n    \"\"\"\n    Get the 3 tokens preceding the variable `x` in the template.\n\n    Parameters:\n        parsed_templates: The dataframe containing information about the parsed templates.\n        x: The name of the variable.\n\n    Returns:\n        The 3 tokens preceding the variable `x` in the template.\n    \"\"\"\n\n    splitx = x.split(\"_\")\n    if len(splitx) != 2:\n        return []\n    id = splitx[0]\n    position = int(splitx[1])\n    start_position = max(0, position - 3)\n    return (\n        parsed_templates[parsed_templates[\"TemplateId\"] == id][\"TemplateText\"]\n        .values[0]\n        .split()[start_position:position]\n    )\n</code></pre>"},{"location":"reference/logos/drain/#logos.drain.Drain._extract_variables","title":"<code>_extract_variables()</code>","text":"<p>Extract the variables from the log messages.</p> Source code in <code>src/logos/drain.py</code> <pre><code>def _extract_variables(self) -&gt; None:\n    \"\"\"\n    Extract the variables from the log messages.\n    \"\"\"\n\n    for row in tqdm(\n        self.parsed_templates.itertuples(),\n        desc=\"Extracting variables from each log message...\",\n        total=len(self.parsed_templates),\n    ):\n        template_id = row.TemplateId\n        variable_indices = row.VariableIndices\n\n        mask = self.logdf[\"TemplateId\"] == template_id\n        for i in variable_indices:\n            col_name = f\"{template_id}_{str(i)}\"\n            self.logdf.loc[mask, col_name] = self.logdf.loc[mask, \"Tokenized\"].str[\n                i\n            ]\n\n        for i, col_name in enumerate(self.rex.keys()):\n            self.logdf.loc[mask, col_name] = self.logdf.loc[\n                mask, \"Replaced by regex\"\n            ].str[i]\n</code></pre>"},{"location":"reference/logos/edge_occurrence_tree/","title":"EdgeOccurrenceTree","text":""},{"location":"reference/logos/edge_occurrence_tree/#logos.edge_occurrence_tree.Types","title":"<code>Types</code>","text":"Source code in <code>src/logos/types.py</code> <pre><code>class Types:\n    Edge = tuple[str, str]\n    \"\"\"Type alias for a directed edge.\"\"\"\n\n    LeafLabelingFunction = Callable[[int], str]\n    \"\"\"Type alias for a leaf labeling function in `ATE`.\"\"\"\n\n    EdgeCountDict = defaultdict[Edge, int]\n    \"\"\"Type alias for a dictionary counting edge occurrences.\"\"\"\n</code></pre>"},{"location":"reference/logos/edge_occurrence_tree/#logos.edge_occurrence_tree.Types.Edge","title":"<code>Edge = tuple[str, str]</code>  <code>class-attribute</code> <code>instance-attribute</code>","text":"<p>Type alias for a directed edge.</p>"},{"location":"reference/logos/edge_occurrence_tree/#logos.edge_occurrence_tree.Types.LeafLabelingFunction","title":"<code>LeafLabelingFunction = Callable[[int], str]</code>  <code>class-attribute</code> <code>instance-attribute</code>","text":"<p>Type alias for a leaf labeling function in <code>ATE</code>.</p>"},{"location":"reference/logos/edge_occurrence_tree/#logos.edge_occurrence_tree.Types.EdgeCountDict","title":"<code>EdgeCountDict = defaultdict[Edge, int]</code>  <code>class-attribute</code> <code>instance-attribute</code>","text":"<p>Type alias for a dictionary counting edge occurrences.</p>"},{"location":"reference/logos/edge_occurrence_tree/#logos.edge_occurrence_tree.EdgeOccurrenceTree","title":"<code>EdgeOccurrenceTree</code>","text":"<p>A tree of DAGs based on the ATE cluster they belong to.</p> Source code in <code>src/logos/edge_occurrence_tree.py</code> <pre><code>class EdgeOccurrenceTree:\n    \"\"\"\n    A tree of DAGs based on the ATE cluster they belong to.\n    \"\"\"\n\n    def __init__(self, cluster_id: Optional[str] = None) -&gt; None:\n        \"\"\"\n        Initialize a tree node with a specific cluster id.\n\n        Parameters:\n            cluster_id: The cluster id of the DAGs that belong to this node.\n        \"\"\"\n\n        self.cluster_id = cluster_id\n        self.left = None\n        self.right = None\n\n    @staticmethod\n    def build_tree(linked: np.ndarray, leaves: list[int]) -&gt; tuple[Self, int]:\n        \"\"\"\n        Build a tree from a linkage matrix.\n\n        Parameters:\n            linked: The linkage matrix.\n            leaves: The list of leaf nodes.\n\n        Returns:\n            A tuple containing the root of the tree, and the index of the next cluster to be merged.\n        \"\"\"\n\n        # Base case: if there is only one cluster, return it as a leaf.\n        if len(leaves) == 1:\n            return EdgeOccurrenceTree(cluster_id=leaves[0]), -1\n\n        # Otherwise, build the tree recursively.\n        root = EdgeOccurrenceTree()\n        curr = root\n        i = len(linked) - 1\n        while i &gt; -1:\n            # Linked contains 4 elements: cluster1, cluster2, distance, num_observations\n            # They represent the clusters that were merged, the distance between them, and\n            # the number of observations in the new cluster.\n            c1, c2, _, _ = linked[i]\n\n            if c1 not in leaves and c2 not in leaves:\n                curr.left, i = EdgeOccurrenceTree.build_tree(linked[:i], leaves)\n                curr.right, i = EdgeOccurrenceTree.build_tree(linked[:i], leaves)\n                break\n            if c1 in leaves:\n                curr.left = EdgeOccurrenceTree(leaves.index(c1))\n                curr.right = EdgeOccurrenceTree()\n                curr = curr.right\n            if c2 in leaves:\n                curr.right = EdgeOccurrenceTree(leaves.index(c2))\n                break\n            i -= 1\n        root = EdgeOccurrenceTree._cleanup_tree(root)\n        return root, i\n\n    @staticmethod\n    def _cleanup_tree(root: Optional[Self]) -&gt; Self:\n        \"\"\"\n        Clean up the tree by removing nodes that have only one child, and nodes that have no\n        children and are not leaves.\n\n        Parameters:\n            root: The root of the tree.\n\n        Returns:\n            The root of the cleaned up tree.\n        \"\"\"\n\n        if root is None:\n            return None\n\n        # Recursively clean up left and right subtrees\n        root.left = EdgeOccurrenceTree._cleanup_tree(root.left)\n        root.right = EdgeOccurrenceTree._cleanup_tree(root.right)\n\n        # If the current node has only one child, replace the node with its child\n        if root.left is None and root.right is not None:\n            return root.right\n        elif root.left is not None and root.right is None:\n            return root.left\n\n        # If the current node has no left and right child and is not a leaf, remove the node\n        if root.left is None and root.right is None and root.cluster_id is None:\n            return None\n\n        return root\n\n    def print_tree(self, depth: int = 0) -&gt; None:\n        \"\"\"\n        Print the tree in a readable format.\n\n        Parameters:\n            depth: The depth of the current node in the tree.\n        \"\"\"\n\n        prefix = \"\"\n        for _ in range(depth):\n            prefix += \"-\"\n        if self.cluster_id is not None:\n            Printer.printv(prefix + str(self.cluster_id))\n        else:\n            Printer.printv(prefix + \"node\")\n        if self.left:\n            self.left.print_tree(depth + 1)\n        if self.right:\n            self.right.print_tree(depth + 1)\n\n    def assign_dags_to_nodes(self, cluster_mapping: dict[nx.DiGraph, int]) -&gt; None:\n        \"\"\"\n        Assign each DAG to the node it belongs to, based on `cluster_mapping`.\n\n        Parameters:\n            cluster_mapping: A dictionary mapping DAGs to cluster id's.\n        \"\"\"\n        self.num_dags = 0\n\n        # If leaf, assign DAGs and set count.\n        if self.cluster_id is not None:\n            self.dags = [\n                key\n                for key in cluster_mapping.keys()\n                if cluster_mapping[key] == self.cluster_id\n            ]\n            self.num_dags = len(self.dags)\n\n        # Otherwise, recurse for children and retireve counts.\n        if self.left:\n            self.left.assign_dags_to_nodes(cluster_mapping)\n            self.num_dags += self.left.num_dags\n        if self.right:\n            self.right.assign_dags_to_nodes(cluster_mapping)\n            self.num_dags += self.right.num_dags\n\n    def count_edge_occurrences(\n        self, treatment: str, outcome: str, dag: nx.DiGraph\n    ) -&gt; None:\n        \"\"\"\n        Recursively count the number of times each edge occurs amongst the DAGs\n        assigned to all the children of this node, omitting the edge from treatment -&gt; outcome,\n        since this always exists. If a DAG is passed in, ignore the edges in that DAG as well.\n\n        Parameters:\n            treatment: The treatment variable.\n            outcome: The outcome variable.\n            dag: The optional dag structure to ignore.\n        \"\"\"\n        self.edge_counts: Types.EdgeCountDict = defaultdict(int)\n\n        # If leaf, actually compute count.\n        if self.cluster_id is not None:\n            edges_to_ignore = [(treatment, outcome)]\n            if dag:\n                edges_to_ignore.extend(dag.edges)\n            for graph in self.dags:\n                for edge in graph.edges:\n                    if edge not in edges_to_ignore:\n                        self.edge_counts[edge] += 1\n\n        # Otherwise, derive counts from children.\n        if self.left:\n            self.left.count_edge_occurrences(treatment, outcome, dag)\n            for key in self.left.edge_counts.keys():\n                self.edge_counts[key] += self.left.edge_counts[key]\n        if self.right:\n            self.right.count_edge_occurrences(treatment, outcome, dag)\n            for key in self.right.edge_counts.keys():\n                self.edge_counts[key] += self.right.edge_counts[key]\n\n        # Compute statistics.\n        freq_counts = list(self.edge_counts.values())\n        if len(freq_counts) == 0:\n            self.mean = None\n            self.std_dev = None\n        else:\n            self.mean = np.mean(freq_counts)\n            self.std_dev = np.std(freq_counts)\n\n    def calculate_edge_expectancy(\n        self, totals: tuple[int, Types.EdgeCountDict] = None\n    ) -&gt; None:\n        \"\"\"\n        For each edge at each node, calculate what percent over or under\n        expectancy the edge is at in relationship to its parent.\n\n        Parameters:\n            totals: A tuple containing the total number of DAGs and the mapping from\n                edges to their counts for the parent of this node.\n        \"\"\"\n        # At root node, calculate expectancy\n        if totals is None:\n            totals = (self.num_dags, self.edge_counts)\n\n        # Otherwise, calculate expectancy based on parent.\n        total_dags, total_edges = totals\n        self.percent_expectancy = defaultdict(float)\n\n        for edge in self.edge_counts.keys():\n            expected = self.num_dags / total_dags * total_edges[edge]\n            self.percent_expectancy[edge] = (\n                self.edge_counts[edge] - expected\n            ) / expected\n\n        # Recurse for children.\n        if self.left:\n            self.left.calculate_edge_expectancy((self.num_dags, self.edge_counts))\n        if self.right:\n            self.right.calculate_edge_expectancy((self.num_dags, self.edge_counts))\n\n    def find_outliers_in_tree(self, threshold: float = 0) -&gt; None:\n        \"\"\"\n        Find outlier edges, based on the percent expectancy of each edge. Define an outlier as an\n        edge that is below expectancy on one side of the tree, and above on the other side, and\n        optionally, over some threshold on both sides.\n\n        Parameters:\n            threshold: The threshold for an edge to be considered an outlier.\n        \"\"\"\n\n        # If able to compare, find outliers.\n        if self.left and self.right:\n            self.left.outliers = {}\n            self.right.outliers = {}\n            edges = set(self.left.edge_counts.keys()).union(\n                set(self.right.edge_counts.keys())\n            )\n            for edge in edges:\n                if (\n                    np.sign(self.left.percent_expectancy[edge])\n                    != np.sign(self.right.percent_expectancy[edge])\n                    and abs(self.left.percent_expectancy[edge]) &gt; threshold\n                    and abs(self.right.percent_expectancy[edge]) &gt; threshold\n                ):\n                    self.left.outliers[edge] = self.left.percent_expectancy[edge]\n                    self.right.outliers[edge] = self.right.percent_expectancy[edge]\n\n        # Recurse for children.\n        if self.left:\n            self.left.find_outliers_in_tree(threshold)\n        if self.right:\n            self.right.find_outliers_in_tree(threshold)\n\n    def find_outliers_per_cluster(\n        self,\n        dag: nx.DiGraph,\n    ) -&gt; tuple[Types.EdgeCountDict, dict[Types.Edge, float]]:\n        \"\"\"\n        Collect the edge counts and outliers found earlier into appropriate dictionaries\n        per cluster.\n\n        Parameters:\n            dag: The DAG to ignore when collecting outliers.\n\n        Returns:\n            A tuple containing the following: a dictionary mapping cluster id's to edge counts,\n            and a dictionary mapping cluster id's to outlier edges.\n        \"\"\"\n\n        cluster_edge_count = {}\n        cluster_outliers = {}\n\n        # If leaf, add to cluster counts.\n        if self.cluster_id is not None:\n            cluster_edge_count[self.cluster_id] = self.edge_counts\n            edges_to_ignore = dag.edges if dag is not None else []\n            cluster_outliers[self.cluster_id] = {\n                edge: self.outliers[edge]\n                for edge in self.outliers\n                if edge not in edges_to_ignore\n            }\n\n        # Otherwise, recurse for children.\n        if self.left:\n            lec, lo = self.left.find_outliers_per_cluster(dag)\n            cluster_edge_count.update(lec)\n            cluster_outliers.update(lo)\n        if self.right:\n            rec, ro = self.right.find_outliers_per_cluster(dag)\n            cluster_edge_count.update(rec)\n            cluster_outliers.update(ro)\n\n        return cluster_edge_count, cluster_outliers\n</code></pre>"},{"location":"reference/logos/edge_occurrence_tree/#logos.edge_occurrence_tree.EdgeOccurrenceTree.__init__","title":"<code>__init__(cluster_id=None)</code>","text":"<p>Initialize a tree node with a specific cluster id.</p> <p>Parameters:</p> Name Type Description Default <code>cluster_id</code> <code>Optional[str]</code> <p>The cluster id of the DAGs that belong to this node.</p> <code>None</code> Source code in <code>src/logos/edge_occurrence_tree.py</code> <pre><code>def __init__(self, cluster_id: Optional[str] = None) -&gt; None:\n    \"\"\"\n    Initialize a tree node with a specific cluster id.\n\n    Parameters:\n        cluster_id: The cluster id of the DAGs that belong to this node.\n    \"\"\"\n\n    self.cluster_id = cluster_id\n    self.left = None\n    self.right = None\n</code></pre>"},{"location":"reference/logos/edge_occurrence_tree/#logos.edge_occurrence_tree.EdgeOccurrenceTree.build_tree","title":"<code>build_tree(linked, leaves)</code>  <code>staticmethod</code>","text":"<p>Build a tree from a linkage matrix.</p> <p>Parameters:</p> Name Type Description Default <code>linked</code> <code>ndarray</code> <p>The linkage matrix.</p> required <code>leaves</code> <code>list[int]</code> <p>The list of leaf nodes.</p> required <p>Returns:</p> Type Description <code>tuple[Self, int]</code> <p>A tuple containing the root of the tree, and the index of the next cluster to be merged.</p> Source code in <code>src/logos/edge_occurrence_tree.py</code> <pre><code>@staticmethod\ndef build_tree(linked: np.ndarray, leaves: list[int]) -&gt; tuple[Self, int]:\n    \"\"\"\n    Build a tree from a linkage matrix.\n\n    Parameters:\n        linked: The linkage matrix.\n        leaves: The list of leaf nodes.\n\n    Returns:\n        A tuple containing the root of the tree, and the index of the next cluster to be merged.\n    \"\"\"\n\n    # Base case: if there is only one cluster, return it as a leaf.\n    if len(leaves) == 1:\n        return EdgeOccurrenceTree(cluster_id=leaves[0]), -1\n\n    # Otherwise, build the tree recursively.\n    root = EdgeOccurrenceTree()\n    curr = root\n    i = len(linked) - 1\n    while i &gt; -1:\n        # Linked contains 4 elements: cluster1, cluster2, distance, num_observations\n        # They represent the clusters that were merged, the distance between them, and\n        # the number of observations in the new cluster.\n        c1, c2, _, _ = linked[i]\n\n        if c1 not in leaves and c2 not in leaves:\n            curr.left, i = EdgeOccurrenceTree.build_tree(linked[:i], leaves)\n            curr.right, i = EdgeOccurrenceTree.build_tree(linked[:i], leaves)\n            break\n        if c1 in leaves:\n            curr.left = EdgeOccurrenceTree(leaves.index(c1))\n            curr.right = EdgeOccurrenceTree()\n            curr = curr.right\n        if c2 in leaves:\n            curr.right = EdgeOccurrenceTree(leaves.index(c2))\n            break\n        i -= 1\n    root = EdgeOccurrenceTree._cleanup_tree(root)\n    return root, i\n</code></pre>"},{"location":"reference/logos/edge_occurrence_tree/#logos.edge_occurrence_tree.EdgeOccurrenceTree._cleanup_tree","title":"<code>_cleanup_tree(root)</code>  <code>staticmethod</code>","text":"<p>Clean up the tree by removing nodes that have only one child, and nodes that have no children and are not leaves.</p> <p>Parameters:</p> Name Type Description Default <code>root</code> <code>Optional[Self]</code> <p>The root of the tree.</p> required <p>Returns:</p> Type Description <code>Self</code> <p>The root of the cleaned up tree.</p> Source code in <code>src/logos/edge_occurrence_tree.py</code> <pre><code>@staticmethod\ndef _cleanup_tree(root: Optional[Self]) -&gt; Self:\n    \"\"\"\n    Clean up the tree by removing nodes that have only one child, and nodes that have no\n    children and are not leaves.\n\n    Parameters:\n        root: The root of the tree.\n\n    Returns:\n        The root of the cleaned up tree.\n    \"\"\"\n\n    if root is None:\n        return None\n\n    # Recursively clean up left and right subtrees\n    root.left = EdgeOccurrenceTree._cleanup_tree(root.left)\n    root.right = EdgeOccurrenceTree._cleanup_tree(root.right)\n\n    # If the current node has only one child, replace the node with its child\n    if root.left is None and root.right is not None:\n        return root.right\n    elif root.left is not None and root.right is None:\n        return root.left\n\n    # If the current node has no left and right child and is not a leaf, remove the node\n    if root.left is None and root.right is None and root.cluster_id is None:\n        return None\n\n    return root\n</code></pre>"},{"location":"reference/logos/edge_occurrence_tree/#logos.edge_occurrence_tree.EdgeOccurrenceTree.print_tree","title":"<code>print_tree(depth=0)</code>","text":"<p>Print the tree in a readable format.</p> <p>Parameters:</p> Name Type Description Default <code>depth</code> <code>int</code> <p>The depth of the current node in the tree.</p> <code>0</code> Source code in <code>src/logos/edge_occurrence_tree.py</code> <pre><code>def print_tree(self, depth: int = 0) -&gt; None:\n    \"\"\"\n    Print the tree in a readable format.\n\n    Parameters:\n        depth: The depth of the current node in the tree.\n    \"\"\"\n\n    prefix = \"\"\n    for _ in range(depth):\n        prefix += \"-\"\n    if self.cluster_id is not None:\n        Printer.printv(prefix + str(self.cluster_id))\n    else:\n        Printer.printv(prefix + \"node\")\n    if self.left:\n        self.left.print_tree(depth + 1)\n    if self.right:\n        self.right.print_tree(depth + 1)\n</code></pre>"},{"location":"reference/logos/edge_occurrence_tree/#logos.edge_occurrence_tree.EdgeOccurrenceTree.assign_dags_to_nodes","title":"<code>assign_dags_to_nodes(cluster_mapping)</code>","text":"<p>Assign each DAG to the node it belongs to, based on <code>cluster_mapping</code>.</p> <p>Parameters:</p> Name Type Description Default <code>cluster_mapping</code> <code>dict[DiGraph, int]</code> <p>A dictionary mapping DAGs to cluster id's.</p> required Source code in <code>src/logos/edge_occurrence_tree.py</code> <pre><code>def assign_dags_to_nodes(self, cluster_mapping: dict[nx.DiGraph, int]) -&gt; None:\n    \"\"\"\n    Assign each DAG to the node it belongs to, based on `cluster_mapping`.\n\n    Parameters:\n        cluster_mapping: A dictionary mapping DAGs to cluster id's.\n    \"\"\"\n    self.num_dags = 0\n\n    # If leaf, assign DAGs and set count.\n    if self.cluster_id is not None:\n        self.dags = [\n            key\n            for key in cluster_mapping.keys()\n            if cluster_mapping[key] == self.cluster_id\n        ]\n        self.num_dags = len(self.dags)\n\n    # Otherwise, recurse for children and retireve counts.\n    if self.left:\n        self.left.assign_dags_to_nodes(cluster_mapping)\n        self.num_dags += self.left.num_dags\n    if self.right:\n        self.right.assign_dags_to_nodes(cluster_mapping)\n        self.num_dags += self.right.num_dags\n</code></pre>"},{"location":"reference/logos/edge_occurrence_tree/#logos.edge_occurrence_tree.EdgeOccurrenceTree.count_edge_occurrences","title":"<code>count_edge_occurrences(treatment, outcome, dag)</code>","text":"<p>Recursively count the number of times each edge occurs amongst the DAGs assigned to all the children of this node, omitting the edge from treatment -&gt; outcome, since this always exists. If a DAG is passed in, ignore the edges in that DAG as well.</p> <p>Parameters:</p> Name Type Description Default <code>treatment</code> <code>str</code> <p>The treatment variable.</p> required <code>outcome</code> <code>str</code> <p>The outcome variable.</p> required <code>dag</code> <code>DiGraph</code> <p>The optional dag structure to ignore.</p> required Source code in <code>src/logos/edge_occurrence_tree.py</code> <pre><code>def count_edge_occurrences(\n    self, treatment: str, outcome: str, dag: nx.DiGraph\n) -&gt; None:\n    \"\"\"\n    Recursively count the number of times each edge occurs amongst the DAGs\n    assigned to all the children of this node, omitting the edge from treatment -&gt; outcome,\n    since this always exists. If a DAG is passed in, ignore the edges in that DAG as well.\n\n    Parameters:\n        treatment: The treatment variable.\n        outcome: The outcome variable.\n        dag: The optional dag structure to ignore.\n    \"\"\"\n    self.edge_counts: Types.EdgeCountDict = defaultdict(int)\n\n    # If leaf, actually compute count.\n    if self.cluster_id is not None:\n        edges_to_ignore = [(treatment, outcome)]\n        if dag:\n            edges_to_ignore.extend(dag.edges)\n        for graph in self.dags:\n            for edge in graph.edges:\n                if edge not in edges_to_ignore:\n                    self.edge_counts[edge] += 1\n\n    # Otherwise, derive counts from children.\n    if self.left:\n        self.left.count_edge_occurrences(treatment, outcome, dag)\n        for key in self.left.edge_counts.keys():\n            self.edge_counts[key] += self.left.edge_counts[key]\n    if self.right:\n        self.right.count_edge_occurrences(treatment, outcome, dag)\n        for key in self.right.edge_counts.keys():\n            self.edge_counts[key] += self.right.edge_counts[key]\n\n    # Compute statistics.\n    freq_counts = list(self.edge_counts.values())\n    if len(freq_counts) == 0:\n        self.mean = None\n        self.std_dev = None\n    else:\n        self.mean = np.mean(freq_counts)\n        self.std_dev = np.std(freq_counts)\n</code></pre>"},{"location":"reference/logos/edge_occurrence_tree/#logos.edge_occurrence_tree.EdgeOccurrenceTree.calculate_edge_expectancy","title":"<code>calculate_edge_expectancy(totals=None)</code>","text":"<p>For each edge at each node, calculate what percent over or under expectancy the edge is at in relationship to its parent.</p> <p>Parameters:</p> Name Type Description Default <code>totals</code> <code>tuple[int, EdgeCountDict]</code> <p>A tuple containing the total number of DAGs and the mapping from edges to their counts for the parent of this node.</p> <code>None</code> Source code in <code>src/logos/edge_occurrence_tree.py</code> <pre><code>def calculate_edge_expectancy(\n    self, totals: tuple[int, Types.EdgeCountDict] = None\n) -&gt; None:\n    \"\"\"\n    For each edge at each node, calculate what percent over or under\n    expectancy the edge is at in relationship to its parent.\n\n    Parameters:\n        totals: A tuple containing the total number of DAGs and the mapping from\n            edges to their counts for the parent of this node.\n    \"\"\"\n    # At root node, calculate expectancy\n    if totals is None:\n        totals = (self.num_dags, self.edge_counts)\n\n    # Otherwise, calculate expectancy based on parent.\n    total_dags, total_edges = totals\n    self.percent_expectancy = defaultdict(float)\n\n    for edge in self.edge_counts.keys():\n        expected = self.num_dags / total_dags * total_edges[edge]\n        self.percent_expectancy[edge] = (\n            self.edge_counts[edge] - expected\n        ) / expected\n\n    # Recurse for children.\n    if self.left:\n        self.left.calculate_edge_expectancy((self.num_dags, self.edge_counts))\n    if self.right:\n        self.right.calculate_edge_expectancy((self.num_dags, self.edge_counts))\n</code></pre>"},{"location":"reference/logos/edge_occurrence_tree/#logos.edge_occurrence_tree.EdgeOccurrenceTree.find_outliers_in_tree","title":"<code>find_outliers_in_tree(threshold=0)</code>","text":"<p>Find outlier edges, based on the percent expectancy of each edge. Define an outlier as an edge that is below expectancy on one side of the tree, and above on the other side, and optionally, over some threshold on both sides.</p> <p>Parameters:</p> Name Type Description Default <code>threshold</code> <code>float</code> <p>The threshold for an edge to be considered an outlier.</p> <code>0</code> Source code in <code>src/logos/edge_occurrence_tree.py</code> <pre><code>def find_outliers_in_tree(self, threshold: float = 0) -&gt; None:\n    \"\"\"\n    Find outlier edges, based on the percent expectancy of each edge. Define an outlier as an\n    edge that is below expectancy on one side of the tree, and above on the other side, and\n    optionally, over some threshold on both sides.\n\n    Parameters:\n        threshold: The threshold for an edge to be considered an outlier.\n    \"\"\"\n\n    # If able to compare, find outliers.\n    if self.left and self.right:\n        self.left.outliers = {}\n        self.right.outliers = {}\n        edges = set(self.left.edge_counts.keys()).union(\n            set(self.right.edge_counts.keys())\n        )\n        for edge in edges:\n            if (\n                np.sign(self.left.percent_expectancy[edge])\n                != np.sign(self.right.percent_expectancy[edge])\n                and abs(self.left.percent_expectancy[edge]) &gt; threshold\n                and abs(self.right.percent_expectancy[edge]) &gt; threshold\n            ):\n                self.left.outliers[edge] = self.left.percent_expectancy[edge]\n                self.right.outliers[edge] = self.right.percent_expectancy[edge]\n\n    # Recurse for children.\n    if self.left:\n        self.left.find_outliers_in_tree(threshold)\n    if self.right:\n        self.right.find_outliers_in_tree(threshold)\n</code></pre>"},{"location":"reference/logos/edge_occurrence_tree/#logos.edge_occurrence_tree.EdgeOccurrenceTree.find_outliers_per_cluster","title":"<code>find_outliers_per_cluster(dag)</code>","text":"<p>Collect the edge counts and outliers found earlier into appropriate dictionaries per cluster.</p> <p>Parameters:</p> Name Type Description Default <code>dag</code> <code>DiGraph</code> <p>The DAG to ignore when collecting outliers.</p> required <p>Returns:</p> Type Description <code>EdgeCountDict</code> <p>A tuple containing the following: a dictionary mapping cluster id's to edge counts,</p> <code>dict[Edge, float]</code> <p>and a dictionary mapping cluster id's to outlier edges.</p> Source code in <code>src/logos/edge_occurrence_tree.py</code> <pre><code>def find_outliers_per_cluster(\n    self,\n    dag: nx.DiGraph,\n) -&gt; tuple[Types.EdgeCountDict, dict[Types.Edge, float]]:\n    \"\"\"\n    Collect the edge counts and outliers found earlier into appropriate dictionaries\n    per cluster.\n\n    Parameters:\n        dag: The DAG to ignore when collecting outliers.\n\n    Returns:\n        A tuple containing the following: a dictionary mapping cluster id's to edge counts,\n        and a dictionary mapping cluster id's to outlier edges.\n    \"\"\"\n\n    cluster_edge_count = {}\n    cluster_outliers = {}\n\n    # If leaf, add to cluster counts.\n    if self.cluster_id is not None:\n        cluster_edge_count[self.cluster_id] = self.edge_counts\n        edges_to_ignore = dag.edges if dag is not None else []\n        cluster_outliers[self.cluster_id] = {\n            edge: self.outliers[edge]\n            for edge in self.outliers\n            if edge not in edges_to_ignore\n        }\n\n    # Otherwise, recurse for children.\n    if self.left:\n        lec, lo = self.left.find_outliers_per_cluster(dag)\n        cluster_edge_count.update(lec)\n        cluster_outliers.update(lo)\n    if self.right:\n        rec, ro = self.right.find_outliers_per_cluster(dag)\n        cluster_edge_count.update(rec)\n        cluster_outliers.update(ro)\n\n    return cluster_edge_count, cluster_outliers\n</code></pre>"},{"location":"reference/logos/edge_state_matrix/","title":"EdgeStateMatrix","text":""},{"location":"reference/logos/edge_state_matrix/#logos.edge_state_matrix.EdgeStateMatrix","title":"<code>EdgeStateMatrix</code>","text":"<p>A class for managing an edge state matrix.</p> <p>An edge state matrix is square, with the entry (i,j) representing the state of the directed edge between nodes i and j. The state of an edge is one of:      0: The existence of the state is undecided.     -1: The edge does not exist.      1: The edge exists.</p> <p>Self-edges are not allowed. The presence of an edge implies the absence of its inverse.</p> Source code in <code>src/logos/edge_state_matrix.py</code> <pre><code>class EdgeStateMatrix:\n    \"\"\"\n    A class for managing an edge state matrix.\n\n    An edge state matrix is square, with the entry (i,j) representing the state\n    of the directed edge between nodes i and j. The state of an edge is one of:\n         0: The existence of the state is undecided.\n        -1: The edge does not exist.\n         1: The edge exists.\n\n    Self-edges are not allowed. The presence of an edge implies the absence of\n    its inverse.\n    \"\"\"\n\n    def __init__(self, variables: list[str]) -&gt; None:\n        \"\"\"\n        Initialize the edge state matrix to the right dimensions and mark self-edges\n        as rejected and all other edges as undecided.\n\n        Parameters:\n            variables: The variables to initialize the edge state matrix based on. This\n                list must include variable NAMES, not tags.\n        \"\"\"\n\n        n = len(variables)\n        self._variables = variables\n        self._m = np.zeros((n, n))\n        for i in range(n):\n            self._m[i, i] = -1\n\n    @property\n    def m(self) -&gt; np.ndarray:\n        \"\"\"\n        Returns the edge state matrix.\n        \"\"\"\n        return self._m\n\n    @property\n    def n(self) -&gt; int:\n        \"\"\"\n        Returns the number of nodes.\n        \"\"\"\n        return self._m.shape[0]\n\n    def clear_and_set_from_graph(self, graph: nx.DiGraph) -&gt; None:\n        \"\"\"\n        Clear the edge state matrix and then set it based on the provided graph.\n        In particular, mark all edges in the graph as accepted and all others as rejected.\n\n        Parameters:\n            graph: The graph to use to set the edge states.\n        \"\"\"\n\n        self._m = np.zeros((self.n, self.n))\n        for edge in graph.edges:\n            print(\"Marking edge as accepted: \", edge)\n            self._m[self.idx(edge[0]), self.idx(edge[1])] = 1\n\n        self._m[self._m == 0] = -1\n\n    def clear_and_set_from_matrix(self, m: np.ndarray) -&gt; None:\n        \"\"\"\n        Clear the edge state matrix and then set it based on the provided matrix.\n\n        Parameters:\n            m: The matrix to use to set the edge states.\n        \"\"\"\n\n        self._m = m\n\n    def idx(self, var: str) -&gt; int:\n        \"\"\"\n        Retrieve the index of a variable in the edge state matrix.\n\n        Parameters:\n            var: The name or tag of the variable.\n\n        Returns:\n            The index of the variable in the edge state matrix.\n        \"\"\"\n        return self._variables.index(var)\n\n    def get_edge_state(self, src: str, dst: str) -&gt; str:\n        \"\"\"\n        Get the state of a specific edge.\n\n        Parameters:\n            src: The name or tag of the source variable.\n            dst: The name or tag of the destination variable.\n\n        Returns:\n            The state of the edge (Accepted, Rejected, or Undecided).\n        \"\"\"\n        src_idx = self.idx(src)\n        dst_idx = self.idx(dst)\n        return self.edge_state_to_str(self._m[src_idx][dst_idx])\n\n    def edge_state_to_str(self, state: int) -&gt; str:\n        \"\"\"\n        Translate between edge value and its interpretation.\n\n        Parameters:\n            state: The state of the edge represented as an integer.\n\n        Returns:\n            The state of the edge (Accepted, Rejected, or Undecided).\n        \"\"\"\n        if state == 0:\n            return \"Undecided\"\n        elif state == -1:\n            return \"Rejected\"\n        elif state == 1:\n            return \"Accepted\"\n        else:\n            raise ValueError(f\"Invalid edge state {state}\")\n\n    def mark_edge(self, src: str, dst: str, state: str) -&gt; list[str]:\n        \"\"\"\n        Mark an edge as being in a specified state.\n\n        Parameters:\n            src: The name or tag of the source variable.\n            dst: The name or tag of the destination variable.\n            state: The state to mark the edge with (Accepted, Rejected, or Undecided).\n\n        Returns:\n            A list of variables that were removed from the partial causal graph as a result\n            of this edge being marked as Accepted.\n\n        Throws:\n            ValueError: If `state` is not one of \"Accepted\", \"Rejected\", or \"Undecided\".\n        \"\"\"\n\n        src_idx = self.idx(src)\n        dst_idx = self.idx(dst)\n\n        if state == \"Accepted\":\n            self._m[src_idx][dst_idx] = 1\n            self._m[dst_idx][src_idx] = -1\n            return self._reject_other_variants(src, dst)\n        elif state == \"Rejected\":\n            self._m[src_idx][dst_idx] = -1\n            return []\n        elif state == \"Undecided\":\n            self._m[src_idx][dst_idx] = 0\n            return []\n        else:\n            raise ValueError(f\"Invalid edge state {state}\")\n\n    def _reject_other_variants(self, src: str, dst: str) -&gt; list[str]:\n        \"\"\"\n        Mark any edges that touch a variable different from `src` and `dst`, but sharing\n        the same base variable as `src` or `dst`, as rejected. Also remove any such variables\n        from the partial causal graph.\n\n        Parameters:\n            src: The name or tag of the source variable.\n            dst: The name or tag of the destination variable.\n\n        Returns:\n            A list of variables that were removed from the partial causal graph as a result\n            of this edge being marked as Accepted.\n        \"\"\"\n\n        src_base = PreparedVariableName(src).base_var()\n        dst_base = PreparedVariableName(dst).base_var()\n\n        l = []\n        for var in self._variables:\n            var_base = PreparedVariableName(var).base_var()\n            if (var_base == src_base and var != src) or (\n                var_base == dst_base and var != dst\n            ):\n                self._m[self.idx(var), :] = -1\n                self._m[:, self.idx(var)] = -1\n                l.append(var)\n\n        return l \n\n    @staticmethod\n    def enumerate_with_max_edges(n: int, max_edges: int) -&gt; list[np.ndarray]:\n        \"\"\"\n        Enumerate all edge state matrices of dimension `n` with at most `max_edges` accepted edges.\n\n        Parameters:\n            n: The dimension of the edge state matrices.\n            max_edges: The maximum number of edges to allow in the edge state matrices.\n\n        Returns:\n            A list of edge state matrices.\n        \"\"\"\n        valid_matrices = {0: [np.full(shape=(n, n), fill_value=-1)]}\n\n        # Enumerate all valid matrices with k edges\n        for k in range(1, max_edges + 1):\n            valid_matrices[k] = []\n\n            # For each valid matrix with k-1 edges...\n            for m in valid_matrices[k - 1]:\n                # ...add a new edge in every possible way\n                for i in range(n):\n                    for j in range(i + 1, n):\n                        if m[i, j] &lt; 0 and m[j, i] &lt; 0:\n                            forward = m.copy()\n                            forward[i, j] = 1\n                            valid_matrices[k].append(forward)\n                            backward = m.copy()\n                            backward[j, i] = 1\n                            valid_matrices[k].append(backward)\n\n        # Flatten the collection of matrices into a single list\n        returned_matrices = []\n        for k in range(1, max_edges + 1):\n            returned_matrices.extend(valid_matrices[k])\n\n        return returned_matrices\n</code></pre>"},{"location":"reference/logos/edge_state_matrix/#logos.edge_state_matrix.EdgeStateMatrix.m","title":"<code>m: np.ndarray</code>  <code>property</code>","text":"<p>Returns the edge state matrix.</p>"},{"location":"reference/logos/edge_state_matrix/#logos.edge_state_matrix.EdgeStateMatrix.n","title":"<code>n: int</code>  <code>property</code>","text":"<p>Returns the number of nodes.</p>"},{"location":"reference/logos/edge_state_matrix/#logos.edge_state_matrix.EdgeStateMatrix.__init__","title":"<code>__init__(variables)</code>","text":"<p>Initialize the edge state matrix to the right dimensions and mark self-edges as rejected and all other edges as undecided.</p> <p>Parameters:</p> Name Type Description Default <code>variables</code> <code>list[str]</code> <p>The variables to initialize the edge state matrix based on. This list must include variable NAMES, not tags.</p> required Source code in <code>src/logos/edge_state_matrix.py</code> <pre><code>def __init__(self, variables: list[str]) -&gt; None:\n    \"\"\"\n    Initialize the edge state matrix to the right dimensions and mark self-edges\n    as rejected and all other edges as undecided.\n\n    Parameters:\n        variables: The variables to initialize the edge state matrix based on. This\n            list must include variable NAMES, not tags.\n    \"\"\"\n\n    n = len(variables)\n    self._variables = variables\n    self._m = np.zeros((n, n))\n    for i in range(n):\n        self._m[i, i] = -1\n</code></pre>"},{"location":"reference/logos/edge_state_matrix/#logos.edge_state_matrix.EdgeStateMatrix.clear_and_set_from_graph","title":"<code>clear_and_set_from_graph(graph)</code>","text":"<p>Clear the edge state matrix and then set it based on the provided graph. In particular, mark all edges in the graph as accepted and all others as rejected.</p> <p>Parameters:</p> Name Type Description Default <code>graph</code> <code>DiGraph</code> <p>The graph to use to set the edge states.</p> required Source code in <code>src/logos/edge_state_matrix.py</code> <pre><code>def clear_and_set_from_graph(self, graph: nx.DiGraph) -&gt; None:\n    \"\"\"\n    Clear the edge state matrix and then set it based on the provided graph.\n    In particular, mark all edges in the graph as accepted and all others as rejected.\n\n    Parameters:\n        graph: The graph to use to set the edge states.\n    \"\"\"\n\n    self._m = np.zeros((self.n, self.n))\n    for edge in graph.edges:\n        print(\"Marking edge as accepted: \", edge)\n        self._m[self.idx(edge[0]), self.idx(edge[1])] = 1\n\n    self._m[self._m == 0] = -1\n</code></pre>"},{"location":"reference/logos/edge_state_matrix/#logos.edge_state_matrix.EdgeStateMatrix.clear_and_set_from_matrix","title":"<code>clear_and_set_from_matrix(m)</code>","text":"<p>Clear the edge state matrix and then set it based on the provided matrix.</p> <p>Parameters:</p> Name Type Description Default <code>m</code> <code>ndarray</code> <p>The matrix to use to set the edge states.</p> required Source code in <code>src/logos/edge_state_matrix.py</code> <pre><code>def clear_and_set_from_matrix(self, m: np.ndarray) -&gt; None:\n    \"\"\"\n    Clear the edge state matrix and then set it based on the provided matrix.\n\n    Parameters:\n        m: The matrix to use to set the edge states.\n    \"\"\"\n\n    self._m = m\n</code></pre>"},{"location":"reference/logos/edge_state_matrix/#logos.edge_state_matrix.EdgeStateMatrix.idx","title":"<code>idx(var)</code>","text":"<p>Retrieve the index of a variable in the edge state matrix.</p> <p>Parameters:</p> Name Type Description Default <code>var</code> <code>str</code> <p>The name or tag of the variable.</p> required <p>Returns:</p> Type Description <code>int</code> <p>The index of the variable in the edge state matrix.</p> Source code in <code>src/logos/edge_state_matrix.py</code> <pre><code>def idx(self, var: str) -&gt; int:\n    \"\"\"\n    Retrieve the index of a variable in the edge state matrix.\n\n    Parameters:\n        var: The name or tag of the variable.\n\n    Returns:\n        The index of the variable in the edge state matrix.\n    \"\"\"\n    return self._variables.index(var)\n</code></pre>"},{"location":"reference/logos/edge_state_matrix/#logos.edge_state_matrix.EdgeStateMatrix.get_edge_state","title":"<code>get_edge_state(src, dst)</code>","text":"<p>Get the state of a specific edge.</p> <p>Parameters:</p> Name Type Description Default <code>src</code> <code>str</code> <p>The name or tag of the source variable.</p> required <code>dst</code> <code>str</code> <p>The name or tag of the destination variable.</p> required <p>Returns:</p> Type Description <code>str</code> <p>The state of the edge (Accepted, Rejected, or Undecided).</p> Source code in <code>src/logos/edge_state_matrix.py</code> <pre><code>def get_edge_state(self, src: str, dst: str) -&gt; str:\n    \"\"\"\n    Get the state of a specific edge.\n\n    Parameters:\n        src: The name or tag of the source variable.\n        dst: The name or tag of the destination variable.\n\n    Returns:\n        The state of the edge (Accepted, Rejected, or Undecided).\n    \"\"\"\n    src_idx = self.idx(src)\n    dst_idx = self.idx(dst)\n    return self.edge_state_to_str(self._m[src_idx][dst_idx])\n</code></pre>"},{"location":"reference/logos/edge_state_matrix/#logos.edge_state_matrix.EdgeStateMatrix.edge_state_to_str","title":"<code>edge_state_to_str(state)</code>","text":"<p>Translate between edge value and its interpretation.</p> <p>Parameters:</p> Name Type Description Default <code>state</code> <code>int</code> <p>The state of the edge represented as an integer.</p> required <p>Returns:</p> Type Description <code>str</code> <p>The state of the edge (Accepted, Rejected, or Undecided).</p> Source code in <code>src/logos/edge_state_matrix.py</code> <pre><code>def edge_state_to_str(self, state: int) -&gt; str:\n    \"\"\"\n    Translate between edge value and its interpretation.\n\n    Parameters:\n        state: The state of the edge represented as an integer.\n\n    Returns:\n        The state of the edge (Accepted, Rejected, or Undecided).\n    \"\"\"\n    if state == 0:\n        return \"Undecided\"\n    elif state == -1:\n        return \"Rejected\"\n    elif state == 1:\n        return \"Accepted\"\n    else:\n        raise ValueError(f\"Invalid edge state {state}\")\n</code></pre>"},{"location":"reference/logos/edge_state_matrix/#logos.edge_state_matrix.EdgeStateMatrix.mark_edge","title":"<code>mark_edge(src, dst, state)</code>","text":"<p>Mark an edge as being in a specified state.</p> <p>Parameters:</p> Name Type Description Default <code>src</code> <code>str</code> <p>The name or tag of the source variable.</p> required <code>dst</code> <code>str</code> <p>The name or tag of the destination variable.</p> required <code>state</code> <code>str</code> <p>The state to mark the edge with (Accepted, Rejected, or Undecided).</p> required <p>Returns:</p> Type Description <code>list[str]</code> <p>A list of variables that were removed from the partial causal graph as a result</p> <code>list[str]</code> <p>of this edge being marked as Accepted.</p> Throws <p>ValueError: If <code>state</code> is not one of \"Accepted\", \"Rejected\", or \"Undecided\".</p> Source code in <code>src/logos/edge_state_matrix.py</code> <pre><code>def mark_edge(self, src: str, dst: str, state: str) -&gt; list[str]:\n    \"\"\"\n    Mark an edge as being in a specified state.\n\n    Parameters:\n        src: The name or tag of the source variable.\n        dst: The name or tag of the destination variable.\n        state: The state to mark the edge with (Accepted, Rejected, or Undecided).\n\n    Returns:\n        A list of variables that were removed from the partial causal graph as a result\n        of this edge being marked as Accepted.\n\n    Throws:\n        ValueError: If `state` is not one of \"Accepted\", \"Rejected\", or \"Undecided\".\n    \"\"\"\n\n    src_idx = self.idx(src)\n    dst_idx = self.idx(dst)\n\n    if state == \"Accepted\":\n        self._m[src_idx][dst_idx] = 1\n        self._m[dst_idx][src_idx] = -1\n        return self._reject_other_variants(src, dst)\n    elif state == \"Rejected\":\n        self._m[src_idx][dst_idx] = -1\n        return []\n    elif state == \"Undecided\":\n        self._m[src_idx][dst_idx] = 0\n        return []\n    else:\n        raise ValueError(f\"Invalid edge state {state}\")\n</code></pre>"},{"location":"reference/logos/edge_state_matrix/#logos.edge_state_matrix.EdgeStateMatrix._reject_other_variants","title":"<code>_reject_other_variants(src, dst)</code>","text":"<p>Mark any edges that touch a variable different from <code>src</code> and <code>dst</code>, but sharing the same base variable as <code>src</code> or <code>dst</code>, as rejected. Also remove any such variables from the partial causal graph.</p> <p>Parameters:</p> Name Type Description Default <code>src</code> <code>str</code> <p>The name or tag of the source variable.</p> required <code>dst</code> <code>str</code> <p>The name or tag of the destination variable.</p> required <p>Returns:</p> Type Description <code>list[str]</code> <p>A list of variables that were removed from the partial causal graph as a result</p> <code>list[str]</code> <p>of this edge being marked as Accepted.</p> Source code in <code>src/logos/edge_state_matrix.py</code> <pre><code>def _reject_other_variants(self, src: str, dst: str) -&gt; list[str]:\n    \"\"\"\n    Mark any edges that touch a variable different from `src` and `dst`, but sharing\n    the same base variable as `src` or `dst`, as rejected. Also remove any such variables\n    from the partial causal graph.\n\n    Parameters:\n        src: The name or tag of the source variable.\n        dst: The name or tag of the destination variable.\n\n    Returns:\n        A list of variables that were removed from the partial causal graph as a result\n        of this edge being marked as Accepted.\n    \"\"\"\n\n    src_base = PreparedVariableName(src).base_var()\n    dst_base = PreparedVariableName(dst).base_var()\n\n    l = []\n    for var in self._variables:\n        var_base = PreparedVariableName(var).base_var()\n        if (var_base == src_base and var != src) or (\n            var_base == dst_base and var != dst\n        ):\n            self._m[self.idx(var), :] = -1\n            self._m[:, self.idx(var)] = -1\n            l.append(var)\n\n    return l \n</code></pre>"},{"location":"reference/logos/edge_state_matrix/#logos.edge_state_matrix.EdgeStateMatrix.enumerate_with_max_edges","title":"<code>enumerate_with_max_edges(n, max_edges)</code>  <code>staticmethod</code>","text":"<p>Enumerate all edge state matrices of dimension <code>n</code> with at most <code>max_edges</code> accepted edges.</p> <p>Parameters:</p> Name Type Description Default <code>n</code> <code>int</code> <p>The dimension of the edge state matrices.</p> required <code>max_edges</code> <code>int</code> <p>The maximum number of edges to allow in the edge state matrices.</p> required <p>Returns:</p> Type Description <code>list[ndarray]</code> <p>A list of edge state matrices.</p> Source code in <code>src/logos/edge_state_matrix.py</code> <pre><code>@staticmethod\ndef enumerate_with_max_edges(n: int, max_edges: int) -&gt; list[np.ndarray]:\n    \"\"\"\n    Enumerate all edge state matrices of dimension `n` with at most `max_edges` accepted edges.\n\n    Parameters:\n        n: The dimension of the edge state matrices.\n        max_edges: The maximum number of edges to allow in the edge state matrices.\n\n    Returns:\n        A list of edge state matrices.\n    \"\"\"\n    valid_matrices = {0: [np.full(shape=(n, n), fill_value=-1)]}\n\n    # Enumerate all valid matrices with k edges\n    for k in range(1, max_edges + 1):\n        valid_matrices[k] = []\n\n        # For each valid matrix with k-1 edges...\n        for m in valid_matrices[k - 1]:\n            # ...add a new edge in every possible way\n            for i in range(n):\n                for j in range(i + 1, n):\n                    if m[i, j] &lt; 0 and m[j, i] &lt; 0:\n                        forward = m.copy()\n                        forward[i, j] = 1\n                        valid_matrices[k].append(forward)\n                        backward = m.copy()\n                        backward[j, i] = 1\n                        valid_matrices[k].append(backward)\n\n    # Flatten the collection of matrices into a single list\n    returned_matrices = []\n    for k in range(1, max_edges + 1):\n        returned_matrices.extend(valid_matrices[k])\n\n    return returned_matrices\n</code></pre>"},{"location":"reference/logos/graph_renderer/","title":"GraphRenderer","text":""},{"location":"reference/logos/graph_renderer/#logos.graph_renderer.GraphRenderer","title":"<code>GraphRenderer</code>","text":"<p>Render a digraph with appropriate margins and node tags.</p> Source code in <code>src/logos/graph_renderer.py</code> <pre><code>class GraphRenderer:\n    \"\"\"\n    Render a digraph with appropriate margins and node tags.\n    \"\"\"\n\n    @staticmethod\n    def draw_graph(graph: nx.DiGraph, var_info: pd.DataFrame) -&gt; str:\n        \"\"\"\n        Draw a graph with appropriate margins and node tags.\n\n        Parameters:\n            graph: The graph to be drawn.\n            var_info: A dataframe containing the tags of the variables in the\n                graph.\n\n        Returns:\n            A base64-encoded string representation of the graph.\n        \"\"\"\n        if graph.number_of_nodes() == 0:\n            return \"\"\n\n        pos = nx.spring_layout(graph)\n        nx.draw(\n            graph,\n            pos,\n            edgelist=graph.edges(),\n            with_labels=False,\n            width=2.0,\n            node_color=\"#d3d3d3\",\n            edge_color=[graph[u][v].get(\"color\", \"#7f9aba\") for u, v in graph.edges()],\n        )\n        node_labels = {\n            n: (\n                n\n                if len(var_info.loc[var_info[\"Name\"] == n, \"Tag\"].values) == 0\n                else var_info.loc[var_info[\"Name\"] == n, \"Tag\"].values[0]\n            )\n            for n in list(graph.nodes)\n        }\n        text = nx.draw_networkx_labels(graph, pos, labels=node_labels, font_size=12)\n        for _, t in text.items():\n            t.set_rotation(30)\n\n        # Fix margins\n        x_values, y_values = zip(*pos.values())\n        x_max, x_min = max(x_values), min(x_values)\n        y_max, y_min = max(y_values), min(y_values)\n        if x_max != x_min:\n            x_margin = (x_max - x_min) * 0.3\n            plt.xlim(x_min - x_margin, x_max + x_margin)\n        if y_max != y_min:\n            y_margin = (y_max - y_min) * 0.3\n            plt.ylim(y_min - y_margin, y_max + y_margin)\n\n        buffer = BytesIO()\n        plt.savefig(buffer, format=\"png\")\n        plt.clf()\n        img_str = base64.b64encode(buffer.getvalue()).decode(\"utf-8\")\n        plt.close()\n\n        return img_str\n\n    @staticmethod\n    def save_graph(graph: nx.DiGraph, var_info: pd.DataFrame, filename: str) -&gt; None:\n        \"\"\"\n        Save the graph to a file as a png image.\n\n        Parameters:\n            graph: The graph to be saved.\n            var_info: A dataframe containing the tags of the variables in the\n                graph.\n            filename: The name of the file to which the graph should be saved.\n        \"\"\"\n        img_str = GraphRenderer.draw_graph(graph, var_info)\n        with open(filename, \"wb\") as f:\n            f.write(base64.b64decode(img_str))\n\n    @staticmethod\n    def graph_string_to_html(graph: str) -&gt; HTML:\n        \"\"\"\n        Convert the string representation of the rgaph to an HTML object\n\n        Parameters:\n            graph: The graph to be displayed.\n        \"\"\"\n        return HTML('&lt;img src=\"data:image/png;base64,{}\" style=\"max-width: 100%; height: auto;\"&gt;'.format(graph))\n\n    @staticmethod\n    def display_graph(graph: nx.DiGraph, var_info: pd.DataFrame) -&gt; None:\n        \"\"\"\n        Display the graph.\n\n        Parameters:\n            graph: The graph to be displayed.\n            var_info: A dataframe containing the tags of the variables in the\n                graph.\n        \"\"\"\n        display(\n            GraphRenderer.graph_string_to_html(\n                GraphRenderer.draw_graph(graph, var_info)\n            )\n        )\n</code></pre>"},{"location":"reference/logos/graph_renderer/#logos.graph_renderer.GraphRenderer.draw_graph","title":"<code>draw_graph(graph, var_info)</code>  <code>staticmethod</code>","text":"<p>Draw a graph with appropriate margins and node tags.</p> <p>Parameters:</p> Name Type Description Default <code>graph</code> <code>DiGraph</code> <p>The graph to be drawn.</p> required <code>var_info</code> <code>DataFrame</code> <p>A dataframe containing the tags of the variables in the graph.</p> required <p>Returns:</p> Type Description <code>str</code> <p>A base64-encoded string representation of the graph.</p> Source code in <code>src/logos/graph_renderer.py</code> <pre><code>@staticmethod\ndef draw_graph(graph: nx.DiGraph, var_info: pd.DataFrame) -&gt; str:\n    \"\"\"\n    Draw a graph with appropriate margins and node tags.\n\n    Parameters:\n        graph: The graph to be drawn.\n        var_info: A dataframe containing the tags of the variables in the\n            graph.\n\n    Returns:\n        A base64-encoded string representation of the graph.\n    \"\"\"\n    if graph.number_of_nodes() == 0:\n        return \"\"\n\n    pos = nx.spring_layout(graph)\n    nx.draw(\n        graph,\n        pos,\n        edgelist=graph.edges(),\n        with_labels=False,\n        width=2.0,\n        node_color=\"#d3d3d3\",\n        edge_color=[graph[u][v].get(\"color\", \"#7f9aba\") for u, v in graph.edges()],\n    )\n    node_labels = {\n        n: (\n            n\n            if len(var_info.loc[var_info[\"Name\"] == n, \"Tag\"].values) == 0\n            else var_info.loc[var_info[\"Name\"] == n, \"Tag\"].values[0]\n        )\n        for n in list(graph.nodes)\n    }\n    text = nx.draw_networkx_labels(graph, pos, labels=node_labels, font_size=12)\n    for _, t in text.items():\n        t.set_rotation(30)\n\n    # Fix margins\n    x_values, y_values = zip(*pos.values())\n    x_max, x_min = max(x_values), min(x_values)\n    y_max, y_min = max(y_values), min(y_values)\n    if x_max != x_min:\n        x_margin = (x_max - x_min) * 0.3\n        plt.xlim(x_min - x_margin, x_max + x_margin)\n    if y_max != y_min:\n        y_margin = (y_max - y_min) * 0.3\n        plt.ylim(y_min - y_margin, y_max + y_margin)\n\n    buffer = BytesIO()\n    plt.savefig(buffer, format=\"png\")\n    plt.clf()\n    img_str = base64.b64encode(buffer.getvalue()).decode(\"utf-8\")\n    plt.close()\n\n    return img_str\n</code></pre>"},{"location":"reference/logos/graph_renderer/#logos.graph_renderer.GraphRenderer.save_graph","title":"<code>save_graph(graph, var_info, filename)</code>  <code>staticmethod</code>","text":"<p>Save the graph to a file as a png image.</p> <p>Parameters:</p> Name Type Description Default <code>graph</code> <code>DiGraph</code> <p>The graph to be saved.</p> required <code>var_info</code> <code>DataFrame</code> <p>A dataframe containing the tags of the variables in the graph.</p> required <code>filename</code> <code>str</code> <p>The name of the file to which the graph should be saved.</p> required Source code in <code>src/logos/graph_renderer.py</code> <pre><code>@staticmethod\ndef save_graph(graph: nx.DiGraph, var_info: pd.DataFrame, filename: str) -&gt; None:\n    \"\"\"\n    Save the graph to a file as a png image.\n\n    Parameters:\n        graph: The graph to be saved.\n        var_info: A dataframe containing the tags of the variables in the\n            graph.\n        filename: The name of the file to which the graph should be saved.\n    \"\"\"\n    img_str = GraphRenderer.draw_graph(graph, var_info)\n    with open(filename, \"wb\") as f:\n        f.write(base64.b64decode(img_str))\n</code></pre>"},{"location":"reference/logos/graph_renderer/#logos.graph_renderer.GraphRenderer.graph_string_to_html","title":"<code>graph_string_to_html(graph)</code>  <code>staticmethod</code>","text":"<p>Convert the string representation of the rgaph to an HTML object</p> <p>Parameters:</p> Name Type Description Default <code>graph</code> <code>str</code> <p>The graph to be displayed.</p> required Source code in <code>src/logos/graph_renderer.py</code> <pre><code>@staticmethod\ndef graph_string_to_html(graph: str) -&gt; HTML:\n    \"\"\"\n    Convert the string representation of the rgaph to an HTML object\n\n    Parameters:\n        graph: The graph to be displayed.\n    \"\"\"\n    return HTML('&lt;img src=\"data:image/png;base64,{}\" style=\"max-width: 100%; height: auto;\"&gt;'.format(graph))\n</code></pre>"},{"location":"reference/logos/graph_renderer/#logos.graph_renderer.GraphRenderer.display_graph","title":"<code>display_graph(graph, var_info)</code>  <code>staticmethod</code>","text":"<p>Display the graph.</p> <p>Parameters:</p> Name Type Description Default <code>graph</code> <code>DiGraph</code> <p>The graph to be displayed.</p> required <code>var_info</code> <code>DataFrame</code> <p>A dataframe containing the tags of the variables in the graph.</p> required Source code in <code>src/logos/graph_renderer.py</code> <pre><code>@staticmethod\ndef display_graph(graph: nx.DiGraph, var_info: pd.DataFrame) -&gt; None:\n    \"\"\"\n    Display the graph.\n\n    Parameters:\n        graph: The graph to be displayed.\n        var_info: A dataframe containing the tags of the variables in the\n            graph.\n    \"\"\"\n    display(\n        GraphRenderer.graph_string_to_html(\n            GraphRenderer.draw_graph(graph, var_info)\n        )\n    )\n</code></pre>"},{"location":"reference/logos/interactive_causal_graph_refiner/","title":"InteractiveCausalGraphRefiner","text":""},{"location":"reference/logos/interactive_causal_graph_refiner/#logos.interactive_causal_graph_refiner.InteractiveCausalGraphRefiner","title":"<code>InteractiveCausalGraphRefiner</code>","text":"Source code in <code>src/logos/interactive_causal_graph_refiner.py</code> <pre><code>class InteractiveCausalGraphRefiner:\n\n    @staticmethod\n    def get_suggestion(\n        data: pd.DataFrame,\n        method: InteractiveCausalGraphRefinerMethod,\n        eccs: Optional[ECCS] = None,\n        treatment_name: Optional[str] = None,\n        outcome_name: Optional[str] = None,\n        graph: Optional[nx.DiGraph] = None,\n        model: Optional[str] = None,\n        gpt_log_path: Optional[str] = None,\n        data_tags: Optional[pd.DataFrame] = None,\n    ) -&gt; Edge:\n        \"\"\"\n        Get the next edge for which the user should porduce a judgment, in the\n        process of refining a causal graph.\n\n        Parameters:\n            data: The dataframe containing the data.\n            method: The method to use for suggesting the next edge.\n            eccs: The ECCS object to use for suggesting the next edge. Only applies\n                if `method` is `InteractiveCausalGraphRefinerMethod.LOGOS`.\n            treatment_name: The name of the treatment variable. Only applies if\n                `method` is `InteractiveCausalGraphRefinerMethod.LOGOS` or\n                `InteractiveCausalGraphRefinerMethod.LANGMODEL`.\n            outcome_name: The name of the outcome variable. Only applies if\n                `method` is `InteractiveCausalGraphRefinerMethod.LOGOS` or\n                `InteractiveCausalGraphRefinerMethod.LANGMODEL`.\n            graph: The graph to use for suggesting the next edge. Only applies if\n                `method` is `InteractiveCausalGraphRefinerMethod.REGRESSION` or\n                `InteractiveCausalGraphRefinerMethod.LANGMODEL`.\n            model: The model to use for suggesting the next edge. Only applies if\n                `method` is not `InteractiveCausalGraphRefinerMethod.LANGMODEL`.\n            gpt_log_path: The path to the GPT log file. Only applies if `method` is\n                `InteractiveCausalGraphRefinerMethod.LANGMODEL`.\n            data_tags: The dataframe containing the data tags. Only applies if `method`\n                is `InteractiveCausalGraphRefinerMethod.LANGMODEL`.\n\n        Returns:\n            The next edge for which the user should produce a judgment.\n        \"\"\"\n        if method == InteractiveCausalGraphRefinerMethod.LOGOS:\n            return InteractiveCausalGraphRefiner._get_suggestion_logos(\n                eccs, treatment_name, outcome_name\n            )\n        elif method == InteractiveCausalGraphRefinerMethod.REGRESSION:\n            return InteractiveCausalGraphRefiner._get_suggestion_regression(data, graph)\n        elif method == InteractiveCausalGraphRefinerMethod.LANGMODEL:\n            return InteractiveCausalGraphRefiner._get_suggestion_langmodel(\n                data,\n                data_tags,\n                treatment_name,\n                outcome_name,\n                graph,\n                model,\n                gpt_log_path,\n            )\n        else:\n            raise ValueError(f\"Unknown method: {method}\")\n\n    @staticmethod\n    def _get_suggestion_logos(\n        eccs: ECCS, treatment_name: str, outcome_name: str\n    ) -&gt; Edge:\n        \"\"\"\n        Implement `get_suggestion()` for the `LOGOS` method.\n\n        Parameters:\n            eccs: The ECCS object to use for suggesting the next edge.\n            treatment_name: The name of the treatment variable.\n            outcome_name: The name of the outcome variable.\n\n        Returns:\n            The next edge for which the user should produce a judgment.\n        \"\"\"\n        eccs.set_treatment(treatment_name)\n        eccs.set_outcome(outcome_name)\n        edge_edits, _, _ = eccs.suggest_best_single_adjustment_set_change(\n            max_results=1, use_optimized=True\n        )\n        return edge_edits[0].edge if (edge_edits and len(edge_edits) &gt; 0) else None\n\n    most_recent_graph = None\n    cache = []\n\n    @classmethod\n    def _get_suggestion_regression(cls, data: pd.DataFrame, graph: nx.DiGraph) -&gt; Edge:\n        \"\"\"\n        Implement `get_suggestion()` for the `REGRESSION` method.\n\n        Parameters:\n            data: The dataframe containing the data.\n            graph: The graph to use for suggesting the next edge.\n        \"\"\"\n        if graph != cls.most_recent_graph:\n            cls.most_recent_graph = graph\n            cls.cache = []\n        if len(cls.cache) &gt; 0:\n            return cls.cache.pop(0)\n\n        l = []\n\n        data, _ = Regression.get_normalized_copy(data)\n\n        for v in graph.nodes:\n            for w in set(data.columns) - set(graph.neighbors(v)) - set([v]):\n                d = Regression.ols(w, data[w], data[v])\n                abs_slope = abs(d[\"Slope\"])\n                l.append((Edge((w, v)), abs_slope))\n\n        l.sort(key=lambda x: x[1], reverse=True)\n        cls.cache = [row[0] for row in l[1:]]\n\n        return l[0][0]\n\n    @classmethod\n    def _get_suggestion_langmodel(\n        cls,\n        data: pd.DataFrame,\n        data_tags: pd.DataFrame,\n        treatment_name: str,\n        outcome_name: str,\n        graph: nx.DiGraph,\n        model: str = \"gpt-4o-mini-2024-07-18\",\n        gpt_log_path: Optional[str] = None,\n    ) -&gt; Edge:\n        \"\"\"\n        Implement `get_suggestion()` for the `LANGMODEL` method.\n\n        Parameters:\n            data: The dataframe containing the data.\n            treatment_name: The name of the treatment variable.\n            outcome_name: The name of the outcome variable.\n            graph: The graph to use for suggesting the next edge.\n            model: The model to use for suggesting the next edge.\n            gpt_log_path: The path to the GPT log file.\n            data_tags: The dataframe containing the data tags.\n        \"\"\"\n        if graph != cls.most_recent_graph:\n            cls.most_recent_graph = graph\n            cls.cache = []\n        if len(cls.cache) &gt; 0:\n            return cls.cache.pop(0)\n\n        client = OpenAI()\n\n        treatment_tag = TagUtils.tag_of(data_tags, treatment_name, \"prepared\")\n        outcome_tag = TagUtils.tag_of(data_tags, outcome_name, \"prepared\")\n\n        num_samples_per_var = 3\n\n        if gpt_log_path == None:\n            gpt_log_path = (\n                f\"ranker-gpt-{datetime.now().strftime('%Y-%m-%d-%H-%M-%S')}.log\"\n            )\n        with open(gpt_log_path, \"w+\") as f:\n\n            # Define the messages to send to the model\n            messages = [\n                {\n                    \"role\": \"system\",\n                    \"content\": \"You are a helpful assistant for causal reasoning.\",\n                },\n                {\n                    \"role\": \"user\",\n                    \"content\": f\"\"\"Below is a list of variable names and some example distinct values for each. \"\"\"\n                    f\"\"\"The lists are not sorted in compatible ways, so that elements in the same position may not correspond to the same entity. \"\"\"\n                    f\"\"\"{', '.join([f'{TagUtils.tag_of(data_tags, v, \"prepared\")}: [{\", \".join(str(x) for x in data[v].unique().tolist()[:num_samples_per_var])}]' for v in data.columns])}\"\"\"\n                    \"\"\"\\n\\n\"\"\"\n                    \"\"\"I have constructed a partial causal graph over these variables. Here is the list of directed edges: \"\"\"\n                    f\"\"\"[{', '.join([f'({TagUtils.tag_of(data_tags, u, \"prepared\")}, {TagUtils.tag_of(data_tags, v, \"prepared\")})' for u, v in graph.edges])}]\"\"\"\n                    \"\"\"\\n\\n\"\"\"\n                    f\"\"\"I plan to use this causal graph to calculate the ATE of {treatment_tag} on {outcome_tag}. \"\"\"\n                    \"\"\"However, I'm not sure of its correctness nor completeness. \"\"\"\n                    \"\"\"I want you to rank pairs of variables from this collection of variables, based on how important it is for me to either add or remove an edge between them in the graph\"\"\"\n                    \"\"\" for the accuracy of my ATE calculation. \"\"\"\n                    \"\"\"I understand that you may think this is speculative, but I want you to do your best to come up with such a ranked list ALWAYS. \"\"\"\n                    \"\"\"I will interpret any results you give me knowing that you may not be sure about them. \"\"\"\n                    \"\"\"Only return the ranked answers, one per line, preceded by a number and a period. Separate each variable in a pair with a comma. \"\"\"\n                    \"\"\"Do not return any other text before or after the list.\"\"\",\n                },\n            ]\n\n            reply = (\n                client.chat.completions.create(model=model, messages=messages)\n                .choices[0]\n                .message.content\n            )\n\n            # Log the messages and the reply\n            f.write(f\"{datetime.now()}\\n\")\n            f.write(\"Messages:\\n\")\n            for message in messages:\n                f.write(f\"{message['role']}: {message['content']}\\n\")\n            f.write(\"----------------\\n\")\n            f.write(f\"Reply: {reply}\\n\\n\")\n            f.write(\"================\\n\")\n            f.flush()\n            f.close()\n\n        # Combat hallucinations\n        reply_rows = reply.split(\"\\n\")\n        reply_rows = [\n            row for row in reply_rows if row.strip() != \"\" and row[0].isdigit()\n        ]\n        possibly_ranked_edges = [\n            [v.strip() for v in \".\".join(row.split(\".\")[1:]).strip().split(\",\")]\n            for row in reply_rows\n        ]\n        ranked_edges = []\n        tags = data_tags[\"Tag\"].values\n        for edge in possibly_ranked_edges:\n            if len(edge) != 2:\n                continue\n\n            left = None\n            right = None\n\n            if edge[0] in tags:\n                left = edge[0]\n            elif f\"{edge[0]} mean\" in tags:\n                left = f\"{edge[0]} mean\"\n\n            if edge[1] in tags:\n                right = edge[1]\n            elif f\"{edge[1]} mean\" in tags:\n                right = f\"{edge[1]} mean\"\n\n            if left is not None and right is not None:\n                ranked_edges.append(Edge((left, right)))\n\n        cls.cache = ranked_edges[1:]\n        return ranked_edges[0]\n</code></pre>"},{"location":"reference/logos/interactive_causal_graph_refiner/#logos.interactive_causal_graph_refiner.InteractiveCausalGraphRefiner.get_suggestion","title":"<code>get_suggestion(data, method, eccs=None, treatment_name=None, outcome_name=None, graph=None, model=None, gpt_log_path=None, data_tags=None)</code>  <code>staticmethod</code>","text":"<p>Get the next edge for which the user should porduce a judgment, in the process of refining a causal graph.</p> <p>Parameters:</p> Name Type Description Default <code>data</code> <code>DataFrame</code> <p>The dataframe containing the data.</p> required <code>method</code> <code>InteractiveCausalGraphRefinerMethod</code> <p>The method to use for suggesting the next edge.</p> required <code>eccs</code> <code>Optional[ECCS]</code> <p>The ECCS object to use for suggesting the next edge. Only applies if <code>method</code> is <code>InteractiveCausalGraphRefinerMethod.LOGOS</code>.</p> <code>None</code> <code>treatment_name</code> <code>Optional[str]</code> <p>The name of the treatment variable. Only applies if <code>method</code> is <code>InteractiveCausalGraphRefinerMethod.LOGOS</code> or <code>InteractiveCausalGraphRefinerMethod.LANGMODEL</code>.</p> <code>None</code> <code>outcome_name</code> <code>Optional[str]</code> <p>The name of the outcome variable. Only applies if <code>method</code> is <code>InteractiveCausalGraphRefinerMethod.LOGOS</code> or <code>InteractiveCausalGraphRefinerMethod.LANGMODEL</code>.</p> <code>None</code> <code>graph</code> <code>Optional[DiGraph]</code> <p>The graph to use for suggesting the next edge. Only applies if <code>method</code> is <code>InteractiveCausalGraphRefinerMethod.REGRESSION</code> or <code>InteractiveCausalGraphRefinerMethod.LANGMODEL</code>.</p> <code>None</code> <code>model</code> <code>Optional[str]</code> <p>The model to use for suggesting the next edge. Only applies if <code>method</code> is not <code>InteractiveCausalGraphRefinerMethod.LANGMODEL</code>.</p> <code>None</code> <code>gpt_log_path</code> <code>Optional[str]</code> <p>The path to the GPT log file. Only applies if <code>method</code> is <code>InteractiveCausalGraphRefinerMethod.LANGMODEL</code>.</p> <code>None</code> <code>data_tags</code> <code>Optional[DataFrame]</code> <p>The dataframe containing the data tags. Only applies if <code>method</code> is <code>InteractiveCausalGraphRefinerMethod.LANGMODEL</code>.</p> <code>None</code> <p>Returns:</p> Type Description <code>Edge</code> <p>The next edge for which the user should produce a judgment.</p> Source code in <code>src/logos/interactive_causal_graph_refiner.py</code> <pre><code>@staticmethod\ndef get_suggestion(\n    data: pd.DataFrame,\n    method: InteractiveCausalGraphRefinerMethod,\n    eccs: Optional[ECCS] = None,\n    treatment_name: Optional[str] = None,\n    outcome_name: Optional[str] = None,\n    graph: Optional[nx.DiGraph] = None,\n    model: Optional[str] = None,\n    gpt_log_path: Optional[str] = None,\n    data_tags: Optional[pd.DataFrame] = None,\n) -&gt; Edge:\n    \"\"\"\n    Get the next edge for which the user should porduce a judgment, in the\n    process of refining a causal graph.\n\n    Parameters:\n        data: The dataframe containing the data.\n        method: The method to use for suggesting the next edge.\n        eccs: The ECCS object to use for suggesting the next edge. Only applies\n            if `method` is `InteractiveCausalGraphRefinerMethod.LOGOS`.\n        treatment_name: The name of the treatment variable. Only applies if\n            `method` is `InteractiveCausalGraphRefinerMethod.LOGOS` or\n            `InteractiveCausalGraphRefinerMethod.LANGMODEL`.\n        outcome_name: The name of the outcome variable. Only applies if\n            `method` is `InteractiveCausalGraphRefinerMethod.LOGOS` or\n            `InteractiveCausalGraphRefinerMethod.LANGMODEL`.\n        graph: The graph to use for suggesting the next edge. Only applies if\n            `method` is `InteractiveCausalGraphRefinerMethod.REGRESSION` or\n            `InteractiveCausalGraphRefinerMethod.LANGMODEL`.\n        model: The model to use for suggesting the next edge. Only applies if\n            `method` is not `InteractiveCausalGraphRefinerMethod.LANGMODEL`.\n        gpt_log_path: The path to the GPT log file. Only applies if `method` is\n            `InteractiveCausalGraphRefinerMethod.LANGMODEL`.\n        data_tags: The dataframe containing the data tags. Only applies if `method`\n            is `InteractiveCausalGraphRefinerMethod.LANGMODEL`.\n\n    Returns:\n        The next edge for which the user should produce a judgment.\n    \"\"\"\n    if method == InteractiveCausalGraphRefinerMethod.LOGOS:\n        return InteractiveCausalGraphRefiner._get_suggestion_logos(\n            eccs, treatment_name, outcome_name\n        )\n    elif method == InteractiveCausalGraphRefinerMethod.REGRESSION:\n        return InteractiveCausalGraphRefiner._get_suggestion_regression(data, graph)\n    elif method == InteractiveCausalGraphRefinerMethod.LANGMODEL:\n        return InteractiveCausalGraphRefiner._get_suggestion_langmodel(\n            data,\n            data_tags,\n            treatment_name,\n            outcome_name,\n            graph,\n            model,\n            gpt_log_path,\n        )\n    else:\n        raise ValueError(f\"Unknown method: {method}\")\n</code></pre>"},{"location":"reference/logos/interactive_causal_graph_refiner/#logos.interactive_causal_graph_refiner.InteractiveCausalGraphRefiner._get_suggestion_logos","title":"<code>_get_suggestion_logos(eccs, treatment_name, outcome_name)</code>  <code>staticmethod</code>","text":"<p>Implement <code>get_suggestion()</code> for the <code>LOGOS</code> method.</p> <p>Parameters:</p> Name Type Description Default <code>eccs</code> <code>ECCS</code> <p>The ECCS object to use for suggesting the next edge.</p> required <code>treatment_name</code> <code>str</code> <p>The name of the treatment variable.</p> required <code>outcome_name</code> <code>str</code> <p>The name of the outcome variable.</p> required <p>Returns:</p> Type Description <code>Edge</code> <p>The next edge for which the user should produce a judgment.</p> Source code in <code>src/logos/interactive_causal_graph_refiner.py</code> <pre><code>@staticmethod\ndef _get_suggestion_logos(\n    eccs: ECCS, treatment_name: str, outcome_name: str\n) -&gt; Edge:\n    \"\"\"\n    Implement `get_suggestion()` for the `LOGOS` method.\n\n    Parameters:\n        eccs: The ECCS object to use for suggesting the next edge.\n        treatment_name: The name of the treatment variable.\n        outcome_name: The name of the outcome variable.\n\n    Returns:\n        The next edge for which the user should produce a judgment.\n    \"\"\"\n    eccs.set_treatment(treatment_name)\n    eccs.set_outcome(outcome_name)\n    edge_edits, _, _ = eccs.suggest_best_single_adjustment_set_change(\n        max_results=1, use_optimized=True\n    )\n    return edge_edits[0].edge if (edge_edits and len(edge_edits) &gt; 0) else None\n</code></pre>"},{"location":"reference/logos/interactive_causal_graph_refiner/#logos.interactive_causal_graph_refiner.InteractiveCausalGraphRefiner._get_suggestion_regression","title":"<code>_get_suggestion_regression(data, graph)</code>  <code>classmethod</code>","text":"<p>Implement <code>get_suggestion()</code> for the <code>REGRESSION</code> method.</p> <p>Parameters:</p> Name Type Description Default <code>data</code> <code>DataFrame</code> <p>The dataframe containing the data.</p> required <code>graph</code> <code>DiGraph</code> <p>The graph to use for suggesting the next edge.</p> required Source code in <code>src/logos/interactive_causal_graph_refiner.py</code> <pre><code>@classmethod\ndef _get_suggestion_regression(cls, data: pd.DataFrame, graph: nx.DiGraph) -&gt; Edge:\n    \"\"\"\n    Implement `get_suggestion()` for the `REGRESSION` method.\n\n    Parameters:\n        data: The dataframe containing the data.\n        graph: The graph to use for suggesting the next edge.\n    \"\"\"\n    if graph != cls.most_recent_graph:\n        cls.most_recent_graph = graph\n        cls.cache = []\n    if len(cls.cache) &gt; 0:\n        return cls.cache.pop(0)\n\n    l = []\n\n    data, _ = Regression.get_normalized_copy(data)\n\n    for v in graph.nodes:\n        for w in set(data.columns) - set(graph.neighbors(v)) - set([v]):\n            d = Regression.ols(w, data[w], data[v])\n            abs_slope = abs(d[\"Slope\"])\n            l.append((Edge((w, v)), abs_slope))\n\n    l.sort(key=lambda x: x[1], reverse=True)\n    cls.cache = [row[0] for row in l[1:]]\n\n    return l[0][0]\n</code></pre>"},{"location":"reference/logos/interactive_causal_graph_refiner/#logos.interactive_causal_graph_refiner.InteractiveCausalGraphRefiner._get_suggestion_langmodel","title":"<code>_get_suggestion_langmodel(data, data_tags, treatment_name, outcome_name, graph, model='gpt-4o-mini-2024-07-18', gpt_log_path=None)</code>  <code>classmethod</code>","text":"<p>Implement <code>get_suggestion()</code> for the <code>LANGMODEL</code> method.</p> <p>Parameters:</p> Name Type Description Default <code>data</code> <code>DataFrame</code> <p>The dataframe containing the data.</p> required <code>treatment_name</code> <code>str</code> <p>The name of the treatment variable.</p> required <code>outcome_name</code> <code>str</code> <p>The name of the outcome variable.</p> required <code>graph</code> <code>DiGraph</code> <p>The graph to use for suggesting the next edge.</p> required <code>model</code> <code>str</code> <p>The model to use for suggesting the next edge.</p> <code>'gpt-4o-mini-2024-07-18'</code> <code>gpt_log_path</code> <code>Optional[str]</code> <p>The path to the GPT log file.</p> <code>None</code> <code>data_tags</code> <code>DataFrame</code> <p>The dataframe containing the data tags.</p> required Source code in <code>src/logos/interactive_causal_graph_refiner.py</code> <pre><code>@classmethod\ndef _get_suggestion_langmodel(\n    cls,\n    data: pd.DataFrame,\n    data_tags: pd.DataFrame,\n    treatment_name: str,\n    outcome_name: str,\n    graph: nx.DiGraph,\n    model: str = \"gpt-4o-mini-2024-07-18\",\n    gpt_log_path: Optional[str] = None,\n) -&gt; Edge:\n    \"\"\"\n    Implement `get_suggestion()` for the `LANGMODEL` method.\n\n    Parameters:\n        data: The dataframe containing the data.\n        treatment_name: The name of the treatment variable.\n        outcome_name: The name of the outcome variable.\n        graph: The graph to use for suggesting the next edge.\n        model: The model to use for suggesting the next edge.\n        gpt_log_path: The path to the GPT log file.\n        data_tags: The dataframe containing the data tags.\n    \"\"\"\n    if graph != cls.most_recent_graph:\n        cls.most_recent_graph = graph\n        cls.cache = []\n    if len(cls.cache) &gt; 0:\n        return cls.cache.pop(0)\n\n    client = OpenAI()\n\n    treatment_tag = TagUtils.tag_of(data_tags, treatment_name, \"prepared\")\n    outcome_tag = TagUtils.tag_of(data_tags, outcome_name, \"prepared\")\n\n    num_samples_per_var = 3\n\n    if gpt_log_path == None:\n        gpt_log_path = (\n            f\"ranker-gpt-{datetime.now().strftime('%Y-%m-%d-%H-%M-%S')}.log\"\n        )\n    with open(gpt_log_path, \"w+\") as f:\n\n        # Define the messages to send to the model\n        messages = [\n            {\n                \"role\": \"system\",\n                \"content\": \"You are a helpful assistant for causal reasoning.\",\n            },\n            {\n                \"role\": \"user\",\n                \"content\": f\"\"\"Below is a list of variable names and some example distinct values for each. \"\"\"\n                f\"\"\"The lists are not sorted in compatible ways, so that elements in the same position may not correspond to the same entity. \"\"\"\n                f\"\"\"{', '.join([f'{TagUtils.tag_of(data_tags, v, \"prepared\")}: [{\", \".join(str(x) for x in data[v].unique().tolist()[:num_samples_per_var])}]' for v in data.columns])}\"\"\"\n                \"\"\"\\n\\n\"\"\"\n                \"\"\"I have constructed a partial causal graph over these variables. Here is the list of directed edges: \"\"\"\n                f\"\"\"[{', '.join([f'({TagUtils.tag_of(data_tags, u, \"prepared\")}, {TagUtils.tag_of(data_tags, v, \"prepared\")})' for u, v in graph.edges])}]\"\"\"\n                \"\"\"\\n\\n\"\"\"\n                f\"\"\"I plan to use this causal graph to calculate the ATE of {treatment_tag} on {outcome_tag}. \"\"\"\n                \"\"\"However, I'm not sure of its correctness nor completeness. \"\"\"\n                \"\"\"I want you to rank pairs of variables from this collection of variables, based on how important it is for me to either add or remove an edge between them in the graph\"\"\"\n                \"\"\" for the accuracy of my ATE calculation. \"\"\"\n                \"\"\"I understand that you may think this is speculative, but I want you to do your best to come up with such a ranked list ALWAYS. \"\"\"\n                \"\"\"I will interpret any results you give me knowing that you may not be sure about them. \"\"\"\n                \"\"\"Only return the ranked answers, one per line, preceded by a number and a period. Separate each variable in a pair with a comma. \"\"\"\n                \"\"\"Do not return any other text before or after the list.\"\"\",\n            },\n        ]\n\n        reply = (\n            client.chat.completions.create(model=model, messages=messages)\n            .choices[0]\n            .message.content\n        )\n\n        # Log the messages and the reply\n        f.write(f\"{datetime.now()}\\n\")\n        f.write(\"Messages:\\n\")\n        for message in messages:\n            f.write(f\"{message['role']}: {message['content']}\\n\")\n        f.write(\"----------------\\n\")\n        f.write(f\"Reply: {reply}\\n\\n\")\n        f.write(\"================\\n\")\n        f.flush()\n        f.close()\n\n    # Combat hallucinations\n    reply_rows = reply.split(\"\\n\")\n    reply_rows = [\n        row for row in reply_rows if row.strip() != \"\" and row[0].isdigit()\n    ]\n    possibly_ranked_edges = [\n        [v.strip() for v in \".\".join(row.split(\".\")[1:]).strip().split(\",\")]\n        for row in reply_rows\n    ]\n    ranked_edges = []\n    tags = data_tags[\"Tag\"].values\n    for edge in possibly_ranked_edges:\n        if len(edge) != 2:\n            continue\n\n        left = None\n        right = None\n\n        if edge[0] in tags:\n            left = edge[0]\n        elif f\"{edge[0]} mean\" in tags:\n            left = f\"{edge[0]} mean\"\n\n        if edge[1] in tags:\n            right = edge[1]\n        elif f\"{edge[1]} mean\" in tags:\n            right = f\"{edge[1]} mean\"\n\n        if left is not None and right is not None:\n            ranked_edges.append(Edge((left, right)))\n\n    cls.cache = ranked_edges[1:]\n    return ranked_edges[0]\n</code></pre>"},{"location":"reference/logos/logos/","title":"LOGos","text":""},{"location":"reference/logos/logos/#logos.logos.LOGos","title":"<code>LOGos</code>","text":"<p>LOGos provides a high-level interface for causal analysis of event logs.</p> Source code in <code>src/logos/logos.py</code> <pre><code>class LOGos:\n    \"\"\"\n    LOGos provides a high-level interface for causal analysis of event logs.\n    \"\"\"\n\n    def _set_vars_to_defaults(self) -&gt; None:\n        \"\"\"\n        Set some of the variables to their default values.\n        \"\"\"\n        # The parsed log as a dataframe, and metadata about the parsed variables.\n        self._parsed_log: pd.DataFrame = pd.DataFrame()\n        self._parsed_variables: pd.DataFrame = pd.DataFrame()\n        self._parsed_templates: pd.DataFrame = pd.DataFrame()\n\n        # The variable used to define causal units and the number of causal units.\n        self._causal_unit_var: Optional[str] = None\n        self._num_causal_units: Optional[int] = None\n\n        # The prepared log as a dataframe, and metadata about the prepared variables.\n        self._prepared_log: pd.DataFrame = pd.DataFrame()\n        self._prepared_variables: pd.DataFrame = pd.DataFrame()\n\n        # The available aggregation and imputation functions.\n        agg_module = importlib.import_module(\"src.logos.aggimp.agg_funcs\")\n        self._agg_funcs: dict[str, Callable] = {\n            n: f for n, f in inspect.getmembers(agg_module, inspect.isfunction)\n        }\n\n        imp_module = importlib.import_module(\"src.logos.aggimp.imp_funcs\")\n        self._imp_funcs: dict[str, Callable] = {\n            n: f for n, f in inspect.getmembers(imp_module, inspect.isfunction)\n        }\n\n        # The graph of causal relationships.\n        self._graph: nx.DiGraph = nx.DiGraph()\n\n        # The exploration progress matrix, indicating which edges have been explored.\n        self._edge_states: Optional[EdgeStateMatrix] = None\n\n        # The most recent next exploration suggestion.\n        self._next_exploration: Optional[str] = None\n\n        # An ECCS object for refinement.\n        self._eccs: Optional[ECCS] = None\n\n    @property\n    def parsed_log(self) -&gt; pd.DataFrame:\n        \"\"\"\n        Get the parsed log as a dataframe.\n        \"\"\"\n        return self._parsed_log\n\n    @property\n    def parsed_variables(self) -&gt; pd.DataFrame:\n        \"\"\"\n        Get the parsed variables as a dataframe.\n        \"\"\"\n        return self._parsed_variables\n\n    @property\n    def parsed_templates(self) -&gt; pd.DataFrame:\n        \"\"\"\n        Get the parsed templates as a dataframe.\n        \"\"\"\n        return self._parsed_templates\n\n    @property\n    def prepared_log(self) -&gt; pd.DataFrame:\n        \"\"\"\n        Get the prepared log as a dataframe.\n        \"\"\"\n        return self._prepared_log\n\n    @property\n    def prepared_variables(self) -&gt; pd.DataFrame:\n        \"\"\"\n        Get the prepared variables as a dataframe.\n        \"\"\"\n        return self._prepared_variables\n\n    @property\n    def prepared_variable_names(self) -&gt; list[str]:\n        \"\"\"\n        Get the names of the prepared variables.\n        \"\"\"\n        return self._prepared_variables[\"Name\"].values.tolist()\n\n    @property\n    def prepared_variable_tags(self) -&gt; list[str]:\n        \"\"\"\n        Get the tags of the prepared variables.\n        \"\"\"\n        return self._prepared_variables[\"Tag\"].values.tolist()\n\n    def prepared_variable_names_with_base_x_and_no_pre_post_agg(\n        self, x: Union[str, PreparedVariableName]\n    ) -&gt; list[str]:\n        \"\"\"\n        Get all prepared variables with the given base variable and no pre-\n        or post-aggregate values.\n\n        Parameters:\n            x: The base variable to check.\n\n        Returns:\n            A list of variables with the given base variable and no pre-\n            or post-aggregate values.\n        \"\"\"\n        return [\n            var\n            for var in self.prepared_variable_names\n            if PreparedVariableName(var).has_base_var(x)\n            and PreparedVariableName(var).no_pre_post_aggs()\n        ]\n\n    @property\n    def num_prepared_variables(self) -&gt; int:\n        \"\"\"\n        Get the number of prepared variables.\n        \"\"\"\n        return len(self.prepared_variables)\n\n    def __init__(\n        self, filename: str, workdir: str, skip_writeout: bool = False\n    ) -&gt; None:\n        \"\"\"\n        Initialize a LOGos instance, giving it the full path to the log file that will be analyzed.\n\n        Parameters:\n            filename: The full path to the log file that will be analyzed.\n            workdir: The directory where the parsed and prepared dataframes will be stored.\n            skip_writeout: Whether to skip writing out the parsed and prepared dataframes.\n        \"\"\"\n\n        self._set_vars_to_defaults()\n        self._filename = filename\n        Printer.printv(f\"Initialized LOGos with log file {filename}\")\n\n        # Set and create working directory\n        self._workdir = workdir\n        if not os.path.exists(self._workdir):\n            os.makedirs(self._workdir, exist_ok=True)\n        Printer.printv(f\"Work directory set to {self._workdir}\")\n\n        self._skip_writeout = skip_writeout\n\n    def set_verbose_to(self, val: bool) -&gt; None:\n        \"\"\"\n        Set the verbosity of the printer.\n\n        Parameters:\n            val: The new verbosity value.\n        \"\"\"\n        Printer.set_verbose(val)\n        if self._eccs:\n            self._eccs.set_verbose_to(val)\n\n    def _get_filename(self, var_name: str) -&gt; str:\n        \"\"\"\n        Create the file name string for dumping/loading pkl files.\n\n        Parameters:\n            var_name: The name of the variable to be dumped/loaded.\n\n        Returns:\n            The file name string.\n        \"\"\"\n        return os.path.join(\n            self._workdir,\n            os.path.basename(self._filename)\n            + f\"{var_name}_{self._causal_unit_var}_{self._num_causal_units}.pkl\",\n        )\n\n    def _find_type(self, row: pd.Series) -&gt; str:\n        \"\"\"\n        Identify the type of a parsed variable.\n\n        Parameters:\n            row: A row of the parsed variables dataframe.\n\n        Returns:\n            The type of the parsed variable as a string. Options are \"date\", \"time\", \"num\" and \"str\".\n        \"\"\"\n\n        with warnings.catch_warnings():\n            warnings.filterwarnings(\"error\", category=UserWarning)\n\n            try:\n                y = pd.to_numeric(row[\"Examples\"], errors=\"raise\")\n                return \"num\"\n            except Exception as e:\n                try:\n                    y = pd.to_timedelta(row[\"Examples\"], errors=\"raise\")\n                    return \"time\"\n                except Exception as e:\n                    try:\n                        y = pd.to_datetime(row[\"Examples\"], errors=\"raise\")\n                        return \"date\"\n                    except Exception as e:\n                        return \"str\"\n\n    def _find_uninteresting(self, row: pd.Series) -&gt; bool:\n        \"\"\"\n        Identify whether a parsed variable is likely to be uninteresting.\n\n        Parameters:\n            row: A row of the parsed variables dataframe.\n\n        Returns:\n            True if the variable is likely to be uninteresting, False otherwise.\n        \"\"\"\n        return (\n            row[\"Type\"] != \"num\"\n            and (self._parsed_log[row[\"Name\"]].nunique() &gt;= 0.15 * row[\"Occurrences\"])\n        ) or (self._parsed_log[row[\"Name\"]].nunique() == 1)\n\n    \"\"\"\n    A default dictionary of regular expressions to be used for parsing the log.\n    \"\"\"\n    DEFAULT_REGEX_DICT = {\n        \"Timestamp\": r\"\\d{4}\\-\\d{2}\\-\\d{2}T\\d{2}:\\d{2}:\\d{2}\\.\\d{6}Z\",\n    }\n\n    def parse(\n        self,\n        regex_dict: dict[str, str] = DEFAULT_REGEX_DICT,\n        sim_thresh: float = 0.65,\n        depth: int = 5,\n        force: bool = False,\n        message_prefix: str = r\".*\",\n        enable_gpt_tagging: bool = False,\n    ) -&gt; str:\n        \"\"\"\n        Parse the log file into a dataframe.\n\n        Parameters:\n            regex_dict: (for Drain) A dictionary of regular expressions to be used for parsing.\n            sim_thresh: (for Drain) The similarity threshold to be used for parsing.\n            depth: (for Drain) The parse tree depth to be used for parsing.\n            force: Whether to force re-parsing of the log file.\n            message_prefix: A prefix used to identify the beginning of each log message.\n                Can be used to collapse multiple lines into a single message. Each line that doesn't start with this\n                prefix will be concatenated to the previous log message.\n            enable_gpt_tagging: A boolean indicating whether GPT tagging should be enabled.\n\n        Returns:\n            The time elapsed for parsing, as a string.\n        \"\"\"\n        start_time = datetime.now()\n        parser = Drain(\n            indir=os.path.dirname(self._filename),\n            depth=depth,\n            st=sim_thresh,\n            rex=regex_dict,\n            skip_writeout=self._skip_writeout,\n            message_prefix=message_prefix,\n        )\n\n        # Check if the parsed files already exist.\n        files_exist = not force\n        parsed_df_names = [\n            nameof(self._parsed_log),\n            nameof(self._parsed_templates),\n            nameof(self._parsed_variables),\n        ]\n        for var_name in parsed_df_names:\n            if not os.path.isfile(self._get_filename(var_name)):\n                files_exist = False\n                break\n\n        if files_exist:\n            self._parsed_log = Pickler.load(self._get_filename(parsed_df_names[0]))\n            self._parsed_templates = Pickler.load(\n                self._get_filename(parsed_df_names[1])\n            )\n            self._parsed_variables = Pickler.load(\n                self._get_filename(parsed_df_names[2])\n            )\n        else:\n            (\n                self._parsed_log,\n                self._parsed_templates,\n                self._parsed_variables,\n            ) = parser.parse(self._filename.split(\"/\")[-1])\n            tqdm.pandas(desc=\"Determining variable types...\")\n            self._parsed_variables[\"Type\"] = self._parsed_variables.progress_apply(\n                self._find_type, axis=1\n            )\n\n            # Cast and convert date columns\n            is_date = self._parsed_variables[\"Type\"] == \"date\"\n            date_cols = self._parsed_variables.loc[is_date, \"Name\"]\n            tqdm.pandas(desc=\"Casting date variables...\")\n            self._parsed_log[date_cols] = self._parsed_log[date_cols].progress_apply(\n                pd.to_datetime, errors=\"coerce\"\n            )\n            tqdm.pandas(desc=\"Casting date variables round 2...\")\n            self._parsed_log[date_cols] = self._parsed_log[date_cols].progress_applymap(\n                lambda x: x.timestamp() if not pd.isnull(x) else None\n            )\n            self._parsed_variables.loc[is_date, \"Type\"] = \"num\"\n\n            # Cast and convert time columns\n            is_time = self._parsed_variables[\"Type\"] == \"time\"\n            time_cols = self._parsed_variables.loc[is_time, \"Name\"]\n            tqdm.pandas(desc=\"Casting time variables...\")\n            self._parsed_log[time_cols] = self._parsed_log[time_cols].progress_apply(\n                pd.to_timedelta, errors=\"coerce\"\n            )\n            tqdm.pandas(desc=\"Casting time variables round 2...\")\n            self._parsed_log[time_cols] = self._parsed_log[time_cols].progress_applymap(\n                lambda x: x.total_seconds() if not pd.isnull(x) else None\n            )\n            self._parsed_variables.loc[is_time, \"Type\"] = \"num\"\n\n            # Cast numeric columns\n            is_num = self._parsed_variables[\"Type\"] == \"num\"\n            numeric_cols = self._parsed_variables.loc[is_num, \"Name\"]\n            tqdm.pandas(desc=\"Casting numerical variables...\")\n            self._parsed_log[numeric_cols] = self._parsed_log[\n                numeric_cols\n            ].progress_apply(pd.to_numeric, errors=\"coerce\")\n\n            # Tag variables.\n            tqdm.pandas(desc=\"Tagging variables...\")\n            if enable_gpt_tagging:\n                tag, tag_origin = zip(\n                    *self._parsed_variables.progress_apply(\n                        lambda x: TagUtils.waterfall_tag(self.parsed_templates, x),\n                        axis=1,\n                    )\n                )\n            else:\n                tag, tag_origin = zip(\n                    *self._parsed_variables.progress_apply(\n                        lambda x: TagUtils.preceding_tokens_tag(x),\n                        axis=1,\n                    )\n                )\n            self._parsed_variables[\"Tag\"] = tag\n            self._parsed_variables[\"TagOrigin\"] = tag_origin\n            TagUtils.deduplicate_tags(self._parsed_variables)\n\n            # Detect identifiers.\n            tqdm.pandas(desc=\"Detecting identifiers...\")\n            self._parsed_variables[\"IsUninteresting\"] = (\n                self._parsed_variables.progress_apply(self._find_uninteresting, axis=1)\n            )\n\n            # Reorder columns.\n            self._parsed_variables = self._parsed_variables[\n                [\n                    \"Name\",\n                    \"Tag\",\n                    \"TagOrigin\",\n                    \"Type\",\n                    \"IsUninteresting\",\n                    \"Occurrences\",\n                    \"Preceding 3 tokens\",\n                    \"Examples\",\n                    \"From regex\",\n                ]\n            ]\n\n        # Write out files if appropriate.\n        if not self._skip_writeout and not files_exist:\n            Pickler.dump(self._parsed_log, self._get_filename(parsed_df_names[0]))\n            Pickler.dump(self._parsed_templates, self._get_filename(parsed_df_names[1]))\n            Pickler.dump(self._parsed_variables, self._get_filename(parsed_df_names[2]))\n\n        end_time = datetime.now()\n        elapsed = \"{:.6f}\".format((end_time - start_time).total_seconds())\n        Printer.printv(f\"Parsing complete in {elapsed} seconds!\")\n        return elapsed\n\n    def include_in_template(\n        self,\n        var: str,\n        enable_gpt_tagging: bool = False,\n        skip_writeout: Optional[bool] = None,\n    ) -&gt; None:\n        \"\"\"\n        Treat a certain parsed variable as part of its template and regenerate parsed dataframes.\n\n        Parameters:\n            var: The name or tag of the variable to be included in its template.\n            enable_gpt_tagging: A boolean indicating whether GPT-3.5 tagging should be enabled.\n            skip_writeout: Whether to skip writing out the regenerated parsed dataframes. Defaults\n                to the value of self._skip_writeout.\n        \"\"\"\n        name = TagUtils.name_of(self._parsed_variables, var, \"parsed\")\n\n        old_template_id = ParsedVariableName(name).template_id()\n        idx = ParsedVariableName(name).index()\n        value_counts = self._parsed_log[name].value_counts().to_dict()\n\n        ### Modify _parsed_templates\n        old_template_row = (\n            self._parsed_templates.loc[\n                self._parsed_templates[\"TemplateId\"] == old_template_id\n            ]\n            .iloc[0]\n            .copy()\n        )\n        toks = old_template_row[\"TemplateText\"].split(\" \")\n        new_template_ids = {}\n        new_variable_indices = old_template_row[\"VariableIndices\"]\n        new_variable_indices.remove(idx)\n\n        for value, occurences in value_counts.items():\n            new_template_row = old_template_row.copy()\n            toks[idx] = value\n\n            new_template_row[\"TemplateText\"] = \" \".join(toks)\n            new_template_row[\"TemplateId\"] = hashlib.md5(\n                new_template_row[\"TemplateText\"].encode(\"utf-8\")\n            ).hexdigest()[0:8]\n            new_template_row[\"Occurrences\"] = occurences\n            new_template_row[\"VariableIndices\"] = new_variable_indices\n            new_template_row[\"RegexIndices\"] = old_template_row[\"RegexIndices\"]\n\n            self._parsed_templates.loc[len(self._parsed_templates)] = new_template_row\n            new_template_ids[value] = new_template_row[\"TemplateId\"]\n\n        self._parsed_templates = self._parsed_templates[\n            self._parsed_templates[\"TemplateId\"] != old_template_id\n        ].reset_index(drop=True)\n\n        ### Modify _parsed_log\n\n        # Update the template ids of all rows that belonged to the old template\n        self._parsed_log[\"TemplateId\"] = self._parsed_log.apply(\n            lambda x: (\n                new_template_ids[x[name]]\n                if (x[\"TemplateId\"] == old_template_id)\n                else x[\"TemplateId\"]\n            ),\n            axis=1,\n        )\n\n        # Create new variables for each new template id and assign the value of the old variables to them\n        new_variables = []\n        for new_template_id in new_template_ids.values():\n            for other_idx in new_variable_indices:\n                new_var_name = f\"{new_template_id}_{str(other_idx)}\"\n                new_variables.append(new_var_name)\n                self._parsed_log[new_var_name] = self._parsed_log.apply(\n                    lambda x: (\n                        x[f\"{old_template_id}_{other_idx}\"]\n                        if (x[\"TemplateId\"] == new_template_id)\n                        else None\n                    ),\n                    axis=1,\n                )\n\n        # Drop variable columns associated with old template id\n        variables_to_drop = [\n            v for v in self._parsed_log.columns if v.startswith(old_template_id)\n        ]\n        self._parsed_log.drop(columns=variables_to_drop, inplace=True)\n\n        ### Modify _parsed_variables\n\n        # Add variable rows for each new variable\n        for value, occurrences in value_counts.items():\n            for other_idx in new_variable_indices:\n                new_template_id = new_template_ids[value]\n                new_var_name = f\"{new_template_id}_{str(other_idx)}\"\n\n                x = {}\n                x[\"Name\"] = new_var_name\n                x[\"Occurrences\"] = occurrences\n                x[\"Preceding 3 tokens\"] = (\n                    self._parsed_templates[\n                        self._parsed_templates[\"TemplateId\"] == new_template_id\n                    ][\"TemplateText\"]\n                    .values[0]\n                    .split()[max(0, other_idx - 3) : other_idx]\n                )\n                x[\"Examples\"] = (\n                    self._parsed_log[new_var_name]\n                    .loc[self._parsed_log[new_var_name].notna()]\n                    .unique()[:5]\n                    .tolist()\n                )\n                x[\"From regex\"] = False\n                if enable_gpt_tagging:\n                    x[\"Tag\"], x[\"TagOrigin\"] = TagUtils.waterfall_tag(\n                        self.parsed_templates, pd.Series(x)\n                    )\n                else:\n                    x[\"Tag\"], x[\"TagOrigin\"] = TagUtils.preceding_tokens_tag(\n                        pd.Series(x)\n                    )\n                x[\"Type\"] = self._find_type(pd.Series(x))\n                x[\"IsUninteresting\"] = self._find_uninteresting(pd.Series(x))\n\n                self._parsed_variables.loc[len(self._parsed_variables)] = x\n\n        # Drop variable rows associated with old template id\n        self._parsed_variables = self._parsed_variables[\n            ~self._parsed_variables[\"Name\"].isin(variables_to_drop)\n        ].reset_index(drop=True)\n\n        # Deduplicate tags again\n        TagUtils.deduplicate_tags(self._parsed_variables)\n\n        # Write out files if appropriate.\n        if skip_writeout is None:\n            skip_writeout = self._skip_writeout\n        if not skip_writeout:\n            Pickler.dump(self._parsed_log, self._get_filename(nameof(self._parsed_log)))\n            Pickler.dump(\n                self._parsed_templates,\n                self._get_filename(nameof(self._parsed_templates)),\n            )\n            Pickler.dump(\n                self._parsed_variables,\n                self._get_filename(nameof(self._parsed_variables)),\n            )\n\n    def tag_parsed_variable(self, name: str, tag: str) -&gt; None:\n        \"\"\"\n        Tag a parsed variable.\n\n        Parameters:\n            name: The name of the variable to be tagged.\n            tag: The tag to be assigned to the variable.\n        \"\"\"\n        TagUtils.set_tag(self._parsed_variables, name, tag, \"parsed\")\n        TagUtils.deduplicate_tags(self._parsed_variables)\n\n    def get_tag_of_parsed(self, name: str) -&gt; str:\n        \"\"\"\n        Get the tag of a parsed variable.\n\n        Parameters:\n            name: The name of the variable.\n\n        Returns:\n            The tag of the variable.\n        \"\"\"\n        return TagUtils.get_tag(self._parsed_variables, name, \"parsed\")\n\n    def tag_prepared_variable(self, name: str, tag: str) -&gt; None:\n        \"\"\"\n        Tag a prepared variable.\n\n        Parameters:\n            name: The name of the variable to be tagged.\n            tag: The tag to be assigned to the variable.\n        \"\"\"\n        TagUtils.set_tag(self._prepared_variables, name, tag, \"prepared\")\n        TagUtils.deduplicate_tags(self._prepared_variables)\n\n    def get_tag_of_prepared(self, name: str) -&gt; str:\n        \"\"\"\n        Get the tag of a prepared variable.\n\n        Parameters:\n            name: The name of the variable.\n\n        Returns:\n            The tag of the variable.\n        \"\"\"\n        return TagUtils.get_tag(self._prepared_variables, name, \"prepared\")\n\n    def get_causal_unit_info(self) -&gt; Tuple[str, int]:\n        \"\"\"\n        Get the variable used to define causal units and the number of\n        causal units.\n\n        Returns:\n            The name of the variable used to define causal units\n            and the number of causal units.\n        \"\"\"\n        return self._causal_unit_var, self._num_causal_units\n\n    def suggest_causal_unit_defs(\n        self,\n        min_causal_units: int = 4,\n        num_suggestions: int = 10,\n    ) -&gt; Optional[pd.DataFrame]:\n        \"\"\"\n        Suggest at most `num_suggestions` causal unit definitions based on IUS maximization,\n        while returning at least `min_causal_units` causal units.\n\n        Parameters:\n            min_causal_units: The minimum number of causal units that a suggested\n                definition should create.\n            num_suggestions: The maximum number of causal unit definitions to suggest.\n\n        Returns:\n            A DataFrame with one row for each suggested causal unit definition, or `None`\n                if no suggestions were made.\n        \"\"\"\n\n        return CausalUnitSuggester.suggest_causal_unit_defs(\n            self._parsed_log[self._parsed_variables[\"Name\"].values],\n            self._parsed_variables,\n            min_causal_units=min_causal_units,\n            num_suggestions=num_suggestions,\n        )\n\n    def set_causal_unit(\n        self,\n        var: str,\n        num_units: Optional[int] = None,\n    ) -&gt; None:\n        \"\"\"\n        Set the variable used to define causal units and optionally the number of\n        causal units. The latter will be ignored if the variable is categorical, but it\n        must be specified if the variable is numerical.\n\n        Parameters:\n            var: The name or tag of the variable to be used as the causal unit.\n            num_units: The number of causal units to be created.\n\n        Raises:\n            ValueError: If the variable is numerical and `num_units` is not specified.\n        \"\"\"\n        var_name = TagUtils.name_of(self._parsed_variables, var, \"parsed\")\n        var_type = self._parsed_variables.loc[\n            self._parsed_variables[\"Name\"] == var_name, \"Type\"\n        ].values[0]\n\n        if var_type == \"num\" and num_units is None:\n            raise ValueError(\n                \"The number of causal units must be specified if the causal unit is numerical.\"\n            )\n\n        self._causal_unit_var = var_name\n        self._num_causal_units = num_units\n\n        Printer.printv(\n            f\"Causal unit set to {var_name} (tag: {self.get_tag_of_parsed(var_name)}) \"\n            + (\n                \"\"\n                if not self._num_causal_units\n                else f\" with {self._num_causal_units} causal units.\"\n            )\n        )\n\n    def prepare(\n        self,\n        custom_agg: dict[str, list[str]] = {},\n        custom_imp: dict[str, list[str]] = {},\n        count_occurences: bool = False,\n        ignore_uninteresting: bool = True,\n        force: bool = False,\n        lasso_alpha: float = Pruner.LASSO_DEFAULT_ALPHA,\n        lasso_max_iter: int = Pruner.LASSO_DEFAULT_MAX_ITER,\n        drop_bad_aggs: bool = True,\n        reject_prunable_edges: bool = False,\n    ) -&gt; str:\n        \"\"\"\n        Prepare the log parsed from the table for causal analysis, using aggregation and imputation as needed.\n\n        Parameters:\n            custom_agg: A dictionary of custom aggregation functions to be used for specific variables.\n            custom_imp: A dictionary of custom imputation functions to be used for specific variables.\n            count_occurences: Whether to include extra variables counting the occurence of each template.\n            ignore_uninteresting: Whether to ignore uninteresting variables.\n            force: Whether to force re-preparation of the log.\n            lasso_alpha: The alpha parameter to be used for LASSO regression.\n            lasso_max_iter: The maximum number of iterations to be used for LASSO regression.\n            drop_bad_aggs: Whether to drop prepared variables that do not add information compared to other\n                variables based on the same base variable but using a different aggregation function.\n            reject_prunable_edges: Whether to reject edges that are prunable based on LASSO applciation.\n\n        Returns:\n            The time elapsed for preparation, as a string.\n        \"\"\"\n\n        start_time = datetime.now()\n        # Ensure causal unit is set. TODO: make IUS maximizer the default\n        if self._causal_unit_var is None:\n            print(\"Causal unit not defined. Aborting.\")\n            return None\n\n        # Check if the prepared files already exist.\n        files_exist = not force\n        prepared_df_names = [\n            nameof(self._prepared_log),\n            nameof(self._prepared_variables),\n        ]\n        for var_name in prepared_df_names:\n            if not os.path.isfile(self._get_filename(var_name)):\n                files_exist = False\n                break\n\n        if files_exist:\n            self._prepared_log = Pickler.load(self._get_filename(prepared_df_names[0]))\n            self._prepared_variables = Pickler.load(\n                self._get_filename(prepared_df_names[1])\n            )\n        else:\n            self._prepare_anew(\n                custom_agg,\n                custom_imp,\n                count_occurences=count_occurences,\n                ignore_uninteresting=ignore_uninteresting,\n                drop_bad_aggs=drop_bad_aggs,\n            )\n\n        self._edge_states = EdgeStateMatrix(self.prepared_variable_names)\n        if reject_prunable_edges:\n            Printer.printv(f\"Pruning edges...\")\n            self.reject_all_prunable_edges(\n                lasso_alpha=lasso_alpha, lasso_max_iter=lasso_max_iter\n            )\n\n        self._eccs = ECCS(self._prepared_log, nx.DiGraph())\n        self._eccs.set_verbose_to(Printer.LOGOS_VERBOSE)\n\n        end_time = datetime.now()\n        elapsed = \"{:.6f}\".format((end_time - start_time).total_seconds())\n        Printer.printv(\n            f\"\"\"Preparation complete in {elapsed} seconds! \"\"\"\n            f\"\"\"{np.count_nonzero(self._edge_states.m == -1)} of the {self.num_prepared_variables ** 2} possible edges were auto-rejected.\"\"\"\n        )\n\n        return elapsed\n\n    def _prepare_anew(\n        self,\n        custom_agg: dict[str, list[str]] = {},\n        custom_imp: dict[str, list[str]] = {},\n        count_occurences: bool = False,\n        ignore_uninteresting: bool = True,\n        drop_bad_aggs: bool = True,\n    ) -&gt; None:\n        \"\"\"\n        Prepare the log anew.\n\n        Parameters:\n            custom_agg: A dictionary of custom aggregation functions to be used for specific variables.\n            custom_imp: A dictionary of custom imputation functions to be used for specific variables.\n            count_occurences: Whether to include extra variables counting the occurence of each template.\n            ignore_uninteresting: Whether to ignore uninteresting variables.\n            drop_bad_aggs: Whether to drop prepared variables that do not add information compared to other\n                variables based on the same base variable but using a different aggregation function.\n        \"\"\"\n\n        Printer.printv(f\"Determining the causal unit assignment...\")\n        causal_unit_assignment = CausalUnitSuggester._discretize(\n            self._parsed_log[self._causal_unit_var],\n            self._parsed_variables[\n                self._parsed_variables[\"Name\"] == self._causal_unit_var\n            ][\"Type\"].values[0],\n            self._num_causal_units,\n        )\n\n        # Convert keys in custom_agg and custom_imp to the names of the variables, if they are tags.\n        custom_agg = {\n            TagUtils.name_of(self._parsed_variables, k, \"parsed\"): v\n            for k, v in custom_agg.items()\n        }\n        custom_imp = {\n            TagUtils.name_of(self._parsed_variables, k, \"parsed\"): v\n            for k, v in custom_imp.items()\n        }\n\n        # Start with the parsed log, optionally with extra variables counting the occurence of each template.\n        if count_occurences:\n            Printer.printv(f\"Adding template occurrence count variables...\")\n            self._prepared_log = pd.concat(\n                [\n                    self._parsed_log,\n                    pd.get_dummies(\n                        self._parsed_log[\"TemplateId\"],\n                        prefix=\"TemplateId\",\n                        prefix_sep=\"=\",\n                        dtype=float,\n                    ),\n                ],\n                axis=1,\n            )\n        else:\n            self._prepared_log = self._parsed_log.copy(deep=True)\n\n        # No longer need the column storing the actual template IDs\n        self._prepared_log.drop(columns=\"TemplateId\", inplace=True)\n\n        # Build dictionary of aggregation functions\n        agg_dict: dict[str, str] = {\n            variable.Name: (\n                custom_agg[variable.Name]\n                if variable.Name in custom_agg\n                else AggregateSelector.DEFAULT_AGGREGATES[variable.Type]\n            )\n            for variable in self._parsed_variables.itertuples()\n        }\n\n        # Add aggregations for template counts\n        for col in self._prepared_log.columns:\n            if PreparedVariableName(col).base_var() == \"TemplateId\":\n                agg_dict[col] = [\"sum\"]\n\n        # Drop uninteresting columns if requested, except if they are the causal unit.\n        ui_cols = self._parsed_variables.loc[\n            self._parsed_variables[\"IsUninteresting\"], \"Name\"\n        ].values\n        ui_cols = [x for x in ui_cols if x != self._causal_unit_var]\n        if ignore_uninteresting:\n            self._prepared_log.drop(\n                columns=ui_cols,\n                inplace=True,\n            )\n            for col in ui_cols:\n                agg_dict.pop(col, None)\n            Printer.printv(\n                f\"Dropped {len(ui_cols)} uninteresting columns, out of an original total of {len(self.parsed_variables)}.\"\n            )\n\n        # Ensure the causal unit variable only has one aggregation function\n        agg_dict[self._causal_unit_var] = agg_dict[self._causal_unit_var][:1]\n\n        # Perform the aggregation\n        Printer.printv(\"Calculating aggregates for each causal unit...\")\n        agg_func_dict: dict[str, list[Callable]] = {\n            name: [self._agg_funcs[f] for f in funcs]\n            for name, funcs in agg_dict.items()\n        }\n        self._prepared_log = self._prepared_log.groupby(\n            causal_unit_assignment\n        ).aggregate(agg_func_dict)\n        self._prepared_log.columns = [\n            \"+\".join(col) for col in self._prepared_log.columns.values\n        ]\n        self._parsed_variables[\"Aggregates\"] = self._parsed_variables[\"Name\"].map(\n            lambda x: agg_dict.get(x, [])\n        )\n        self._prepared_log.set_index(\n            f\"{self._causal_unit_var}+{self._parsed_variables[self._parsed_variables['Name'] == self._causal_unit_var]['Aggregates'].values[0][0]}\",\n            inplace=True,\n        )\n        self._prepared_log.sort_index(inplace=True)\n        self._prepared_log.index = self._prepared_log.index.astype(str)\n\n        # Perform the imputation\n        for col in tqdm(self._prepared_log.columns, desc=\"Imputing missing values...\"):\n            if self._prepared_log[col].isnull().values.any():\n                base_var = PreparedVariableName(col).base_var()\n                func_name: str = (\n                    custom_imp[base_var] if base_var in custom_imp else \"no_imp\"\n                )\n                self._prepared_log[col] = (self._imp_funcs[func_name])(\n                    self._prepared_log[col]\n                )\n        self._prepared_log.dropna(inplace=True)\n\n        # Drop variables that do not add information compared to other variables based on the same base variable\n        # but using a different aggregation function.\n        if drop_bad_aggs:\n            Printer.printv(f\"Dropping aggregates that do not add information...\")\n            cols_to_drop = AggregateSelector.find_uninformative_aggregates(\n                self._prepared_log, self._parsed_variables, self._causal_unit_var\n            )\n            self._prepared_log.drop(columns=cols_to_drop, inplace=True)\n\n        # Identify the categorical variables and one-hot encode them\n        categorical_vars = self._prepared_log.select_dtypes(\n            include=\"object\"\n        ).columns.tolist()\n        for col in tqdm(\n            categorical_vars, desc=\"One-hot encoding categorical variables...\"\n        ):\n            self._prepared_log = pd.concat(\n                [\n                    self._prepared_log,\n                    pd.get_dummies(\n                        self._prepared_log[col], prefix=col, prefix_sep=\"=\", dtype=float\n                    ),\n                ],\n                axis=1,\n            )\n            self._prepared_log.drop(col, axis=1, inplace=True)\n        # Deal with https://github.com/pydot/pydot/issues/258\n        self._prepared_log.columns = [\n            x.replace(\":\", \";\") for x in self._prepared_log.columns\n        ]\n\n        # Generate dataframe of prepared variables for later tagging etc.\n        self._generate_prepared_variables_df()\n\n        # Convert any date columns to Unix timestamps in milliseconds\n        date_cols = self._prepared_variables.loc[\n            self._prepared_variables[\"Type\"] == \"date\", \"Name\"\n        ].values\n        self._prepared_log[date_cols] = self._prepared_log[date_cols].map(\n            lambda x: x.timestamp() * 1000.0\n        )\n\n        # Convert any time columns to milliseconds\n        time_cols = self._prepared_variables.loc[\n            self._prepared_variables[\"Type\"] == \"time\", \"Name\"\n        ].values\n        self._prepared_log[time_cols] = self._prepared_log[time_cols].map(\n            lambda x: x.total_seconds() * 1000.0\n        )\n\n        # Write out prepared log and variables\n        if not self._skip_writeout:\n            Pickler.dump(\n                self._prepared_log, self._get_filename(nameof(self._prepared_log))\n            )\n            Pickler.dump(\n                self._prepared_variables,\n                self._get_filename(nameof(self._prepared_variables)),\n            )\n\n        Printer.printv(\n            f\"\"\"Successfully prepared the log with causal unit {self._causal_unit_var} \"\"\"\n            f\"\"\"(tag: {self.get_tag_of_parsed(self._causal_unit_var)})\"\"\"\n            + (\n                \"\"\n                if not self._num_causal_units\n                else f\" with {self._num_causal_units} causal units.\"\n            )\n        )\n\n        return\n\n    def _generate_prepared_variables_df(self) -&gt; None:\n        \"\"\"\n        Generate dataframe of prepared variables for later tagging etc.\n        \"\"\"\n\n        self._prepared_variables = pd.DataFrame()\n        self._prepared_variables[\"Name\"] = self._prepared_log.columns\n\n        # Bring in varable name components leveraging PreparedVariableName\n        self._prepared_variables[\"Base\"] = self._prepared_variables[\"Name\"].apply(\n            lambda x: PreparedVariableName(x).base_var()\n        )\n        self._prepared_variables[\"Pre-agg Value\"] = self._prepared_variables[\n            \"Name\"\n        ].apply(lambda x: PreparedVariableName(x).pre_agg_value())\n        self._prepared_variables[\"Agg\"] = self._prepared_variables[\"Name\"].apply(\n            lambda x: PreparedVariableName(x).aggregate()\n        )\n        self._prepared_variables[\"Post-agg Value\"] = self._prepared_variables[\n            \"Name\"\n        ].apply(lambda x: PreparedVariableName(x).post_agg_value())\n\n        # Bring in other info from self._parsed_variables\n        self._prepared_variables[\"Tag\"] = self._prepared_variables.apply(\n            lambda x: (\n                self._parsed_variables.loc[\n                    self._parsed_variables[\"Name\"] == x[\"Base\"],\n                    \"Tag\",\n                ].values[0]\n                if x[\"Base\"] != \"TemplateId\"\n                else \"TemplateId\"\n            )\n            + (f\" {x['Pre-agg Value']}\" if x[\"Pre-agg Value\"] != \"\" else \"\")\n            + (f\" {x['Agg']}\" if x[\"Agg\"] != \"\" else \"\")\n            + (f\" {x['Post-agg Value']}\" if x[\"Post-agg Value\"] != \"\" else \"\"),\n            axis=1,\n        )\n        self._prepared_variables[\"Base Variable Occurences\"] = self._prepared_variables[\n            \"Base\"\n        ].apply(\n            lambda x: (\n                self._parsed_variables.loc[\n                    self._parsed_variables[\"Name\"] == x, \"Occurrences\"\n                ].values[0]\n                if x != \"TemplateId\"\n                else \"\"\n            )\n        )\n        self._prepared_variables[\"Type\"] = self._prepared_variables[\"Base\"].apply(\n            lambda x: (\n                self._parsed_variables.loc[\n                    self._parsed_variables[\"Name\"] == x, \"Type\"\n                ].values[0]\n                if x != \"TemplateId\"\n                else \"\"\n            )\n        )\n        self._prepared_variables[\"Examples\"] = self._prepared_variables[\"Base\"].apply(\n            lambda x: (\n                self._parsed_variables.loc[\n                    self._parsed_variables[\"Name\"] == x, \"Examples\"\n                ].values[0]\n                if x != \"TemplateId\"\n                else \"\"\n            )\n        )\n        self._prepared_variables[\"From regex\"] = self._prepared_variables[\"Base\"].apply(\n            lambda x: (\n                self._parsed_variables.loc[\n                    self._parsed_variables[\"Name\"] == x, \"From regex\"\n                ].values[0]\n                if x != \"TemplateId\"\n                else \"\"\n            )\n        )\n\n        # Bring in template text, only for appropriate base variables.\n        self._prepared_variables[\"TemplateText\"] = self._prepared_variables.apply(\n            lambda x: (\n                self._parsed_templates.loc[\n                    self._parsed_templates[\"TemplateId\"]\n                    == PreparedVariableName(x[\"Name\"]).template_id(),\n                    \"TemplateText\",\n                ].values[0]\n                if x[\"From regex\"] == False\n                else \"\"\n            ),\n            axis=1,\n        )\n\n    def inspect(\n        self,\n        var: str,\n        ref_var: Optional[str] = None,\n        row_limit: Optional[int] = 10,\n    ) -&gt; Tuple[pd.DataFrame, pd.DataFrame, pd.DataFrame]:\n        \"\"\"\n        Print information about a specific prepared variable.\n\n        Parameters:\n            var: The name or tag of the variable.\n            ref_var: The name or tag of a reference variable.\n            row_limit: The number of rows of the prepared log to print out,\n                to illustrate example values of this variable.\n\n        Returns:\n            A tuple containing:\n                (1) Information about the base variable of `var`, if `var` is not related to the\n                    occurrence count of a template.\n                (2) Information about the template of `var`, if `var` was not created from a regex.\n                (3) A sample of the prepared log, with `row_limit` rows.\n        \"\"\"\n\n        # Retrieve the name of this variable, if a tag was passed in.\n        name = TagUtils.name_of(self._prepared_variables, var, \"prepared\")\n\n        print(f\"Information about prepared variable {name}:\\n\")\n        base_var = PreparedVariableName(name).base_var()\n        from_regex = False\n\n        base_var_info_df = pd.DataFrame()\n        if base_var != \"TemplateId\":\n            print(f\"--&gt; Variable Information about {base_var}:\")\n            base_var_info_df = self._parsed_variables[\n                self._parsed_variables[\"Name\"] == base_var\n            ]\n            from_regex = base_var_info_df[\"From regex\"].values[0]\n            display(base_var_info_df)\n\n        template_info_df = pd.DataFrame()\n        if not from_regex:\n            template_id = PreparedVariableName(name).template_id()\n            print(f\"--&gt; Template Information about {template_id}:\")\n            template_info_df = self._parsed_templates[\n                self._parsed_templates[\"TemplateId\"] == template_id\n            ]\n            display(template_info_df)\n\n        print(\"--&gt; Causal Unit Partial Information:\")\n        if row_limit == None:\n            row_limit = len(self._prepared_log)\n        col_list = [name]\n        col_list.extend([ref_var] if ref_var is not None else [])\n        prepared_log_info_df = self._prepared_log[col_list].head(row_limit)\n        col_names = [f\"{name} (candidate)\"]\n        col_names.extend([f\"{ref_var} (outcome)\"] if ref_var is not None else [])\n        prepared_log_info_df.columns = col_names\n        display(prepared_log_info_df)\n\n        return base_var_info_df, template_info_df, prepared_log_info_df\n\n    def clear_graph(self, clear_edge_states: bool = True) -&gt; None:\n        \"\"\"\n        Clear the graph and possibly edge states.\n\n        Parameters:\n            clear_edge_states: Whether to also clear the edge states.\n        \"\"\"\n        self._graph = nx.DiGraph()\n        if clear_edge_states:\n            self._edge_states = EdgeStateMatrix(self.prepared_variable_names)\n        if self._eccs:\n            self._eccs.clear_graph(clear_edge_states)\n\n    def display_graph(self) -&gt; None:\n        \"\"\"\n        Display the current graph.\n        \"\"\"\n        GraphRenderer.display_graph(self._graph, self._prepared_variables)\n\n    def save_graph(self, filename: str) -&gt; None:\n        \"\"\"\n        Save the current graph to a file.\n\n        Parameters:\n            filename: The name of the file to save to.\n        \"\"\"\n        GraphRenderer.save_graph(self._graph, self._prepared_variables, filename)\n\n    def accept(\n        self,\n        src: str,\n        dst: str,\n        also_fix: bool = False,\n        interactive: bool = True,\n    ) -&gt; Tuple[float, Optional[str], Optional[str]]:\n        \"\"\"\n        Mark a causal graph edge as accepted.\n\n        This will also reject the edge from `dst` to `src` and remove any other variables with the\n        same base variable as either `src` or `dst` from consideration for the partial causal graph.\n\n        Parameters:\n            src: The name or tag of the source variable.\n            dst: The name or tag of the destination variable.\n            also_fix: Whether to also fix the edge, for ECCS.\n            interactive: Whether to display the graph interactively after accepting the edge.\n\n        Returns:\n            A tuple containing:\n                (1) the exploration score after the edge addition,\n                (2) the max-impact variable to explore next, if any,\n                (3) optionally a string representation of the graph, if `interactive` is False.\n        \"\"\"\n\n        src_name = TagUtils.name_of(self._prepared_variables, src, \"prepared\")\n        dst_name = TagUtils.name_of(self._prepared_variables, dst, \"prepared\")\n        to_drop = self._edge_states.mark_edge(src_name, dst_name, \"Accepted\")\n        for node in to_drop:\n            if node in self._graph.nodes:\n                self._graph.remove_node(node)\n\n        self._graph.add_node(src_name)\n        self._graph.add_node(dst_name)\n        self._graph.add_edge(src_name, dst_name)\n        if (dst_name, src_name) in self._graph.edges:\n            self._graph.remove_edge(dst_name, src_name)\n        if interactive:\n            GraphRenderer.display_graph(self._graph, self._prepared_variables)\n        if self._eccs:\n            self._eccs.remove_edge(dst_name, src_name)\n            self._eccs.add_edge(src_name, dst_name)\n            if also_fix:\n                self._eccs.fix_edge(src_name, dst_name)\n\n        return (\n            self.exploration_score,\n            self.suggest_next_exploration(),\n            (\n                GraphRenderer.draw_graph(self._graph, self._prepared_variables)\n                if not interactive\n                else \"\"\n            ),\n        )\n\n    def reject(\n        self,\n        src: str,\n        dst: str,\n        also_ban: bool,\n        interactive: bool = True,\n    ) -&gt; Tuple[float, Optional[str], Optional[str]]:\n        \"\"\"\n        Mark a causal graph edge as rejected.\n\n        Parameters:\n            src: The name or tag of the source variable.\n            dst: The name or tag of the destination variable.\n            also_ban: Whether to also ban the edge, for ECCS.\n            interactive: Whether to display the graph interactively after rejecting the edge.\n\n        Returns:\n            A tuple containing:\n                (1) the exploration score after the edge rejection,\n                (2) the max-impact variable to explore next, if any,\n                (3) optionally a string representation of the graph, if `interactive` is False.\n        \"\"\"\n\n        src_name = TagUtils.name_of(self._prepared_variables, src, \"prepared\")\n        dst_name = TagUtils.name_of(self._prepared_variables, dst, \"prepared\")\n        self._edge_states.mark_edge(src_name, dst_name, \"Rejected\")\n        if self._eccs and also_ban:\n            self._eccs.ban_edge(src_name, dst_name)\n\n        if interactive:\n            GraphRenderer.display_graph(self._graph, self._prepared_variables)\n\n        return (\n            self.exploration_score,\n            self.suggest_next_exploration(),\n            (\n                GraphRenderer.draw_graph(self._graph, self._prepared_variables)\n                if not interactive\n                else \"\"\n            ),\n        )\n\n    def reject_undecided_incoming(\n        self, dst: str, also_ban: bool, interactive: bool = True\n    ) -&gt; Tuple[float, Optional[str], Optional[str]]:\n        \"\"\"\n        Mark all undecided incoming edges to a variable as rejected.\n\n        Parameters:\n            dst: The name or tag of the destination variable.\n            also_ban: Whether to also ban the edges, for ECCS.\n            interactive: Whether to display the graph interactively after rejecting the edges.\n\n        Returns:\n            A tuple containing:\n                (1) the exploration score after the edge rejections,\n                (2) the max-impact variable to explore next, if any,\n                (3) optionally a string representation of the graph, if `interactive` is False.\n        \"\"\"\n        dst_name = TagUtils.name_of(self._prepared_variables, dst, \"prepared\")\n        for v in self.prepared_variable_names:\n            if self._edge_states.get_edge_state(v, dst_name) == \"Undecided\":\n                self._edge_states.mark_edge(v, dst_name, \"Rejected\")\n                if self._eccs and also_ban:\n                    self._eccs.ban_edge(v, dst_name)\n\n        if interactive:\n            GraphRenderer.display_graph(self._graph, self._prepared_variables)\n\n        return (\n            self.exploration_score,\n            self.suggest_next_exploration(),\n            (\n                GraphRenderer.draw_graph(self._graph, self._prepared_variables)\n                if not interactive\n                else \"\"\n            ),\n        )\n\n    def reject_undecided_outgoing(\n        self, src: str, also_ban: bool, interactive: bool = True\n    ) -&gt; Tuple[float, Optional[str], Optional[str]]:\n        \"\"\"\n        Mark all undecided outgoing edges from a variable as rejected.\n\n        Parameters:\n            src: The name or tag of the source variable.\n            also_ban: Whether to also ban the edges, for ECCS.\n            interactive: Whether to display the graph interactively after rejecting the edges.\n\n        Returns:\n            A tuple containing:\n                (1) the exploration score after the edge rejections,\n                (2) the max-impact variable to explore next, if any,\n                (3) optionally a string representation of the graph, if `interactive` is False.\n        \"\"\"\n        src_name = TagUtils.name_of(self._prepared_variables, src, \"prepared\")\n        for v in self.prepared_variable_names:\n            if self._edge_states.get_edge_state(src_name, v) == \"Undecided\":\n                self._edge_states.mark_edge(src_name, v, \"Rejected\")\n                if self._eccs and also_ban:\n                    self._eccs.ban_edge(src_name, v)\n\n        if interactive:\n            GraphRenderer.display_graph(self._graph, self._prepared_variables)\n\n        return (\n            self.exploration_score,\n            self.suggest_next_exploration(),\n            (\n                GraphRenderer.draw_graph(self._graph, self._prepared_variables)\n                if not interactive\n                else \"\"\n            ),\n        )\n\n    def reject_all_prunable_edges(\n        self,\n        also_ban: bool,\n        lasso_alpha: float = Pruner.LASSO_DEFAULT_ALPHA,\n        lasso_max_iter: int = Pruner.LASSO_DEFAULT_MAX_ITER,\n    ) -&gt; Tuple[float, Optional[str], Optional[str]]:\n        \"\"\"\n        For every prepared variable, reject all incoming edges that start at a variable\n        that is pruned by our pruning approach. This may be time-consuming depending on the number of variables.\n\n        Parameters:\n            also_ban: Whether to also ban the edges, for ECCS.\n            lasso_alpha: The alpha parameter to be used for Lasso regression.\n            lasso_max_iter: The maximum number of iterations to be used for Lasso regression.\n\n        Returns:\n            A tuple containing:\n                (1) the exploration score after the edge rejections,\n                (2) the max-impact variable to explore next, if any,\n                (3) optionally a string representation of the graph, if `interactive` is False.\n        \"\"\"\n        num_processors = multiprocessing.cpu_count()\n        with multiprocessing.Pool(processes=num_processors) as pool:\n            all_candidates = pool.starmap(\n                Pruner.prune_with_lasso,\n                tqdm(\n                    [\n                        (self._prepared_log, [target], lasso_alpha, lasso_max_iter)\n                        for target in self.prepared_variable_names\n                    ],\n                    total=self.num_prepared_variables,\n                    desc=\"Finding pruned variables...\",\n                ),\n            )\n\n        Printer.printv(all_candidates)\n\n        for candidates, target in zip(all_candidates, self.prepared_variable_names):\n            non_candidates = (\n                set(self._prepared_log.columns) - set(candidates) - set([target])\n            )\n            for nc in non_candidates:\n                self._edge_states.mark_edge(nc, target, \"Rejected\")\n                if self._eccs and also_ban:\n                    self._eccs.ban_edge(nc, target)\n\n        return (\n            self.exploration_score,\n            self.suggest_next_exploration(),\n            GraphRenderer.draw_graph(self._graph, self._prepared_variables),\n        )\n\n    @property\n    def exploration_score(self) -&gt; float:\n        \"\"\"\n        Calculate the exploration score of the current partial causal graph,\n        based on the edge state matrix.\n\n        Returns:\n            The exploration score of the current partial causal graph.\n        \"\"\"\n        # Number of edges incident to a node in the current partial graph\n        M = self._graph.number_of_nodes()\n        N = self.num_prepared_variables\n        incident = M * (2 * N - M - 1)\n        if incident == 0:\n            return 0\n\n        # Number of edges among the incident that have been considered\n        graph_var_indices = [self._edge_states.idx(x) for x in list(self._graph.nodes)]\n        other_indices = list(np.setdiff1d(np.arange(N), graph_var_indices))\n        considered = np.sum(\n            self._edge_states.m[graph_var_indices][:, graph_var_indices] != 0\n        )\n        considered -= M  # subtract self-edges\n        considered += np.sum(\n            self._edge_states.m[graph_var_indices][:, other_indices] != 0\n        )\n        considered += np.sum(\n            self._edge_states.m[other_indices][:, graph_var_indices] != 0\n        )\n\n        Printer.printv(f\"Considered: {considered}\")\n        Printer.printv(f\"Incident: {incident}\")\n\n        return considered / incident\n\n    def rank_candidate_causes(\n        self,\n        target: Optional[str] = None,\n        ignore: Optional[List[str]] = None,\n        method: CandidateCauseRankerMethod = CandidateCauseRankerMethod.LOGOS,\n        prune_candidates: bool = True,\n        lasso_alpha: float = Pruner.LASSO_DEFAULT_ALPHA,\n        lasso_max_iter: int = Pruner.LASSO_DEFAULT_MAX_ITER,\n        model: str = \"gpt-4o-mini-2024-07-18\",\n        gpt_log_path: Optional[str] = None,\n    ) -&gt; Tuple[pd.DataFrame, str]:\n        \"\"\"\n        Present the user with ranked candidate causes for `target`. If no `target`\n        is specified, the most recent suggestion of `suggest_next_exploration()` is used, if any.\n        If `ignore` is specified, the variables in `ignore` are not considered as candidate causes.\n\n        Parameters:\n            target: The name or tag of the target variable.\n            ignore: A list of variables to ignore.\n            method: The method to use for ranking candidate causes.\n            prune_candidates: Whether to prune the candidate causes using Lasso regression. Only\n                applies if `method` is `CandidateCauseRankerMethod.LOGOS`.\n            lasso_alpha: The alpha parameter to be used for Lasso regression. Only applies if\n                `method` is `CandidateCauseRankerMethod.LOGOS` and `prune_candidates` is True.\n            lasso_max_iter: The maximum number of iterations to be used for Lasso regression. Only\n                applies if `method` is `CandidateCauseRankerMethod.LOGOS` and `prune_candidates` is True.\n            model: The model to use for the langmodel method. Only applies if the method is\n                `CandidateCauseRankerMethod.LANGMODEL`.\n            gpt_log_path: The path to the log file to use for the langmodel method. Only applies if\n                the method is `CandidateCauseRankerMethod.LANGMODEL`.\n        Returns:\n            A tuple containing:\n            (1) A dataframe containing the candidate causes for `target` and\n            (2) The time elapsed for exploration, as a string.\n        \"\"\"\n\n        start_time = datetime.now()\n\n        # Handle the case where the user has not specified a target.\n        if target is None and self._next_exploration is None:\n            Printer.printv(\"No target specified.\")\n            return pd.DataFrame(columns=CandidateCauseRanker.COLUMN_ORDER), \"\"\n        elif target is None:\n            target = self._next_exploration\n\n        # If the user provided the target as a tag, retrieve its name\n        target = TagUtils.name_of(self._prepared_variables, target, \"prepared\")\n\n        # Use the specified method to rank candidate causes\n        result_df, pruned = CandidateCauseRanker.rank(\n            self.prepared_log,\n            self.prepared_variables,\n            target,\n            ignore,\n            method,\n            prune_candidates,\n            lasso_alpha,\n            lasso_max_iter,\n            model,\n            (\n                gpt_log_path\n                if (gpt_log_path is not None)\n                else os.path.join(\n                    self._workdir,\n                    f\"ranker-gpt-{datetime.now().strftime('%Y-%m-%d-%H-%M-%S')}.log\",\n                )\n            ),\n        )\n\n        # Mark the edges rejected by the pruning step, if any.\n        for var in pruned:\n            self._edge_states.mark_edge(var, target, \"Rejected\")\n\n        # Add fields to the returned dataframe\n        result_df[\"Candidate-&gt;Target Edge Status\"] = result_df[\"Candidate\"].apply(\n            lambda x: self._edge_states.get_edge_state(x, target)\n        )\n        result_df[\"Target-&gt;Candidate Edge Status\"] = result_df[\"Candidate\"].apply(\n            lambda x: self._edge_states.get_edge_state(target, x)\n        )\n\n        ret_val = result_df[CandidateCauseRanker.COLUMN_ORDER]\n\n        end_time = datetime.now()\n        elapsed = \"{:.6f}\".format((end_time - start_time).total_seconds())\n        Printer.printv(f\"Candidate cause exploration complete in {elapsed} seconds!\")\n\n        return ret_val, elapsed\n\n    def get_causal_graph_refinement_suggestion(\n        self,\n        method: InteractiveCausalGraphRefinerMethod = InteractiveCausalGraphRefinerMethod.LOGOS,\n        treatment: Optional[str] = None,\n        outcome: Optional[str] = None,\n        model: str = \"gpt-4o-mini-2024-07-18\",\n        gpt_log_path: Optional[str] = None,\n    ) -&gt; Tuple[Edge, str]:\n        \"\"\"\n        Present the user with an edge, the presence and direction of which they should assess.\n\n        Parameters:\n            method: The method to use for producing a causal graph refinement suggestion.\n            treatment: The name or tag of the treatment variable. Only applies if the method is\n                `InteractiveCausalGraphRefinerMethod.LOGOS`.\n            outcome: The name or tag of the outcome variable. Only applies if the method is\n                `InteractiveCausalGraphRefinerMethod.LOGOS`.\n            model: The model to use for the langmodel method. Only applies if the method is\n                `CandidateCauseRankerMethod.LANGMODEL`.\n            gpt_log_path: The path to the log file to use for the langmodel method. Only applies if\n                the method is `CandidateCauseRankerMethod.LANGMODEL`.\n        Returns:\n            A tuple containing:\n            (1) The edge to assess, as an Edge object, and\n            (2) The time elapsed for generating the suggestion, as a string.\n        \"\"\"\n\n        start_time = datetime.now()\n\n        treatment_name = TagUtils.name_of(\n            self._prepared_variables, treatment, \"prepared\"\n        )\n        outcome_name = TagUtils.name_of(self._prepared_variables, outcome, \"prepared\")\n\n        edge = InteractiveCausalGraphRefiner.get_suggestion(\n            self.prepared_log,\n            method,\n            self._eccs,\n            treatment_name,\n            outcome_name,\n            self._graph,\n            model,\n            (\n                gpt_log_path\n                if (gpt_log_path is not None)\n                else os.path.join(\n                    self._workdir,\n                    f\"refiner-gpt-{datetime.now().strftime('%Y-%m-%d-%H-%M-%S')}.log\",\n                )\n            ),\n            self.prepared_variables,\n        )\n\n        edge_tags = None\n        if edge:\n            edge_tags = tuple(\n                TagUtils.tag_of(self._prepared_variables, x, \"prepared\") for x in edge\n            )\n\n        end_time = datetime.now()\n        elapsed = \"{:.6f}\".format((end_time - start_time).total_seconds())\n        Printer.printv(f\"Candidate cause exploration complete in {elapsed} seconds!\")\n\n        return edge_tags, elapsed\n\n    def suggest_next_exploration(self) -&gt; Optional[str]:\n        \"\"\"\n        Suggest the variable that should be explored next. Suggest the prepared variable in the partial causal graph\n        that has the most (nonzero) Unexplored incoming edges, if any; otherwise suggest the prepared variable\n        with the most (nonzero) Undecided incoming edges, even if it is not in the partial causal graph.\n\n        If all edges are decided, return None.\n\n        Returns:\n            The name of the variable to explore next.\n        \"\"\"\n\n        # Try to find a suggestion from the partial causal graph.\n        node_names = list(self._graph.nodes)\n        graph_var_indices = [self._edge_states.idx(x) for x in node_names]\n        graph_var_incoming_edge_states = self._edge_states.m[:, graph_var_indices]\n        undecided_edges_per_col = (\n            np.sum(graph_var_incoming_edge_states == 0, axis=0)\n            if len(graph_var_incoming_edge_states) &gt; 0\n            else []\n        )\n        max_undecided = (\n            np.max(undecided_edges_per_col) if len(undecided_edges_per_col) &gt; 0 else 0\n        )\n\n        if max_undecided &gt; 0:\n            max_undecided_idx = np.argmax(undecided_edges_per_col)\n            self._next_exploration = node_names[max_undecided_idx]\n            return self._next_exploration\n\n        # If no suggestion was found, try to find a suggestion from the entire collection of prepared variables.\n        undecided_edges_per_col = np.sum(self._edge_states.m == 0, axis=0)\n        max_undecided = np.max(undecided_edges_per_col)\n\n        if max_undecided &gt; 0:\n            max_undecided_idx = np.argmax(undecided_edges_per_col)\n            self._next_exploration = self._prepared_variables.loc[\n                max_undecided_idx, \"Name\"\n            ]\n            return self._next_exploration\n\n        # If no suggestion was found, return None.\n        self._next_exploration = None\n        return None\n\n    def discover_graph(\n        self,\n        method: str = \"hill_climb\",\n        max_cond_vars: int = 3,\n        model: str = \"gpt-3.5-turbo\",\n    ) -&gt; None:\n        \"\"\"\n        Discover a causal graph based on the prepared table automatically.\n\n        Parameters:\n            method: The method to be used for graph discovery, among \"PC\", \"hill_climb\", \"exhaustive\" and \"GPT\".\n            max_cond_vars: The maximum number of conditioning variables to be used for PC.\n            model: The model to be used for GPT-based graph discovery.\n\n        \"\"\"\n\n        if method == \"PC\":\n            self._graph = CausalDiscoverer.pc(\n                self._prepared_log, max_cond_vars=max_cond_vars\n            )\n        elif method == \"hill_climb\":\n            self._graph = CausalDiscoverer.hill_climb(self._prepared_log)\n        elif method == \"exhaustive\":\n            self._graph = CausalDiscoverer.exhaustive(self._prepared_log)\n        elif method == \"GPT\":\n            self._graph = CausalDiscoverer.gpt(self._prepared_log, model=model)\n        else:\n            raise ValueError(f\"Invalid graph discovery method {method}\")\n\n        self._edge_states.clear_and_set_from_graph(self._graph)\n\n    def get_adjusted_ate(\n        self,\n        treatment: str,\n        outcome: str,\n        confounder: Optional[str] = None,\n    ) -&gt; float:\n        \"\"\"\n        Calculate the adjusted ATE of `treatment` on `outcome`, given the current partial causal graph.\n\n        Parameters:\n            treatment: The name or tag of the treatment variable.\n            outcome: The name or tag of the outcome variable.\n            confounder: The name or tag of a confounder variable. If specified, overrides the current partial\n                causal graph in favor of a three-node graph with `treatment`, `outcome` and `confounder`.\n\n        Returns:\n            The adjusted ATE of `treatment` on `outcome`.\n        \"\"\"\n        return ATECalculator.get_ate_and_confidence(\n            self.prepared_log,\n            self.prepared_variables,\n            treatment,\n            outcome,\n            confounder,\n            graph=self._graph,\n            calculate_p_value=False,\n            calculate_std_error=False,\n        )[\"ATE\"]\n\n    def get_unadjusted_ate(\n        self,\n        treatment: str,\n        outcome: str,\n    ) -&gt; float:\n        \"\"\"\n        Calculate the unadjusted ATE of `treatment` on `outcome`, ignoring the current partial causal graph\n        in favor of a two-node graph with just `treatment` and `outcome`.\n\n        Parameters:\n            treatment: The name or tag of the treatment variable.\n            outcome: The name or tag of the outcome variable.\n\n        Returns:\n            The unadjusted ATE of `treatment` on `outcome`.\n        \"\"\"\n        return ATECalculator.get_ate_and_confidence(\n            self.prepared_log,\n            self.prepared_variables,\n            treatment,\n            outcome,\n            calculate_p_value=False,\n            calculate_std_error=False,\n        )[\"ATE\"]\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.parsed_log","title":"<code>parsed_log: pd.DataFrame</code>  <code>property</code>","text":"<p>Get the parsed log as a dataframe.</p>"},{"location":"reference/logos/logos/#logos.logos.LOGos.parsed_variables","title":"<code>parsed_variables: pd.DataFrame</code>  <code>property</code>","text":"<p>Get the parsed variables as a dataframe.</p>"},{"location":"reference/logos/logos/#logos.logos.LOGos.parsed_templates","title":"<code>parsed_templates: pd.DataFrame</code>  <code>property</code>","text":"<p>Get the parsed templates as a dataframe.</p>"},{"location":"reference/logos/logos/#logos.logos.LOGos.prepared_log","title":"<code>prepared_log: pd.DataFrame</code>  <code>property</code>","text":"<p>Get the prepared log as a dataframe.</p>"},{"location":"reference/logos/logos/#logos.logos.LOGos.prepared_variables","title":"<code>prepared_variables: pd.DataFrame</code>  <code>property</code>","text":"<p>Get the prepared variables as a dataframe.</p>"},{"location":"reference/logos/logos/#logos.logos.LOGos.prepared_variable_names","title":"<code>prepared_variable_names: list[str]</code>  <code>property</code>","text":"<p>Get the names of the prepared variables.</p>"},{"location":"reference/logos/logos/#logos.logos.LOGos.prepared_variable_tags","title":"<code>prepared_variable_tags: list[str]</code>  <code>property</code>","text":"<p>Get the tags of the prepared variables.</p>"},{"location":"reference/logos/logos/#logos.logos.LOGos.num_prepared_variables","title":"<code>num_prepared_variables: int</code>  <code>property</code>","text":"<p>Get the number of prepared variables.</p>"},{"location":"reference/logos/logos/#logos.logos.LOGos.exploration_score","title":"<code>exploration_score: float</code>  <code>property</code>","text":"<p>Calculate the exploration score of the current partial causal graph, based on the edge state matrix.</p> <p>Returns:</p> Type Description <code>float</code> <p>The exploration score of the current partial causal graph.</p>"},{"location":"reference/logos/logos/#logos.logos.LOGos._set_vars_to_defaults","title":"<code>_set_vars_to_defaults()</code>","text":"<p>Set some of the variables to their default values.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def _set_vars_to_defaults(self) -&gt; None:\n    \"\"\"\n    Set some of the variables to their default values.\n    \"\"\"\n    # The parsed log as a dataframe, and metadata about the parsed variables.\n    self._parsed_log: pd.DataFrame = pd.DataFrame()\n    self._parsed_variables: pd.DataFrame = pd.DataFrame()\n    self._parsed_templates: pd.DataFrame = pd.DataFrame()\n\n    # The variable used to define causal units and the number of causal units.\n    self._causal_unit_var: Optional[str] = None\n    self._num_causal_units: Optional[int] = None\n\n    # The prepared log as a dataframe, and metadata about the prepared variables.\n    self._prepared_log: pd.DataFrame = pd.DataFrame()\n    self._prepared_variables: pd.DataFrame = pd.DataFrame()\n\n    # The available aggregation and imputation functions.\n    agg_module = importlib.import_module(\"src.logos.aggimp.agg_funcs\")\n    self._agg_funcs: dict[str, Callable] = {\n        n: f for n, f in inspect.getmembers(agg_module, inspect.isfunction)\n    }\n\n    imp_module = importlib.import_module(\"src.logos.aggimp.imp_funcs\")\n    self._imp_funcs: dict[str, Callable] = {\n        n: f for n, f in inspect.getmembers(imp_module, inspect.isfunction)\n    }\n\n    # The graph of causal relationships.\n    self._graph: nx.DiGraph = nx.DiGraph()\n\n    # The exploration progress matrix, indicating which edges have been explored.\n    self._edge_states: Optional[EdgeStateMatrix] = None\n\n    # The most recent next exploration suggestion.\n    self._next_exploration: Optional[str] = None\n\n    # An ECCS object for refinement.\n    self._eccs: Optional[ECCS] = None\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.prepared_variable_names_with_base_x_and_no_pre_post_agg","title":"<code>prepared_variable_names_with_base_x_and_no_pre_post_agg(x)</code>","text":"<p>Get all prepared variables with the given base variable and no pre- or post-aggregate values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Union[str, PreparedVariableName]</code> <p>The base variable to check.</p> required <p>Returns:</p> Type Description <code>list[str]</code> <p>A list of variables with the given base variable and no pre-</p> <code>list[str]</code> <p>or post-aggregate values.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def prepared_variable_names_with_base_x_and_no_pre_post_agg(\n    self, x: Union[str, PreparedVariableName]\n) -&gt; list[str]:\n    \"\"\"\n    Get all prepared variables with the given base variable and no pre-\n    or post-aggregate values.\n\n    Parameters:\n        x: The base variable to check.\n\n    Returns:\n        A list of variables with the given base variable and no pre-\n        or post-aggregate values.\n    \"\"\"\n    return [\n        var\n        for var in self.prepared_variable_names\n        if PreparedVariableName(var).has_base_var(x)\n        and PreparedVariableName(var).no_pre_post_aggs()\n    ]\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.__init__","title":"<code>__init__(filename, workdir, skip_writeout=False)</code>","text":"<p>Initialize a LOGos instance, giving it the full path to the log file that will be analyzed.</p> <p>Parameters:</p> Name Type Description Default <code>filename</code> <code>str</code> <p>The full path to the log file that will be analyzed.</p> required <code>workdir</code> <code>str</code> <p>The directory where the parsed and prepared dataframes will be stored.</p> required <code>skip_writeout</code> <code>bool</code> <p>Whether to skip writing out the parsed and prepared dataframes.</p> <code>False</code> Source code in <code>src/logos/logos.py</code> <pre><code>def __init__(\n    self, filename: str, workdir: str, skip_writeout: bool = False\n) -&gt; None:\n    \"\"\"\n    Initialize a LOGos instance, giving it the full path to the log file that will be analyzed.\n\n    Parameters:\n        filename: The full path to the log file that will be analyzed.\n        workdir: The directory where the parsed and prepared dataframes will be stored.\n        skip_writeout: Whether to skip writing out the parsed and prepared dataframes.\n    \"\"\"\n\n    self._set_vars_to_defaults()\n    self._filename = filename\n    Printer.printv(f\"Initialized LOGos with log file {filename}\")\n\n    # Set and create working directory\n    self._workdir = workdir\n    if not os.path.exists(self._workdir):\n        os.makedirs(self._workdir, exist_ok=True)\n    Printer.printv(f\"Work directory set to {self._workdir}\")\n\n    self._skip_writeout = skip_writeout\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.set_verbose_to","title":"<code>set_verbose_to(val)</code>","text":"<p>Set the verbosity of the printer.</p> <p>Parameters:</p> Name Type Description Default <code>val</code> <code>bool</code> <p>The new verbosity value.</p> required Source code in <code>src/logos/logos.py</code> <pre><code>def set_verbose_to(self, val: bool) -&gt; None:\n    \"\"\"\n    Set the verbosity of the printer.\n\n    Parameters:\n        val: The new verbosity value.\n    \"\"\"\n    Printer.set_verbose(val)\n    if self._eccs:\n        self._eccs.set_verbose_to(val)\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos._get_filename","title":"<code>_get_filename(var_name)</code>","text":"<p>Create the file name string for dumping/loading pkl files.</p> <p>Parameters:</p> Name Type Description Default <code>var_name</code> <code>str</code> <p>The name of the variable to be dumped/loaded.</p> required <p>Returns:</p> Type Description <code>str</code> <p>The file name string.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def _get_filename(self, var_name: str) -&gt; str:\n    \"\"\"\n    Create the file name string for dumping/loading pkl files.\n\n    Parameters:\n        var_name: The name of the variable to be dumped/loaded.\n\n    Returns:\n        The file name string.\n    \"\"\"\n    return os.path.join(\n        self._workdir,\n        os.path.basename(self._filename)\n        + f\"{var_name}_{self._causal_unit_var}_{self._num_causal_units}.pkl\",\n    )\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos._find_type","title":"<code>_find_type(row)</code>","text":"<p>Identify the type of a parsed variable.</p> <p>Parameters:</p> Name Type Description Default <code>row</code> <code>Series</code> <p>A row of the parsed variables dataframe.</p> required <p>Returns:</p> Type Description <code>str</code> <p>The type of the parsed variable as a string. Options are \"date\", \"time\", \"num\" and \"str\".</p> Source code in <code>src/logos/logos.py</code> <pre><code>def _find_type(self, row: pd.Series) -&gt; str:\n    \"\"\"\n    Identify the type of a parsed variable.\n\n    Parameters:\n        row: A row of the parsed variables dataframe.\n\n    Returns:\n        The type of the parsed variable as a string. Options are \"date\", \"time\", \"num\" and \"str\".\n    \"\"\"\n\n    with warnings.catch_warnings():\n        warnings.filterwarnings(\"error\", category=UserWarning)\n\n        try:\n            y = pd.to_numeric(row[\"Examples\"], errors=\"raise\")\n            return \"num\"\n        except Exception as e:\n            try:\n                y = pd.to_timedelta(row[\"Examples\"], errors=\"raise\")\n                return \"time\"\n            except Exception as e:\n                try:\n                    y = pd.to_datetime(row[\"Examples\"], errors=\"raise\")\n                    return \"date\"\n                except Exception as e:\n                    return \"str\"\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos._find_uninteresting","title":"<code>_find_uninteresting(row)</code>","text":"<p>Identify whether a parsed variable is likely to be uninteresting.</p> <p>Parameters:</p> Name Type Description Default <code>row</code> <code>Series</code> <p>A row of the parsed variables dataframe.</p> required <p>Returns:</p> Type Description <code>bool</code> <p>True if the variable is likely to be uninteresting, False otherwise.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def _find_uninteresting(self, row: pd.Series) -&gt; bool:\n    \"\"\"\n    Identify whether a parsed variable is likely to be uninteresting.\n\n    Parameters:\n        row: A row of the parsed variables dataframe.\n\n    Returns:\n        True if the variable is likely to be uninteresting, False otherwise.\n    \"\"\"\n    return (\n        row[\"Type\"] != \"num\"\n        and (self._parsed_log[row[\"Name\"]].nunique() &gt;= 0.15 * row[\"Occurrences\"])\n    ) or (self._parsed_log[row[\"Name\"]].nunique() == 1)\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.parse","title":"<code>parse(regex_dict=DEFAULT_REGEX_DICT, sim_thresh=0.65, depth=5, force=False, message_prefix='.*', enable_gpt_tagging=False)</code>","text":"<p>Parse the log file into a dataframe.</p> <p>Parameters:</p> Name Type Description Default <code>regex_dict</code> <code>dict[str, str]</code> <p>(for Drain) A dictionary of regular expressions to be used for parsing.</p> <code>DEFAULT_REGEX_DICT</code> <code>sim_thresh</code> <code>float</code> <p>(for Drain) The similarity threshold to be used for parsing.</p> <code>0.65</code> <code>depth</code> <code>int</code> <p>(for Drain) The parse tree depth to be used for parsing.</p> <code>5</code> <code>force</code> <code>bool</code> <p>Whether to force re-parsing of the log file.</p> <code>False</code> <code>message_prefix</code> <code>str</code> <p>A prefix used to identify the beginning of each log message. Can be used to collapse multiple lines into a single message. Each line that doesn't start with this prefix will be concatenated to the previous log message.</p> <code>'.*'</code> <code>enable_gpt_tagging</code> <code>bool</code> <p>A boolean indicating whether GPT tagging should be enabled.</p> <code>False</code> <p>Returns:</p> Type Description <code>str</code> <p>The time elapsed for parsing, as a string.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def parse(\n    self,\n    regex_dict: dict[str, str] = DEFAULT_REGEX_DICT,\n    sim_thresh: float = 0.65,\n    depth: int = 5,\n    force: bool = False,\n    message_prefix: str = r\".*\",\n    enable_gpt_tagging: bool = False,\n) -&gt; str:\n    \"\"\"\n    Parse the log file into a dataframe.\n\n    Parameters:\n        regex_dict: (for Drain) A dictionary of regular expressions to be used for parsing.\n        sim_thresh: (for Drain) The similarity threshold to be used for parsing.\n        depth: (for Drain) The parse tree depth to be used for parsing.\n        force: Whether to force re-parsing of the log file.\n        message_prefix: A prefix used to identify the beginning of each log message.\n            Can be used to collapse multiple lines into a single message. Each line that doesn't start with this\n            prefix will be concatenated to the previous log message.\n        enable_gpt_tagging: A boolean indicating whether GPT tagging should be enabled.\n\n    Returns:\n        The time elapsed for parsing, as a string.\n    \"\"\"\n    start_time = datetime.now()\n    parser = Drain(\n        indir=os.path.dirname(self._filename),\n        depth=depth,\n        st=sim_thresh,\n        rex=regex_dict,\n        skip_writeout=self._skip_writeout,\n        message_prefix=message_prefix,\n    )\n\n    # Check if the parsed files already exist.\n    files_exist = not force\n    parsed_df_names = [\n        nameof(self._parsed_log),\n        nameof(self._parsed_templates),\n        nameof(self._parsed_variables),\n    ]\n    for var_name in parsed_df_names:\n        if not os.path.isfile(self._get_filename(var_name)):\n            files_exist = False\n            break\n\n    if files_exist:\n        self._parsed_log = Pickler.load(self._get_filename(parsed_df_names[0]))\n        self._parsed_templates = Pickler.load(\n            self._get_filename(parsed_df_names[1])\n        )\n        self._parsed_variables = Pickler.load(\n            self._get_filename(parsed_df_names[2])\n        )\n    else:\n        (\n            self._parsed_log,\n            self._parsed_templates,\n            self._parsed_variables,\n        ) = parser.parse(self._filename.split(\"/\")[-1])\n        tqdm.pandas(desc=\"Determining variable types...\")\n        self._parsed_variables[\"Type\"] = self._parsed_variables.progress_apply(\n            self._find_type, axis=1\n        )\n\n        # Cast and convert date columns\n        is_date = self._parsed_variables[\"Type\"] == \"date\"\n        date_cols = self._parsed_variables.loc[is_date, \"Name\"]\n        tqdm.pandas(desc=\"Casting date variables...\")\n        self._parsed_log[date_cols] = self._parsed_log[date_cols].progress_apply(\n            pd.to_datetime, errors=\"coerce\"\n        )\n        tqdm.pandas(desc=\"Casting date variables round 2...\")\n        self._parsed_log[date_cols] = self._parsed_log[date_cols].progress_applymap(\n            lambda x: x.timestamp() if not pd.isnull(x) else None\n        )\n        self._parsed_variables.loc[is_date, \"Type\"] = \"num\"\n\n        # Cast and convert time columns\n        is_time = self._parsed_variables[\"Type\"] == \"time\"\n        time_cols = self._parsed_variables.loc[is_time, \"Name\"]\n        tqdm.pandas(desc=\"Casting time variables...\")\n        self._parsed_log[time_cols] = self._parsed_log[time_cols].progress_apply(\n            pd.to_timedelta, errors=\"coerce\"\n        )\n        tqdm.pandas(desc=\"Casting time variables round 2...\")\n        self._parsed_log[time_cols] = self._parsed_log[time_cols].progress_applymap(\n            lambda x: x.total_seconds() if not pd.isnull(x) else None\n        )\n        self._parsed_variables.loc[is_time, \"Type\"] = \"num\"\n\n        # Cast numeric columns\n        is_num = self._parsed_variables[\"Type\"] == \"num\"\n        numeric_cols = self._parsed_variables.loc[is_num, \"Name\"]\n        tqdm.pandas(desc=\"Casting numerical variables...\")\n        self._parsed_log[numeric_cols] = self._parsed_log[\n            numeric_cols\n        ].progress_apply(pd.to_numeric, errors=\"coerce\")\n\n        # Tag variables.\n        tqdm.pandas(desc=\"Tagging variables...\")\n        if enable_gpt_tagging:\n            tag, tag_origin = zip(\n                *self._parsed_variables.progress_apply(\n                    lambda x: TagUtils.waterfall_tag(self.parsed_templates, x),\n                    axis=1,\n                )\n            )\n        else:\n            tag, tag_origin = zip(\n                *self._parsed_variables.progress_apply(\n                    lambda x: TagUtils.preceding_tokens_tag(x),\n                    axis=1,\n                )\n            )\n        self._parsed_variables[\"Tag\"] = tag\n        self._parsed_variables[\"TagOrigin\"] = tag_origin\n        TagUtils.deduplicate_tags(self._parsed_variables)\n\n        # Detect identifiers.\n        tqdm.pandas(desc=\"Detecting identifiers...\")\n        self._parsed_variables[\"IsUninteresting\"] = (\n            self._parsed_variables.progress_apply(self._find_uninteresting, axis=1)\n        )\n\n        # Reorder columns.\n        self._parsed_variables = self._parsed_variables[\n            [\n                \"Name\",\n                \"Tag\",\n                \"TagOrigin\",\n                \"Type\",\n                \"IsUninteresting\",\n                \"Occurrences\",\n                \"Preceding 3 tokens\",\n                \"Examples\",\n                \"From regex\",\n            ]\n        ]\n\n    # Write out files if appropriate.\n    if not self._skip_writeout and not files_exist:\n        Pickler.dump(self._parsed_log, self._get_filename(parsed_df_names[0]))\n        Pickler.dump(self._parsed_templates, self._get_filename(parsed_df_names[1]))\n        Pickler.dump(self._parsed_variables, self._get_filename(parsed_df_names[2]))\n\n    end_time = datetime.now()\n    elapsed = \"{:.6f}\".format((end_time - start_time).total_seconds())\n    Printer.printv(f\"Parsing complete in {elapsed} seconds!\")\n    return elapsed\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.include_in_template","title":"<code>include_in_template(var, enable_gpt_tagging=False, skip_writeout=None)</code>","text":"<p>Treat a certain parsed variable as part of its template and regenerate parsed dataframes.</p> <p>Parameters:</p> Name Type Description Default <code>var</code> <code>str</code> <p>The name or tag of the variable to be included in its template.</p> required <code>enable_gpt_tagging</code> <code>bool</code> <p>A boolean indicating whether GPT-3.5 tagging should be enabled.</p> <code>False</code> <code>skip_writeout</code> <code>Optional[bool]</code> <p>Whether to skip writing out the regenerated parsed dataframes. Defaults to the value of self._skip_writeout.</p> <code>None</code> Source code in <code>src/logos/logos.py</code> <pre><code>def include_in_template(\n    self,\n    var: str,\n    enable_gpt_tagging: bool = False,\n    skip_writeout: Optional[bool] = None,\n) -&gt; None:\n    \"\"\"\n    Treat a certain parsed variable as part of its template and regenerate parsed dataframes.\n\n    Parameters:\n        var: The name or tag of the variable to be included in its template.\n        enable_gpt_tagging: A boolean indicating whether GPT-3.5 tagging should be enabled.\n        skip_writeout: Whether to skip writing out the regenerated parsed dataframes. Defaults\n            to the value of self._skip_writeout.\n    \"\"\"\n    name = TagUtils.name_of(self._parsed_variables, var, \"parsed\")\n\n    old_template_id = ParsedVariableName(name).template_id()\n    idx = ParsedVariableName(name).index()\n    value_counts = self._parsed_log[name].value_counts().to_dict()\n\n    ### Modify _parsed_templates\n    old_template_row = (\n        self._parsed_templates.loc[\n            self._parsed_templates[\"TemplateId\"] == old_template_id\n        ]\n        .iloc[0]\n        .copy()\n    )\n    toks = old_template_row[\"TemplateText\"].split(\" \")\n    new_template_ids = {}\n    new_variable_indices = old_template_row[\"VariableIndices\"]\n    new_variable_indices.remove(idx)\n\n    for value, occurences in value_counts.items():\n        new_template_row = old_template_row.copy()\n        toks[idx] = value\n\n        new_template_row[\"TemplateText\"] = \" \".join(toks)\n        new_template_row[\"TemplateId\"] = hashlib.md5(\n            new_template_row[\"TemplateText\"].encode(\"utf-8\")\n        ).hexdigest()[0:8]\n        new_template_row[\"Occurrences\"] = occurences\n        new_template_row[\"VariableIndices\"] = new_variable_indices\n        new_template_row[\"RegexIndices\"] = old_template_row[\"RegexIndices\"]\n\n        self._parsed_templates.loc[len(self._parsed_templates)] = new_template_row\n        new_template_ids[value] = new_template_row[\"TemplateId\"]\n\n    self._parsed_templates = self._parsed_templates[\n        self._parsed_templates[\"TemplateId\"] != old_template_id\n    ].reset_index(drop=True)\n\n    ### Modify _parsed_log\n\n    # Update the template ids of all rows that belonged to the old template\n    self._parsed_log[\"TemplateId\"] = self._parsed_log.apply(\n        lambda x: (\n            new_template_ids[x[name]]\n            if (x[\"TemplateId\"] == old_template_id)\n            else x[\"TemplateId\"]\n        ),\n        axis=1,\n    )\n\n    # Create new variables for each new template id and assign the value of the old variables to them\n    new_variables = []\n    for new_template_id in new_template_ids.values():\n        for other_idx in new_variable_indices:\n            new_var_name = f\"{new_template_id}_{str(other_idx)}\"\n            new_variables.append(new_var_name)\n            self._parsed_log[new_var_name] = self._parsed_log.apply(\n                lambda x: (\n                    x[f\"{old_template_id}_{other_idx}\"]\n                    if (x[\"TemplateId\"] == new_template_id)\n                    else None\n                ),\n                axis=1,\n            )\n\n    # Drop variable columns associated with old template id\n    variables_to_drop = [\n        v for v in self._parsed_log.columns if v.startswith(old_template_id)\n    ]\n    self._parsed_log.drop(columns=variables_to_drop, inplace=True)\n\n    ### Modify _parsed_variables\n\n    # Add variable rows for each new variable\n    for value, occurrences in value_counts.items():\n        for other_idx in new_variable_indices:\n            new_template_id = new_template_ids[value]\n            new_var_name = f\"{new_template_id}_{str(other_idx)}\"\n\n            x = {}\n            x[\"Name\"] = new_var_name\n            x[\"Occurrences\"] = occurrences\n            x[\"Preceding 3 tokens\"] = (\n                self._parsed_templates[\n                    self._parsed_templates[\"TemplateId\"] == new_template_id\n                ][\"TemplateText\"]\n                .values[0]\n                .split()[max(0, other_idx - 3) : other_idx]\n            )\n            x[\"Examples\"] = (\n                self._parsed_log[new_var_name]\n                .loc[self._parsed_log[new_var_name].notna()]\n                .unique()[:5]\n                .tolist()\n            )\n            x[\"From regex\"] = False\n            if enable_gpt_tagging:\n                x[\"Tag\"], x[\"TagOrigin\"] = TagUtils.waterfall_tag(\n                    self.parsed_templates, pd.Series(x)\n                )\n            else:\n                x[\"Tag\"], x[\"TagOrigin\"] = TagUtils.preceding_tokens_tag(\n                    pd.Series(x)\n                )\n            x[\"Type\"] = self._find_type(pd.Series(x))\n            x[\"IsUninteresting\"] = self._find_uninteresting(pd.Series(x))\n\n            self._parsed_variables.loc[len(self._parsed_variables)] = x\n\n    # Drop variable rows associated with old template id\n    self._parsed_variables = self._parsed_variables[\n        ~self._parsed_variables[\"Name\"].isin(variables_to_drop)\n    ].reset_index(drop=True)\n\n    # Deduplicate tags again\n    TagUtils.deduplicate_tags(self._parsed_variables)\n\n    # Write out files if appropriate.\n    if skip_writeout is None:\n        skip_writeout = self._skip_writeout\n    if not skip_writeout:\n        Pickler.dump(self._parsed_log, self._get_filename(nameof(self._parsed_log)))\n        Pickler.dump(\n            self._parsed_templates,\n            self._get_filename(nameof(self._parsed_templates)),\n        )\n        Pickler.dump(\n            self._parsed_variables,\n            self._get_filename(nameof(self._parsed_variables)),\n        )\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.tag_parsed_variable","title":"<code>tag_parsed_variable(name, tag)</code>","text":"<p>Tag a parsed variable.</p> <p>Parameters:</p> Name Type Description Default <code>name</code> <code>str</code> <p>The name of the variable to be tagged.</p> required <code>tag</code> <code>str</code> <p>The tag to be assigned to the variable.</p> required Source code in <code>src/logos/logos.py</code> <pre><code>def tag_parsed_variable(self, name: str, tag: str) -&gt; None:\n    \"\"\"\n    Tag a parsed variable.\n\n    Parameters:\n        name: The name of the variable to be tagged.\n        tag: The tag to be assigned to the variable.\n    \"\"\"\n    TagUtils.set_tag(self._parsed_variables, name, tag, \"parsed\")\n    TagUtils.deduplicate_tags(self._parsed_variables)\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.get_tag_of_parsed","title":"<code>get_tag_of_parsed(name)</code>","text":"<p>Get the tag of a parsed variable.</p> <p>Parameters:</p> Name Type Description Default <code>name</code> <code>str</code> <p>The name of the variable.</p> required <p>Returns:</p> Type Description <code>str</code> <p>The tag of the variable.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def get_tag_of_parsed(self, name: str) -&gt; str:\n    \"\"\"\n    Get the tag of a parsed variable.\n\n    Parameters:\n        name: The name of the variable.\n\n    Returns:\n        The tag of the variable.\n    \"\"\"\n    return TagUtils.get_tag(self._parsed_variables, name, \"parsed\")\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.tag_prepared_variable","title":"<code>tag_prepared_variable(name, tag)</code>","text":"<p>Tag a prepared variable.</p> <p>Parameters:</p> Name Type Description Default <code>name</code> <code>str</code> <p>The name of the variable to be tagged.</p> required <code>tag</code> <code>str</code> <p>The tag to be assigned to the variable.</p> required Source code in <code>src/logos/logos.py</code> <pre><code>def tag_prepared_variable(self, name: str, tag: str) -&gt; None:\n    \"\"\"\n    Tag a prepared variable.\n\n    Parameters:\n        name: The name of the variable to be tagged.\n        tag: The tag to be assigned to the variable.\n    \"\"\"\n    TagUtils.set_tag(self._prepared_variables, name, tag, \"prepared\")\n    TagUtils.deduplicate_tags(self._prepared_variables)\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.get_tag_of_prepared","title":"<code>get_tag_of_prepared(name)</code>","text":"<p>Get the tag of a prepared variable.</p> <p>Parameters:</p> Name Type Description Default <code>name</code> <code>str</code> <p>The name of the variable.</p> required <p>Returns:</p> Type Description <code>str</code> <p>The tag of the variable.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def get_tag_of_prepared(self, name: str) -&gt; str:\n    \"\"\"\n    Get the tag of a prepared variable.\n\n    Parameters:\n        name: The name of the variable.\n\n    Returns:\n        The tag of the variable.\n    \"\"\"\n    return TagUtils.get_tag(self._prepared_variables, name, \"prepared\")\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.get_causal_unit_info","title":"<code>get_causal_unit_info()</code>","text":"<p>Get the variable used to define causal units and the number of causal units.</p> <p>Returns:</p> Type Description <code>str</code> <p>The name of the variable used to define causal units</p> <code>int</code> <p>and the number of causal units.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def get_causal_unit_info(self) -&gt; Tuple[str, int]:\n    \"\"\"\n    Get the variable used to define causal units and the number of\n    causal units.\n\n    Returns:\n        The name of the variable used to define causal units\n        and the number of causal units.\n    \"\"\"\n    return self._causal_unit_var, self._num_causal_units\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.suggest_causal_unit_defs","title":"<code>suggest_causal_unit_defs(min_causal_units=4, num_suggestions=10)</code>","text":"<p>Suggest at most <code>num_suggestions</code> causal unit definitions based on IUS maximization, while returning at least <code>min_causal_units</code> causal units.</p> <p>Parameters:</p> Name Type Description Default <code>min_causal_units</code> <code>int</code> <p>The minimum number of causal units that a suggested definition should create.</p> <code>4</code> <code>num_suggestions</code> <code>int</code> <p>The maximum number of causal unit definitions to suggest.</p> <code>10</code> <p>Returns:</p> Type Description <code>Optional[DataFrame]</code> <p>A DataFrame with one row for each suggested causal unit definition, or <code>None</code> if no suggestions were made.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def suggest_causal_unit_defs(\n    self,\n    min_causal_units: int = 4,\n    num_suggestions: int = 10,\n) -&gt; Optional[pd.DataFrame]:\n    \"\"\"\n    Suggest at most `num_suggestions` causal unit definitions based on IUS maximization,\n    while returning at least `min_causal_units` causal units.\n\n    Parameters:\n        min_causal_units: The minimum number of causal units that a suggested\n            definition should create.\n        num_suggestions: The maximum number of causal unit definitions to suggest.\n\n    Returns:\n        A DataFrame with one row for each suggested causal unit definition, or `None`\n            if no suggestions were made.\n    \"\"\"\n\n    return CausalUnitSuggester.suggest_causal_unit_defs(\n        self._parsed_log[self._parsed_variables[\"Name\"].values],\n        self._parsed_variables,\n        min_causal_units=min_causal_units,\n        num_suggestions=num_suggestions,\n    )\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.set_causal_unit","title":"<code>set_causal_unit(var, num_units=None)</code>","text":"<p>Set the variable used to define causal units and optionally the number of causal units. The latter will be ignored if the variable is categorical, but it must be specified if the variable is numerical.</p> <p>Parameters:</p> Name Type Description Default <code>var</code> <code>str</code> <p>The name or tag of the variable to be used as the causal unit.</p> required <code>num_units</code> <code>Optional[int]</code> <p>The number of causal units to be created.</p> <code>None</code> <p>Raises:</p> Type Description <code>ValueError</code> <p>If the variable is numerical and <code>num_units</code> is not specified.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def set_causal_unit(\n    self,\n    var: str,\n    num_units: Optional[int] = None,\n) -&gt; None:\n    \"\"\"\n    Set the variable used to define causal units and optionally the number of\n    causal units. The latter will be ignored if the variable is categorical, but it\n    must be specified if the variable is numerical.\n\n    Parameters:\n        var: The name or tag of the variable to be used as the causal unit.\n        num_units: The number of causal units to be created.\n\n    Raises:\n        ValueError: If the variable is numerical and `num_units` is not specified.\n    \"\"\"\n    var_name = TagUtils.name_of(self._parsed_variables, var, \"parsed\")\n    var_type = self._parsed_variables.loc[\n        self._parsed_variables[\"Name\"] == var_name, \"Type\"\n    ].values[0]\n\n    if var_type == \"num\" and num_units is None:\n        raise ValueError(\n            \"The number of causal units must be specified if the causal unit is numerical.\"\n        )\n\n    self._causal_unit_var = var_name\n    self._num_causal_units = num_units\n\n    Printer.printv(\n        f\"Causal unit set to {var_name} (tag: {self.get_tag_of_parsed(var_name)}) \"\n        + (\n            \"\"\n            if not self._num_causal_units\n            else f\" with {self._num_causal_units} causal units.\"\n        )\n    )\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.prepare","title":"<code>prepare(custom_agg={}, custom_imp={}, count_occurences=False, ignore_uninteresting=True, force=False, lasso_alpha=Pruner.LASSO_DEFAULT_ALPHA, lasso_max_iter=Pruner.LASSO_DEFAULT_MAX_ITER, drop_bad_aggs=True, reject_prunable_edges=False)</code>","text":"<p>Prepare the log parsed from the table for causal analysis, using aggregation and imputation as needed.</p> <p>Parameters:</p> Name Type Description Default <code>custom_agg</code> <code>dict[str, list[str]]</code> <p>A dictionary of custom aggregation functions to be used for specific variables.</p> <code>{}</code> <code>custom_imp</code> <code>dict[str, list[str]]</code> <p>A dictionary of custom imputation functions to be used for specific variables.</p> <code>{}</code> <code>count_occurences</code> <code>bool</code> <p>Whether to include extra variables counting the occurence of each template.</p> <code>False</code> <code>ignore_uninteresting</code> <code>bool</code> <p>Whether to ignore uninteresting variables.</p> <code>True</code> <code>force</code> <code>bool</code> <p>Whether to force re-preparation of the log.</p> <code>False</code> <code>lasso_alpha</code> <code>float</code> <p>The alpha parameter to be used for LASSO regression.</p> <code>LASSO_DEFAULT_ALPHA</code> <code>lasso_max_iter</code> <code>int</code> <p>The maximum number of iterations to be used for LASSO regression.</p> <code>LASSO_DEFAULT_MAX_ITER</code> <code>drop_bad_aggs</code> <code>bool</code> <p>Whether to drop prepared variables that do not add information compared to other variables based on the same base variable but using a different aggregation function.</p> <code>True</code> <code>reject_prunable_edges</code> <code>bool</code> <p>Whether to reject edges that are prunable based on LASSO applciation.</p> <code>False</code> <p>Returns:</p> Type Description <code>str</code> <p>The time elapsed for preparation, as a string.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def prepare(\n    self,\n    custom_agg: dict[str, list[str]] = {},\n    custom_imp: dict[str, list[str]] = {},\n    count_occurences: bool = False,\n    ignore_uninteresting: bool = True,\n    force: bool = False,\n    lasso_alpha: float = Pruner.LASSO_DEFAULT_ALPHA,\n    lasso_max_iter: int = Pruner.LASSO_DEFAULT_MAX_ITER,\n    drop_bad_aggs: bool = True,\n    reject_prunable_edges: bool = False,\n) -&gt; str:\n    \"\"\"\n    Prepare the log parsed from the table for causal analysis, using aggregation and imputation as needed.\n\n    Parameters:\n        custom_agg: A dictionary of custom aggregation functions to be used for specific variables.\n        custom_imp: A dictionary of custom imputation functions to be used for specific variables.\n        count_occurences: Whether to include extra variables counting the occurence of each template.\n        ignore_uninteresting: Whether to ignore uninteresting variables.\n        force: Whether to force re-preparation of the log.\n        lasso_alpha: The alpha parameter to be used for LASSO regression.\n        lasso_max_iter: The maximum number of iterations to be used for LASSO regression.\n        drop_bad_aggs: Whether to drop prepared variables that do not add information compared to other\n            variables based on the same base variable but using a different aggregation function.\n        reject_prunable_edges: Whether to reject edges that are prunable based on LASSO applciation.\n\n    Returns:\n        The time elapsed for preparation, as a string.\n    \"\"\"\n\n    start_time = datetime.now()\n    # Ensure causal unit is set. TODO: make IUS maximizer the default\n    if self._causal_unit_var is None:\n        print(\"Causal unit not defined. Aborting.\")\n        return None\n\n    # Check if the prepared files already exist.\n    files_exist = not force\n    prepared_df_names = [\n        nameof(self._prepared_log),\n        nameof(self._prepared_variables),\n    ]\n    for var_name in prepared_df_names:\n        if not os.path.isfile(self._get_filename(var_name)):\n            files_exist = False\n            break\n\n    if files_exist:\n        self._prepared_log = Pickler.load(self._get_filename(prepared_df_names[0]))\n        self._prepared_variables = Pickler.load(\n            self._get_filename(prepared_df_names[1])\n        )\n    else:\n        self._prepare_anew(\n            custom_agg,\n            custom_imp,\n            count_occurences=count_occurences,\n            ignore_uninteresting=ignore_uninteresting,\n            drop_bad_aggs=drop_bad_aggs,\n        )\n\n    self._edge_states = EdgeStateMatrix(self.prepared_variable_names)\n    if reject_prunable_edges:\n        Printer.printv(f\"Pruning edges...\")\n        self.reject_all_prunable_edges(\n            lasso_alpha=lasso_alpha, lasso_max_iter=lasso_max_iter\n        )\n\n    self._eccs = ECCS(self._prepared_log, nx.DiGraph())\n    self._eccs.set_verbose_to(Printer.LOGOS_VERBOSE)\n\n    end_time = datetime.now()\n    elapsed = \"{:.6f}\".format((end_time - start_time).total_seconds())\n    Printer.printv(\n        f\"\"\"Preparation complete in {elapsed} seconds! \"\"\"\n        f\"\"\"{np.count_nonzero(self._edge_states.m == -1)} of the {self.num_prepared_variables ** 2} possible edges were auto-rejected.\"\"\"\n    )\n\n    return elapsed\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos._prepare_anew","title":"<code>_prepare_anew(custom_agg={}, custom_imp={}, count_occurences=False, ignore_uninteresting=True, drop_bad_aggs=True)</code>","text":"<p>Prepare the log anew.</p> <p>Parameters:</p> Name Type Description Default <code>custom_agg</code> <code>dict[str, list[str]]</code> <p>A dictionary of custom aggregation functions to be used for specific variables.</p> <code>{}</code> <code>custom_imp</code> <code>dict[str, list[str]]</code> <p>A dictionary of custom imputation functions to be used for specific variables.</p> <code>{}</code> <code>count_occurences</code> <code>bool</code> <p>Whether to include extra variables counting the occurence of each template.</p> <code>False</code> <code>ignore_uninteresting</code> <code>bool</code> <p>Whether to ignore uninteresting variables.</p> <code>True</code> <code>drop_bad_aggs</code> <code>bool</code> <p>Whether to drop prepared variables that do not add information compared to other variables based on the same base variable but using a different aggregation function.</p> <code>True</code> Source code in <code>src/logos/logos.py</code> <pre><code>def _prepare_anew(\n    self,\n    custom_agg: dict[str, list[str]] = {},\n    custom_imp: dict[str, list[str]] = {},\n    count_occurences: bool = False,\n    ignore_uninteresting: bool = True,\n    drop_bad_aggs: bool = True,\n) -&gt; None:\n    \"\"\"\n    Prepare the log anew.\n\n    Parameters:\n        custom_agg: A dictionary of custom aggregation functions to be used for specific variables.\n        custom_imp: A dictionary of custom imputation functions to be used for specific variables.\n        count_occurences: Whether to include extra variables counting the occurence of each template.\n        ignore_uninteresting: Whether to ignore uninteresting variables.\n        drop_bad_aggs: Whether to drop prepared variables that do not add information compared to other\n            variables based on the same base variable but using a different aggregation function.\n    \"\"\"\n\n    Printer.printv(f\"Determining the causal unit assignment...\")\n    causal_unit_assignment = CausalUnitSuggester._discretize(\n        self._parsed_log[self._causal_unit_var],\n        self._parsed_variables[\n            self._parsed_variables[\"Name\"] == self._causal_unit_var\n        ][\"Type\"].values[0],\n        self._num_causal_units,\n    )\n\n    # Convert keys in custom_agg and custom_imp to the names of the variables, if they are tags.\n    custom_agg = {\n        TagUtils.name_of(self._parsed_variables, k, \"parsed\"): v\n        for k, v in custom_agg.items()\n    }\n    custom_imp = {\n        TagUtils.name_of(self._parsed_variables, k, \"parsed\"): v\n        for k, v in custom_imp.items()\n    }\n\n    # Start with the parsed log, optionally with extra variables counting the occurence of each template.\n    if count_occurences:\n        Printer.printv(f\"Adding template occurrence count variables...\")\n        self._prepared_log = pd.concat(\n            [\n                self._parsed_log,\n                pd.get_dummies(\n                    self._parsed_log[\"TemplateId\"],\n                    prefix=\"TemplateId\",\n                    prefix_sep=\"=\",\n                    dtype=float,\n                ),\n            ],\n            axis=1,\n        )\n    else:\n        self._prepared_log = self._parsed_log.copy(deep=True)\n\n    # No longer need the column storing the actual template IDs\n    self._prepared_log.drop(columns=\"TemplateId\", inplace=True)\n\n    # Build dictionary of aggregation functions\n    agg_dict: dict[str, str] = {\n        variable.Name: (\n            custom_agg[variable.Name]\n            if variable.Name in custom_agg\n            else AggregateSelector.DEFAULT_AGGREGATES[variable.Type]\n        )\n        for variable in self._parsed_variables.itertuples()\n    }\n\n    # Add aggregations for template counts\n    for col in self._prepared_log.columns:\n        if PreparedVariableName(col).base_var() == \"TemplateId\":\n            agg_dict[col] = [\"sum\"]\n\n    # Drop uninteresting columns if requested, except if they are the causal unit.\n    ui_cols = self._parsed_variables.loc[\n        self._parsed_variables[\"IsUninteresting\"], \"Name\"\n    ].values\n    ui_cols = [x for x in ui_cols if x != self._causal_unit_var]\n    if ignore_uninteresting:\n        self._prepared_log.drop(\n            columns=ui_cols,\n            inplace=True,\n        )\n        for col in ui_cols:\n            agg_dict.pop(col, None)\n        Printer.printv(\n            f\"Dropped {len(ui_cols)} uninteresting columns, out of an original total of {len(self.parsed_variables)}.\"\n        )\n\n    # Ensure the causal unit variable only has one aggregation function\n    agg_dict[self._causal_unit_var] = agg_dict[self._causal_unit_var][:1]\n\n    # Perform the aggregation\n    Printer.printv(\"Calculating aggregates for each causal unit...\")\n    agg_func_dict: dict[str, list[Callable]] = {\n        name: [self._agg_funcs[f] for f in funcs]\n        for name, funcs in agg_dict.items()\n    }\n    self._prepared_log = self._prepared_log.groupby(\n        causal_unit_assignment\n    ).aggregate(agg_func_dict)\n    self._prepared_log.columns = [\n        \"+\".join(col) for col in self._prepared_log.columns.values\n    ]\n    self._parsed_variables[\"Aggregates\"] = self._parsed_variables[\"Name\"].map(\n        lambda x: agg_dict.get(x, [])\n    )\n    self._prepared_log.set_index(\n        f\"{self._causal_unit_var}+{self._parsed_variables[self._parsed_variables['Name'] == self._causal_unit_var]['Aggregates'].values[0][0]}\",\n        inplace=True,\n    )\n    self._prepared_log.sort_index(inplace=True)\n    self._prepared_log.index = self._prepared_log.index.astype(str)\n\n    # Perform the imputation\n    for col in tqdm(self._prepared_log.columns, desc=\"Imputing missing values...\"):\n        if self._prepared_log[col].isnull().values.any():\n            base_var = PreparedVariableName(col).base_var()\n            func_name: str = (\n                custom_imp[base_var] if base_var in custom_imp else \"no_imp\"\n            )\n            self._prepared_log[col] = (self._imp_funcs[func_name])(\n                self._prepared_log[col]\n            )\n    self._prepared_log.dropna(inplace=True)\n\n    # Drop variables that do not add information compared to other variables based on the same base variable\n    # but using a different aggregation function.\n    if drop_bad_aggs:\n        Printer.printv(f\"Dropping aggregates that do not add information...\")\n        cols_to_drop = AggregateSelector.find_uninformative_aggregates(\n            self._prepared_log, self._parsed_variables, self._causal_unit_var\n        )\n        self._prepared_log.drop(columns=cols_to_drop, inplace=True)\n\n    # Identify the categorical variables and one-hot encode them\n    categorical_vars = self._prepared_log.select_dtypes(\n        include=\"object\"\n    ).columns.tolist()\n    for col in tqdm(\n        categorical_vars, desc=\"One-hot encoding categorical variables...\"\n    ):\n        self._prepared_log = pd.concat(\n            [\n                self._prepared_log,\n                pd.get_dummies(\n                    self._prepared_log[col], prefix=col, prefix_sep=\"=\", dtype=float\n                ),\n            ],\n            axis=1,\n        )\n        self._prepared_log.drop(col, axis=1, inplace=True)\n    # Deal with https://github.com/pydot/pydot/issues/258\n    self._prepared_log.columns = [\n        x.replace(\":\", \";\") for x in self._prepared_log.columns\n    ]\n\n    # Generate dataframe of prepared variables for later tagging etc.\n    self._generate_prepared_variables_df()\n\n    # Convert any date columns to Unix timestamps in milliseconds\n    date_cols = self._prepared_variables.loc[\n        self._prepared_variables[\"Type\"] == \"date\", \"Name\"\n    ].values\n    self._prepared_log[date_cols] = self._prepared_log[date_cols].map(\n        lambda x: x.timestamp() * 1000.0\n    )\n\n    # Convert any time columns to milliseconds\n    time_cols = self._prepared_variables.loc[\n        self._prepared_variables[\"Type\"] == \"time\", \"Name\"\n    ].values\n    self._prepared_log[time_cols] = self._prepared_log[time_cols].map(\n        lambda x: x.total_seconds() * 1000.0\n    )\n\n    # Write out prepared log and variables\n    if not self._skip_writeout:\n        Pickler.dump(\n            self._prepared_log, self._get_filename(nameof(self._prepared_log))\n        )\n        Pickler.dump(\n            self._prepared_variables,\n            self._get_filename(nameof(self._prepared_variables)),\n        )\n\n    Printer.printv(\n        f\"\"\"Successfully prepared the log with causal unit {self._causal_unit_var} \"\"\"\n        f\"\"\"(tag: {self.get_tag_of_parsed(self._causal_unit_var)})\"\"\"\n        + (\n            \"\"\n            if not self._num_causal_units\n            else f\" with {self._num_causal_units} causal units.\"\n        )\n    )\n\n    return\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos._generate_prepared_variables_df","title":"<code>_generate_prepared_variables_df()</code>","text":"<p>Generate dataframe of prepared variables for later tagging etc.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def _generate_prepared_variables_df(self) -&gt; None:\n    \"\"\"\n    Generate dataframe of prepared variables for later tagging etc.\n    \"\"\"\n\n    self._prepared_variables = pd.DataFrame()\n    self._prepared_variables[\"Name\"] = self._prepared_log.columns\n\n    # Bring in varable name components leveraging PreparedVariableName\n    self._prepared_variables[\"Base\"] = self._prepared_variables[\"Name\"].apply(\n        lambda x: PreparedVariableName(x).base_var()\n    )\n    self._prepared_variables[\"Pre-agg Value\"] = self._prepared_variables[\n        \"Name\"\n    ].apply(lambda x: PreparedVariableName(x).pre_agg_value())\n    self._prepared_variables[\"Agg\"] = self._prepared_variables[\"Name\"].apply(\n        lambda x: PreparedVariableName(x).aggregate()\n    )\n    self._prepared_variables[\"Post-agg Value\"] = self._prepared_variables[\n        \"Name\"\n    ].apply(lambda x: PreparedVariableName(x).post_agg_value())\n\n    # Bring in other info from self._parsed_variables\n    self._prepared_variables[\"Tag\"] = self._prepared_variables.apply(\n        lambda x: (\n            self._parsed_variables.loc[\n                self._parsed_variables[\"Name\"] == x[\"Base\"],\n                \"Tag\",\n            ].values[0]\n            if x[\"Base\"] != \"TemplateId\"\n            else \"TemplateId\"\n        )\n        + (f\" {x['Pre-agg Value']}\" if x[\"Pre-agg Value\"] != \"\" else \"\")\n        + (f\" {x['Agg']}\" if x[\"Agg\"] != \"\" else \"\")\n        + (f\" {x['Post-agg Value']}\" if x[\"Post-agg Value\"] != \"\" else \"\"),\n        axis=1,\n    )\n    self._prepared_variables[\"Base Variable Occurences\"] = self._prepared_variables[\n        \"Base\"\n    ].apply(\n        lambda x: (\n            self._parsed_variables.loc[\n                self._parsed_variables[\"Name\"] == x, \"Occurrences\"\n            ].values[0]\n            if x != \"TemplateId\"\n            else \"\"\n        )\n    )\n    self._prepared_variables[\"Type\"] = self._prepared_variables[\"Base\"].apply(\n        lambda x: (\n            self._parsed_variables.loc[\n                self._parsed_variables[\"Name\"] == x, \"Type\"\n            ].values[0]\n            if x != \"TemplateId\"\n            else \"\"\n        )\n    )\n    self._prepared_variables[\"Examples\"] = self._prepared_variables[\"Base\"].apply(\n        lambda x: (\n            self._parsed_variables.loc[\n                self._parsed_variables[\"Name\"] == x, \"Examples\"\n            ].values[0]\n            if x != \"TemplateId\"\n            else \"\"\n        )\n    )\n    self._prepared_variables[\"From regex\"] = self._prepared_variables[\"Base\"].apply(\n        lambda x: (\n            self._parsed_variables.loc[\n                self._parsed_variables[\"Name\"] == x, \"From regex\"\n            ].values[0]\n            if x != \"TemplateId\"\n            else \"\"\n        )\n    )\n\n    # Bring in template text, only for appropriate base variables.\n    self._prepared_variables[\"TemplateText\"] = self._prepared_variables.apply(\n        lambda x: (\n            self._parsed_templates.loc[\n                self._parsed_templates[\"TemplateId\"]\n                == PreparedVariableName(x[\"Name\"]).template_id(),\n                \"TemplateText\",\n            ].values[0]\n            if x[\"From regex\"] == False\n            else \"\"\n        ),\n        axis=1,\n    )\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.inspect","title":"<code>inspect(var, ref_var=None, row_limit=10)</code>","text":"<p>Print information about a specific prepared variable.</p> <p>Parameters:</p> Name Type Description Default <code>var</code> <code>str</code> <p>The name or tag of the variable.</p> required <code>ref_var</code> <code>Optional[str]</code> <p>The name or tag of a reference variable.</p> <code>None</code> <code>row_limit</code> <code>Optional[int]</code> <p>The number of rows of the prepared log to print out, to illustrate example values of this variable.</p> <code>10</code> <p>Returns:</p> Type Description <code>Tuple[DataFrame, DataFrame, DataFrame]</code> <p>A tuple containing: (1) Information about the base variable of <code>var</code>, if <code>var</code> is not related to the     occurrence count of a template. (2) Information about the template of <code>var</code>, if <code>var</code> was not created from a regex. (3) A sample of the prepared log, with <code>row_limit</code> rows.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def inspect(\n    self,\n    var: str,\n    ref_var: Optional[str] = None,\n    row_limit: Optional[int] = 10,\n) -&gt; Tuple[pd.DataFrame, pd.DataFrame, pd.DataFrame]:\n    \"\"\"\n    Print information about a specific prepared variable.\n\n    Parameters:\n        var: The name or tag of the variable.\n        ref_var: The name or tag of a reference variable.\n        row_limit: The number of rows of the prepared log to print out,\n            to illustrate example values of this variable.\n\n    Returns:\n        A tuple containing:\n            (1) Information about the base variable of `var`, if `var` is not related to the\n                occurrence count of a template.\n            (2) Information about the template of `var`, if `var` was not created from a regex.\n            (3) A sample of the prepared log, with `row_limit` rows.\n    \"\"\"\n\n    # Retrieve the name of this variable, if a tag was passed in.\n    name = TagUtils.name_of(self._prepared_variables, var, \"prepared\")\n\n    print(f\"Information about prepared variable {name}:\\n\")\n    base_var = PreparedVariableName(name).base_var()\n    from_regex = False\n\n    base_var_info_df = pd.DataFrame()\n    if base_var != \"TemplateId\":\n        print(f\"--&gt; Variable Information about {base_var}:\")\n        base_var_info_df = self._parsed_variables[\n            self._parsed_variables[\"Name\"] == base_var\n        ]\n        from_regex = base_var_info_df[\"From regex\"].values[0]\n        display(base_var_info_df)\n\n    template_info_df = pd.DataFrame()\n    if not from_regex:\n        template_id = PreparedVariableName(name).template_id()\n        print(f\"--&gt; Template Information about {template_id}:\")\n        template_info_df = self._parsed_templates[\n            self._parsed_templates[\"TemplateId\"] == template_id\n        ]\n        display(template_info_df)\n\n    print(\"--&gt; Causal Unit Partial Information:\")\n    if row_limit == None:\n        row_limit = len(self._prepared_log)\n    col_list = [name]\n    col_list.extend([ref_var] if ref_var is not None else [])\n    prepared_log_info_df = self._prepared_log[col_list].head(row_limit)\n    col_names = [f\"{name} (candidate)\"]\n    col_names.extend([f\"{ref_var} (outcome)\"] if ref_var is not None else [])\n    prepared_log_info_df.columns = col_names\n    display(prepared_log_info_df)\n\n    return base_var_info_df, template_info_df, prepared_log_info_df\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.clear_graph","title":"<code>clear_graph(clear_edge_states=True)</code>","text":"<p>Clear the graph and possibly edge states.</p> <p>Parameters:</p> Name Type Description Default <code>clear_edge_states</code> <code>bool</code> <p>Whether to also clear the edge states.</p> <code>True</code> Source code in <code>src/logos/logos.py</code> <pre><code>def clear_graph(self, clear_edge_states: bool = True) -&gt; None:\n    \"\"\"\n    Clear the graph and possibly edge states.\n\n    Parameters:\n        clear_edge_states: Whether to also clear the edge states.\n    \"\"\"\n    self._graph = nx.DiGraph()\n    if clear_edge_states:\n        self._edge_states = EdgeStateMatrix(self.prepared_variable_names)\n    if self._eccs:\n        self._eccs.clear_graph(clear_edge_states)\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.display_graph","title":"<code>display_graph()</code>","text":"<p>Display the current graph.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def display_graph(self) -&gt; None:\n    \"\"\"\n    Display the current graph.\n    \"\"\"\n    GraphRenderer.display_graph(self._graph, self._prepared_variables)\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.save_graph","title":"<code>save_graph(filename)</code>","text":"<p>Save the current graph to a file.</p> <p>Parameters:</p> Name Type Description Default <code>filename</code> <code>str</code> <p>The name of the file to save to.</p> required Source code in <code>src/logos/logos.py</code> <pre><code>def save_graph(self, filename: str) -&gt; None:\n    \"\"\"\n    Save the current graph to a file.\n\n    Parameters:\n        filename: The name of the file to save to.\n    \"\"\"\n    GraphRenderer.save_graph(self._graph, self._prepared_variables, filename)\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.accept","title":"<code>accept(src, dst, also_fix=False, interactive=True)</code>","text":"<p>Mark a causal graph edge as accepted.</p> <p>This will also reject the edge from <code>dst</code> to <code>src</code> and remove any other variables with the same base variable as either <code>src</code> or <code>dst</code> from consideration for the partial causal graph.</p> <p>Parameters:</p> Name Type Description Default <code>src</code> <code>str</code> <p>The name or tag of the source variable.</p> required <code>dst</code> <code>str</code> <p>The name or tag of the destination variable.</p> required <code>also_fix</code> <code>bool</code> <p>Whether to also fix the edge, for ECCS.</p> <code>False</code> <code>interactive</code> <code>bool</code> <p>Whether to display the graph interactively after accepting the edge.</p> <code>True</code> <p>Returns:</p> Type Description <code>Tuple[float, Optional[str], Optional[str]]</code> <p>A tuple containing: (1) the exploration score after the edge addition, (2) the max-impact variable to explore next, if any, (3) optionally a string representation of the graph, if <code>interactive</code> is False.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def accept(\n    self,\n    src: str,\n    dst: str,\n    also_fix: bool = False,\n    interactive: bool = True,\n) -&gt; Tuple[float, Optional[str], Optional[str]]:\n    \"\"\"\n    Mark a causal graph edge as accepted.\n\n    This will also reject the edge from `dst` to `src` and remove any other variables with the\n    same base variable as either `src` or `dst` from consideration for the partial causal graph.\n\n    Parameters:\n        src: The name or tag of the source variable.\n        dst: The name or tag of the destination variable.\n        also_fix: Whether to also fix the edge, for ECCS.\n        interactive: Whether to display the graph interactively after accepting the edge.\n\n    Returns:\n        A tuple containing:\n            (1) the exploration score after the edge addition,\n            (2) the max-impact variable to explore next, if any,\n            (3) optionally a string representation of the graph, if `interactive` is False.\n    \"\"\"\n\n    src_name = TagUtils.name_of(self._prepared_variables, src, \"prepared\")\n    dst_name = TagUtils.name_of(self._prepared_variables, dst, \"prepared\")\n    to_drop = self._edge_states.mark_edge(src_name, dst_name, \"Accepted\")\n    for node in to_drop:\n        if node in self._graph.nodes:\n            self._graph.remove_node(node)\n\n    self._graph.add_node(src_name)\n    self._graph.add_node(dst_name)\n    self._graph.add_edge(src_name, dst_name)\n    if (dst_name, src_name) in self._graph.edges:\n        self._graph.remove_edge(dst_name, src_name)\n    if interactive:\n        GraphRenderer.display_graph(self._graph, self._prepared_variables)\n    if self._eccs:\n        self._eccs.remove_edge(dst_name, src_name)\n        self._eccs.add_edge(src_name, dst_name)\n        if also_fix:\n            self._eccs.fix_edge(src_name, dst_name)\n\n    return (\n        self.exploration_score,\n        self.suggest_next_exploration(),\n        (\n            GraphRenderer.draw_graph(self._graph, self._prepared_variables)\n            if not interactive\n            else \"\"\n        ),\n    )\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.reject","title":"<code>reject(src, dst, also_ban, interactive=True)</code>","text":"<p>Mark a causal graph edge as rejected.</p> <p>Parameters:</p> Name Type Description Default <code>src</code> <code>str</code> <p>The name or tag of the source variable.</p> required <code>dst</code> <code>str</code> <p>The name or tag of the destination variable.</p> required <code>also_ban</code> <code>bool</code> <p>Whether to also ban the edge, for ECCS.</p> required <code>interactive</code> <code>bool</code> <p>Whether to display the graph interactively after rejecting the edge.</p> <code>True</code> <p>Returns:</p> Type Description <code>Tuple[float, Optional[str], Optional[str]]</code> <p>A tuple containing: (1) the exploration score after the edge rejection, (2) the max-impact variable to explore next, if any, (3) optionally a string representation of the graph, if <code>interactive</code> is False.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def reject(\n    self,\n    src: str,\n    dst: str,\n    also_ban: bool,\n    interactive: bool = True,\n) -&gt; Tuple[float, Optional[str], Optional[str]]:\n    \"\"\"\n    Mark a causal graph edge as rejected.\n\n    Parameters:\n        src: The name or tag of the source variable.\n        dst: The name or tag of the destination variable.\n        also_ban: Whether to also ban the edge, for ECCS.\n        interactive: Whether to display the graph interactively after rejecting the edge.\n\n    Returns:\n        A tuple containing:\n            (1) the exploration score after the edge rejection,\n            (2) the max-impact variable to explore next, if any,\n            (3) optionally a string representation of the graph, if `interactive` is False.\n    \"\"\"\n\n    src_name = TagUtils.name_of(self._prepared_variables, src, \"prepared\")\n    dst_name = TagUtils.name_of(self._prepared_variables, dst, \"prepared\")\n    self._edge_states.mark_edge(src_name, dst_name, \"Rejected\")\n    if self._eccs and also_ban:\n        self._eccs.ban_edge(src_name, dst_name)\n\n    if interactive:\n        GraphRenderer.display_graph(self._graph, self._prepared_variables)\n\n    return (\n        self.exploration_score,\n        self.suggest_next_exploration(),\n        (\n            GraphRenderer.draw_graph(self._graph, self._prepared_variables)\n            if not interactive\n            else \"\"\n        ),\n    )\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.reject_undecided_incoming","title":"<code>reject_undecided_incoming(dst, also_ban, interactive=True)</code>","text":"<p>Mark all undecided incoming edges to a variable as rejected.</p> <p>Parameters:</p> Name Type Description Default <code>dst</code> <code>str</code> <p>The name or tag of the destination variable.</p> required <code>also_ban</code> <code>bool</code> <p>Whether to also ban the edges, for ECCS.</p> required <code>interactive</code> <code>bool</code> <p>Whether to display the graph interactively after rejecting the edges.</p> <code>True</code> <p>Returns:</p> Type Description <code>Tuple[float, Optional[str], Optional[str]]</code> <p>A tuple containing: (1) the exploration score after the edge rejections, (2) the max-impact variable to explore next, if any, (3) optionally a string representation of the graph, if <code>interactive</code> is False.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def reject_undecided_incoming(\n    self, dst: str, also_ban: bool, interactive: bool = True\n) -&gt; Tuple[float, Optional[str], Optional[str]]:\n    \"\"\"\n    Mark all undecided incoming edges to a variable as rejected.\n\n    Parameters:\n        dst: The name or tag of the destination variable.\n        also_ban: Whether to also ban the edges, for ECCS.\n        interactive: Whether to display the graph interactively after rejecting the edges.\n\n    Returns:\n        A tuple containing:\n            (1) the exploration score after the edge rejections,\n            (2) the max-impact variable to explore next, if any,\n            (3) optionally a string representation of the graph, if `interactive` is False.\n    \"\"\"\n    dst_name = TagUtils.name_of(self._prepared_variables, dst, \"prepared\")\n    for v in self.prepared_variable_names:\n        if self._edge_states.get_edge_state(v, dst_name) == \"Undecided\":\n            self._edge_states.mark_edge(v, dst_name, \"Rejected\")\n            if self._eccs and also_ban:\n                self._eccs.ban_edge(v, dst_name)\n\n    if interactive:\n        GraphRenderer.display_graph(self._graph, self._prepared_variables)\n\n    return (\n        self.exploration_score,\n        self.suggest_next_exploration(),\n        (\n            GraphRenderer.draw_graph(self._graph, self._prepared_variables)\n            if not interactive\n            else \"\"\n        ),\n    )\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.reject_undecided_outgoing","title":"<code>reject_undecided_outgoing(src, also_ban, interactive=True)</code>","text":"<p>Mark all undecided outgoing edges from a variable as rejected.</p> <p>Parameters:</p> Name Type Description Default <code>src</code> <code>str</code> <p>The name or tag of the source variable.</p> required <code>also_ban</code> <code>bool</code> <p>Whether to also ban the edges, for ECCS.</p> required <code>interactive</code> <code>bool</code> <p>Whether to display the graph interactively after rejecting the edges.</p> <code>True</code> <p>Returns:</p> Type Description <code>Tuple[float, Optional[str], Optional[str]]</code> <p>A tuple containing: (1) the exploration score after the edge rejections, (2) the max-impact variable to explore next, if any, (3) optionally a string representation of the graph, if <code>interactive</code> is False.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def reject_undecided_outgoing(\n    self, src: str, also_ban: bool, interactive: bool = True\n) -&gt; Tuple[float, Optional[str], Optional[str]]:\n    \"\"\"\n    Mark all undecided outgoing edges from a variable as rejected.\n\n    Parameters:\n        src: The name or tag of the source variable.\n        also_ban: Whether to also ban the edges, for ECCS.\n        interactive: Whether to display the graph interactively after rejecting the edges.\n\n    Returns:\n        A tuple containing:\n            (1) the exploration score after the edge rejections,\n            (2) the max-impact variable to explore next, if any,\n            (3) optionally a string representation of the graph, if `interactive` is False.\n    \"\"\"\n    src_name = TagUtils.name_of(self._prepared_variables, src, \"prepared\")\n    for v in self.prepared_variable_names:\n        if self._edge_states.get_edge_state(src_name, v) == \"Undecided\":\n            self._edge_states.mark_edge(src_name, v, \"Rejected\")\n            if self._eccs and also_ban:\n                self._eccs.ban_edge(src_name, v)\n\n    if interactive:\n        GraphRenderer.display_graph(self._graph, self._prepared_variables)\n\n    return (\n        self.exploration_score,\n        self.suggest_next_exploration(),\n        (\n            GraphRenderer.draw_graph(self._graph, self._prepared_variables)\n            if not interactive\n            else \"\"\n        ),\n    )\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.reject_all_prunable_edges","title":"<code>reject_all_prunable_edges(also_ban, lasso_alpha=Pruner.LASSO_DEFAULT_ALPHA, lasso_max_iter=Pruner.LASSO_DEFAULT_MAX_ITER)</code>","text":"<p>For every prepared variable, reject all incoming edges that start at a variable that is pruned by our pruning approach. This may be time-consuming depending on the number of variables.</p> <p>Parameters:</p> Name Type Description Default <code>also_ban</code> <code>bool</code> <p>Whether to also ban the edges, for ECCS.</p> required <code>lasso_alpha</code> <code>float</code> <p>The alpha parameter to be used for Lasso regression.</p> <code>LASSO_DEFAULT_ALPHA</code> <code>lasso_max_iter</code> <code>int</code> <p>The maximum number of iterations to be used for Lasso regression.</p> <code>LASSO_DEFAULT_MAX_ITER</code> <p>Returns:</p> Type Description <code>Tuple[float, Optional[str], Optional[str]]</code> <p>A tuple containing: (1) the exploration score after the edge rejections, (2) the max-impact variable to explore next, if any, (3) optionally a string representation of the graph, if <code>interactive</code> is False.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def reject_all_prunable_edges(\n    self,\n    also_ban: bool,\n    lasso_alpha: float = Pruner.LASSO_DEFAULT_ALPHA,\n    lasso_max_iter: int = Pruner.LASSO_DEFAULT_MAX_ITER,\n) -&gt; Tuple[float, Optional[str], Optional[str]]:\n    \"\"\"\n    For every prepared variable, reject all incoming edges that start at a variable\n    that is pruned by our pruning approach. This may be time-consuming depending on the number of variables.\n\n    Parameters:\n        also_ban: Whether to also ban the edges, for ECCS.\n        lasso_alpha: The alpha parameter to be used for Lasso regression.\n        lasso_max_iter: The maximum number of iterations to be used for Lasso regression.\n\n    Returns:\n        A tuple containing:\n            (1) the exploration score after the edge rejections,\n            (2) the max-impact variable to explore next, if any,\n            (3) optionally a string representation of the graph, if `interactive` is False.\n    \"\"\"\n    num_processors = multiprocessing.cpu_count()\n    with multiprocessing.Pool(processes=num_processors) as pool:\n        all_candidates = pool.starmap(\n            Pruner.prune_with_lasso,\n            tqdm(\n                [\n                    (self._prepared_log, [target], lasso_alpha, lasso_max_iter)\n                    for target in self.prepared_variable_names\n                ],\n                total=self.num_prepared_variables,\n                desc=\"Finding pruned variables...\",\n            ),\n        )\n\n    Printer.printv(all_candidates)\n\n    for candidates, target in zip(all_candidates, self.prepared_variable_names):\n        non_candidates = (\n            set(self._prepared_log.columns) - set(candidates) - set([target])\n        )\n        for nc in non_candidates:\n            self._edge_states.mark_edge(nc, target, \"Rejected\")\n            if self._eccs and also_ban:\n                self._eccs.ban_edge(nc, target)\n\n    return (\n        self.exploration_score,\n        self.suggest_next_exploration(),\n        GraphRenderer.draw_graph(self._graph, self._prepared_variables),\n    )\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.rank_candidate_causes","title":"<code>rank_candidate_causes(target=None, ignore=None, method=CandidateCauseRankerMethod.LOGOS, prune_candidates=True, lasso_alpha=Pruner.LASSO_DEFAULT_ALPHA, lasso_max_iter=Pruner.LASSO_DEFAULT_MAX_ITER, model='gpt-4o-mini-2024-07-18', gpt_log_path=None)</code>","text":"<p>Present the user with ranked candidate causes for <code>target</code>. If no <code>target</code> is specified, the most recent suggestion of <code>suggest_next_exploration()</code> is used, if any. If <code>ignore</code> is specified, the variables in <code>ignore</code> are not considered as candidate causes.</p> <p>Parameters:</p> Name Type Description Default <code>target</code> <code>Optional[str]</code> <p>The name or tag of the target variable.</p> <code>None</code> <code>ignore</code> <code>Optional[List[str]]</code> <p>A list of variables to ignore.</p> <code>None</code> <code>method</code> <code>CandidateCauseRankerMethod</code> <p>The method to use for ranking candidate causes.</p> <code>LOGOS</code> <code>prune_candidates</code> <code>bool</code> <p>Whether to prune the candidate causes using Lasso regression. Only applies if <code>method</code> is <code>CandidateCauseRankerMethod.LOGOS</code>.</p> <code>True</code> <code>lasso_alpha</code> <code>float</code> <p>The alpha parameter to be used for Lasso regression. Only applies if <code>method</code> is <code>CandidateCauseRankerMethod.LOGOS</code> and <code>prune_candidates</code> is True.</p> <code>LASSO_DEFAULT_ALPHA</code> <code>lasso_max_iter</code> <code>int</code> <p>The maximum number of iterations to be used for Lasso regression. Only applies if <code>method</code> is <code>CandidateCauseRankerMethod.LOGOS</code> and <code>prune_candidates</code> is True.</p> <code>LASSO_DEFAULT_MAX_ITER</code> <code>model</code> <code>str</code> <p>The model to use for the langmodel method. Only applies if the method is <code>CandidateCauseRankerMethod.LANGMODEL</code>.</p> <code>'gpt-4o-mini-2024-07-18'</code> <code>gpt_log_path</code> <code>Optional[str]</code> <p>The path to the log file to use for the langmodel method. Only applies if the method is <code>CandidateCauseRankerMethod.LANGMODEL</code>.</p> <code>None</code> <p>Returns:     A tuple containing:     (1) A dataframe containing the candidate causes for <code>target</code> and     (2) The time elapsed for exploration, as a string.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def rank_candidate_causes(\n    self,\n    target: Optional[str] = None,\n    ignore: Optional[List[str]] = None,\n    method: CandidateCauseRankerMethod = CandidateCauseRankerMethod.LOGOS,\n    prune_candidates: bool = True,\n    lasso_alpha: float = Pruner.LASSO_DEFAULT_ALPHA,\n    lasso_max_iter: int = Pruner.LASSO_DEFAULT_MAX_ITER,\n    model: str = \"gpt-4o-mini-2024-07-18\",\n    gpt_log_path: Optional[str] = None,\n) -&gt; Tuple[pd.DataFrame, str]:\n    \"\"\"\n    Present the user with ranked candidate causes for `target`. If no `target`\n    is specified, the most recent suggestion of `suggest_next_exploration()` is used, if any.\n    If `ignore` is specified, the variables in `ignore` are not considered as candidate causes.\n\n    Parameters:\n        target: The name or tag of the target variable.\n        ignore: A list of variables to ignore.\n        method: The method to use for ranking candidate causes.\n        prune_candidates: Whether to prune the candidate causes using Lasso regression. Only\n            applies if `method` is `CandidateCauseRankerMethod.LOGOS`.\n        lasso_alpha: The alpha parameter to be used for Lasso regression. Only applies if\n            `method` is `CandidateCauseRankerMethod.LOGOS` and `prune_candidates` is True.\n        lasso_max_iter: The maximum number of iterations to be used for Lasso regression. Only\n            applies if `method` is `CandidateCauseRankerMethod.LOGOS` and `prune_candidates` is True.\n        model: The model to use for the langmodel method. Only applies if the method is\n            `CandidateCauseRankerMethod.LANGMODEL`.\n        gpt_log_path: The path to the log file to use for the langmodel method. Only applies if\n            the method is `CandidateCauseRankerMethod.LANGMODEL`.\n    Returns:\n        A tuple containing:\n        (1) A dataframe containing the candidate causes for `target` and\n        (2) The time elapsed for exploration, as a string.\n    \"\"\"\n\n    start_time = datetime.now()\n\n    # Handle the case where the user has not specified a target.\n    if target is None and self._next_exploration is None:\n        Printer.printv(\"No target specified.\")\n        return pd.DataFrame(columns=CandidateCauseRanker.COLUMN_ORDER), \"\"\n    elif target is None:\n        target = self._next_exploration\n\n    # If the user provided the target as a tag, retrieve its name\n    target = TagUtils.name_of(self._prepared_variables, target, \"prepared\")\n\n    # Use the specified method to rank candidate causes\n    result_df, pruned = CandidateCauseRanker.rank(\n        self.prepared_log,\n        self.prepared_variables,\n        target,\n        ignore,\n        method,\n        prune_candidates,\n        lasso_alpha,\n        lasso_max_iter,\n        model,\n        (\n            gpt_log_path\n            if (gpt_log_path is not None)\n            else os.path.join(\n                self._workdir,\n                f\"ranker-gpt-{datetime.now().strftime('%Y-%m-%d-%H-%M-%S')}.log\",\n            )\n        ),\n    )\n\n    # Mark the edges rejected by the pruning step, if any.\n    for var in pruned:\n        self._edge_states.mark_edge(var, target, \"Rejected\")\n\n    # Add fields to the returned dataframe\n    result_df[\"Candidate-&gt;Target Edge Status\"] = result_df[\"Candidate\"].apply(\n        lambda x: self._edge_states.get_edge_state(x, target)\n    )\n    result_df[\"Target-&gt;Candidate Edge Status\"] = result_df[\"Candidate\"].apply(\n        lambda x: self._edge_states.get_edge_state(target, x)\n    )\n\n    ret_val = result_df[CandidateCauseRanker.COLUMN_ORDER]\n\n    end_time = datetime.now()\n    elapsed = \"{:.6f}\".format((end_time - start_time).total_seconds())\n    Printer.printv(f\"Candidate cause exploration complete in {elapsed} seconds!\")\n\n    return ret_val, elapsed\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.get_causal_graph_refinement_suggestion","title":"<code>get_causal_graph_refinement_suggestion(method=InteractiveCausalGraphRefinerMethod.LOGOS, treatment=None, outcome=None, model='gpt-4o-mini-2024-07-18', gpt_log_path=None)</code>","text":"<p>Present the user with an edge, the presence and direction of which they should assess.</p> <p>Parameters:</p> Name Type Description Default <code>method</code> <code>InteractiveCausalGraphRefinerMethod</code> <p>The method to use for producing a causal graph refinement suggestion.</p> <code>LOGOS</code> <code>treatment</code> <code>Optional[str]</code> <p>The name or tag of the treatment variable. Only applies if the method is <code>InteractiveCausalGraphRefinerMethod.LOGOS</code>.</p> <code>None</code> <code>outcome</code> <code>Optional[str]</code> <p>The name or tag of the outcome variable. Only applies if the method is <code>InteractiveCausalGraphRefinerMethod.LOGOS</code>.</p> <code>None</code> <code>model</code> <code>str</code> <p>The model to use for the langmodel method. Only applies if the method is <code>CandidateCauseRankerMethod.LANGMODEL</code>.</p> <code>'gpt-4o-mini-2024-07-18'</code> <code>gpt_log_path</code> <code>Optional[str]</code> <p>The path to the log file to use for the langmodel method. Only applies if the method is <code>CandidateCauseRankerMethod.LANGMODEL</code>.</p> <code>None</code> <p>Returns:     A tuple containing:     (1) The edge to assess, as an Edge object, and     (2) The time elapsed for generating the suggestion, as a string.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def get_causal_graph_refinement_suggestion(\n    self,\n    method: InteractiveCausalGraphRefinerMethod = InteractiveCausalGraphRefinerMethod.LOGOS,\n    treatment: Optional[str] = None,\n    outcome: Optional[str] = None,\n    model: str = \"gpt-4o-mini-2024-07-18\",\n    gpt_log_path: Optional[str] = None,\n) -&gt; Tuple[Edge, str]:\n    \"\"\"\n    Present the user with an edge, the presence and direction of which they should assess.\n\n    Parameters:\n        method: The method to use for producing a causal graph refinement suggestion.\n        treatment: The name or tag of the treatment variable. Only applies if the method is\n            `InteractiveCausalGraphRefinerMethod.LOGOS`.\n        outcome: The name or tag of the outcome variable. Only applies if the method is\n            `InteractiveCausalGraphRefinerMethod.LOGOS`.\n        model: The model to use for the langmodel method. Only applies if the method is\n            `CandidateCauseRankerMethod.LANGMODEL`.\n        gpt_log_path: The path to the log file to use for the langmodel method. Only applies if\n            the method is `CandidateCauseRankerMethod.LANGMODEL`.\n    Returns:\n        A tuple containing:\n        (1) The edge to assess, as an Edge object, and\n        (2) The time elapsed for generating the suggestion, as a string.\n    \"\"\"\n\n    start_time = datetime.now()\n\n    treatment_name = TagUtils.name_of(\n        self._prepared_variables, treatment, \"prepared\"\n    )\n    outcome_name = TagUtils.name_of(self._prepared_variables, outcome, \"prepared\")\n\n    edge = InteractiveCausalGraphRefiner.get_suggestion(\n        self.prepared_log,\n        method,\n        self._eccs,\n        treatment_name,\n        outcome_name,\n        self._graph,\n        model,\n        (\n            gpt_log_path\n            if (gpt_log_path is not None)\n            else os.path.join(\n                self._workdir,\n                f\"refiner-gpt-{datetime.now().strftime('%Y-%m-%d-%H-%M-%S')}.log\",\n            )\n        ),\n        self.prepared_variables,\n    )\n\n    edge_tags = None\n    if edge:\n        edge_tags = tuple(\n            TagUtils.tag_of(self._prepared_variables, x, \"prepared\") for x in edge\n        )\n\n    end_time = datetime.now()\n    elapsed = \"{:.6f}\".format((end_time - start_time).total_seconds())\n    Printer.printv(f\"Candidate cause exploration complete in {elapsed} seconds!\")\n\n    return edge_tags, elapsed\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.suggest_next_exploration","title":"<code>suggest_next_exploration()</code>","text":"<p>Suggest the variable that should be explored next. Suggest the prepared variable in the partial causal graph that has the most (nonzero) Unexplored incoming edges, if any; otherwise suggest the prepared variable with the most (nonzero) Undecided incoming edges, even if it is not in the partial causal graph.</p> <p>If all edges are decided, return None.</p> <p>Returns:</p> Type Description <code>Optional[str]</code> <p>The name of the variable to explore next.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def suggest_next_exploration(self) -&gt; Optional[str]:\n    \"\"\"\n    Suggest the variable that should be explored next. Suggest the prepared variable in the partial causal graph\n    that has the most (nonzero) Unexplored incoming edges, if any; otherwise suggest the prepared variable\n    with the most (nonzero) Undecided incoming edges, even if it is not in the partial causal graph.\n\n    If all edges are decided, return None.\n\n    Returns:\n        The name of the variable to explore next.\n    \"\"\"\n\n    # Try to find a suggestion from the partial causal graph.\n    node_names = list(self._graph.nodes)\n    graph_var_indices = [self._edge_states.idx(x) for x in node_names]\n    graph_var_incoming_edge_states = self._edge_states.m[:, graph_var_indices]\n    undecided_edges_per_col = (\n        np.sum(graph_var_incoming_edge_states == 0, axis=0)\n        if len(graph_var_incoming_edge_states) &gt; 0\n        else []\n    )\n    max_undecided = (\n        np.max(undecided_edges_per_col) if len(undecided_edges_per_col) &gt; 0 else 0\n    )\n\n    if max_undecided &gt; 0:\n        max_undecided_idx = np.argmax(undecided_edges_per_col)\n        self._next_exploration = node_names[max_undecided_idx]\n        return self._next_exploration\n\n    # If no suggestion was found, try to find a suggestion from the entire collection of prepared variables.\n    undecided_edges_per_col = np.sum(self._edge_states.m == 0, axis=0)\n    max_undecided = np.max(undecided_edges_per_col)\n\n    if max_undecided &gt; 0:\n        max_undecided_idx = np.argmax(undecided_edges_per_col)\n        self._next_exploration = self._prepared_variables.loc[\n            max_undecided_idx, \"Name\"\n        ]\n        return self._next_exploration\n\n    # If no suggestion was found, return None.\n    self._next_exploration = None\n    return None\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.discover_graph","title":"<code>discover_graph(method='hill_climb', max_cond_vars=3, model='gpt-3.5-turbo')</code>","text":"<p>Discover a causal graph based on the prepared table automatically.</p> <p>Parameters:</p> Name Type Description Default <code>method</code> <code>str</code> <p>The method to be used for graph discovery, among \"PC\", \"hill_climb\", \"exhaustive\" and \"GPT\".</p> <code>'hill_climb'</code> <code>max_cond_vars</code> <code>int</code> <p>The maximum number of conditioning variables to be used for PC.</p> <code>3</code> <code>model</code> <code>str</code> <p>The model to be used for GPT-based graph discovery.</p> <code>'gpt-3.5-turbo'</code> Source code in <code>src/logos/logos.py</code> <pre><code>def discover_graph(\n    self,\n    method: str = \"hill_climb\",\n    max_cond_vars: int = 3,\n    model: str = \"gpt-3.5-turbo\",\n) -&gt; None:\n    \"\"\"\n    Discover a causal graph based on the prepared table automatically.\n\n    Parameters:\n        method: The method to be used for graph discovery, among \"PC\", \"hill_climb\", \"exhaustive\" and \"GPT\".\n        max_cond_vars: The maximum number of conditioning variables to be used for PC.\n        model: The model to be used for GPT-based graph discovery.\n\n    \"\"\"\n\n    if method == \"PC\":\n        self._graph = CausalDiscoverer.pc(\n            self._prepared_log, max_cond_vars=max_cond_vars\n        )\n    elif method == \"hill_climb\":\n        self._graph = CausalDiscoverer.hill_climb(self._prepared_log)\n    elif method == \"exhaustive\":\n        self._graph = CausalDiscoverer.exhaustive(self._prepared_log)\n    elif method == \"GPT\":\n        self._graph = CausalDiscoverer.gpt(self._prepared_log, model=model)\n    else:\n        raise ValueError(f\"Invalid graph discovery method {method}\")\n\n    self._edge_states.clear_and_set_from_graph(self._graph)\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.get_adjusted_ate","title":"<code>get_adjusted_ate(treatment, outcome, confounder=None)</code>","text":"<p>Calculate the adjusted ATE of <code>treatment</code> on <code>outcome</code>, given the current partial causal graph.</p> <p>Parameters:</p> Name Type Description Default <code>treatment</code> <code>str</code> <p>The name or tag of the treatment variable.</p> required <code>outcome</code> <code>str</code> <p>The name or tag of the outcome variable.</p> required <code>confounder</code> <code>Optional[str]</code> <p>The name or tag of a confounder variable. If specified, overrides the current partial causal graph in favor of a three-node graph with <code>treatment</code>, <code>outcome</code> and <code>confounder</code>.</p> <code>None</code> <p>Returns:</p> Type Description <code>float</code> <p>The adjusted ATE of <code>treatment</code> on <code>outcome</code>.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def get_adjusted_ate(\n    self,\n    treatment: str,\n    outcome: str,\n    confounder: Optional[str] = None,\n) -&gt; float:\n    \"\"\"\n    Calculate the adjusted ATE of `treatment` on `outcome`, given the current partial causal graph.\n\n    Parameters:\n        treatment: The name or tag of the treatment variable.\n        outcome: The name or tag of the outcome variable.\n        confounder: The name or tag of a confounder variable. If specified, overrides the current partial\n            causal graph in favor of a three-node graph with `treatment`, `outcome` and `confounder`.\n\n    Returns:\n        The adjusted ATE of `treatment` on `outcome`.\n    \"\"\"\n    return ATECalculator.get_ate_and_confidence(\n        self.prepared_log,\n        self.prepared_variables,\n        treatment,\n        outcome,\n        confounder,\n        graph=self._graph,\n        calculate_p_value=False,\n        calculate_std_error=False,\n    )[\"ATE\"]\n</code></pre>"},{"location":"reference/logos/logos/#logos.logos.LOGos.get_unadjusted_ate","title":"<code>get_unadjusted_ate(treatment, outcome)</code>","text":"<p>Calculate the unadjusted ATE of <code>treatment</code> on <code>outcome</code>, ignoring the current partial causal graph in favor of a two-node graph with just <code>treatment</code> and <code>outcome</code>.</p> <p>Parameters:</p> Name Type Description Default <code>treatment</code> <code>str</code> <p>The name or tag of the treatment variable.</p> required <code>outcome</code> <code>str</code> <p>The name or tag of the outcome variable.</p> required <p>Returns:</p> Type Description <code>float</code> <p>The unadjusted ATE of <code>treatment</code> on <code>outcome</code>.</p> Source code in <code>src/logos/logos.py</code> <pre><code>def get_unadjusted_ate(\n    self,\n    treatment: str,\n    outcome: str,\n) -&gt; float:\n    \"\"\"\n    Calculate the unadjusted ATE of `treatment` on `outcome`, ignoring the current partial causal graph\n    in favor of a two-node graph with just `treatment` and `outcome`.\n\n    Parameters:\n        treatment: The name or tag of the treatment variable.\n        outcome: The name or tag of the outcome variable.\n\n    Returns:\n        The unadjusted ATE of `treatment` on `outcome`.\n    \"\"\"\n    return ATECalculator.get_ate_and_confidence(\n        self.prepared_log,\n        self.prepared_variables,\n        treatment,\n        outcome,\n        calculate_p_value=False,\n        calculate_std_error=False,\n    )[\"ATE\"]\n</code></pre>"},{"location":"reference/logos/pickler/","title":"Pickler","text":""},{"location":"reference/logos/pickler/#logos.pickler.Pickler","title":"<code>Pickler</code>","text":"<p>A class for loading and dumping dataframes to and from pkl files.</p> Source code in <code>src/logos/pickler.py</code> <pre><code>class Pickler:\n    \"\"\"\n    A class for loading and dumping dataframes to and from pkl files.\n    \"\"\"\n\n    @staticmethod\n    def load(filename: str) -&gt; pd.DataFrame:\n        \"\"\"\n        Loads a dataframe from a pkl file.\n\n        Parameters:\n            filename: The name of the pkl file.\n\n        Returns:\n            The dataframe loaded from the pkl file.\n        \"\"\"\n        df = pd.DataFrame()\n        with open(filename, \"rb\") as f:\n            df = pickle.load(f)\n        return df\n\n    @staticmethod\n    def dump(df: pd.DataFrame, filename: str) -&gt; None:\n        \"\"\"\n        Dumps a dataframe to a pkl file.\n\n        Parameters:\n            df: The dataframe to be dumped.\n            filename: The name of the pkl file.\n        \"\"\"\n\n        if \"/\" in filename:\n            path = filename[: filename.rindex(\"/\")]\n            os.makedirs(path, exist_ok=True)\n\n        with open(filename, \"wb+\") as f:\n            pickle.dump(df, f, protocol=pickle.HIGHEST_PROTOCOL)\n</code></pre>"},{"location":"reference/logos/pickler/#logos.pickler.Pickler.load","title":"<code>load(filename)</code>  <code>staticmethod</code>","text":"<p>Loads a dataframe from a pkl file.</p> <p>Parameters:</p> Name Type Description Default <code>filename</code> <code>str</code> <p>The name of the pkl file.</p> required <p>Returns:</p> Type Description <code>DataFrame</code> <p>The dataframe loaded from the pkl file.</p> Source code in <code>src/logos/pickler.py</code> <pre><code>@staticmethod\ndef load(filename: str) -&gt; pd.DataFrame:\n    \"\"\"\n    Loads a dataframe from a pkl file.\n\n    Parameters:\n        filename: The name of the pkl file.\n\n    Returns:\n        The dataframe loaded from the pkl file.\n    \"\"\"\n    df = pd.DataFrame()\n    with open(filename, \"rb\") as f:\n        df = pickle.load(f)\n    return df\n</code></pre>"},{"location":"reference/logos/pickler/#logos.pickler.Pickler.dump","title":"<code>dump(df, filename)</code>  <code>staticmethod</code>","text":"<p>Dumps a dataframe to a pkl file.</p> <p>Parameters:</p> Name Type Description Default <code>df</code> <code>DataFrame</code> <p>The dataframe to be dumped.</p> required <code>filename</code> <code>str</code> <p>The name of the pkl file.</p> required Source code in <code>src/logos/pickler.py</code> <pre><code>@staticmethod\ndef dump(df: pd.DataFrame, filename: str) -&gt; None:\n    \"\"\"\n    Dumps a dataframe to a pkl file.\n\n    Parameters:\n        df: The dataframe to be dumped.\n        filename: The name of the pkl file.\n    \"\"\"\n\n    if \"/\" in filename:\n        path = filename[: filename.rindex(\"/\")]\n        os.makedirs(path, exist_ok=True)\n\n    with open(filename, \"wb+\") as f:\n        pickle.dump(df, f, protocol=pickle.HIGHEST_PROTOCOL)\n</code></pre>"},{"location":"reference/logos/printer/","title":"Printer","text":""},{"location":"reference/logos/printer/#logos.printer.Printer","title":"<code>Printer</code>","text":"<p>A class for controlling message printing.</p> Source code in <code>src/logos/printer.py</code> <pre><code>class Printer:\n    \"\"\"\n    A class for controlling message printing.\n    \"\"\"\n\n    \"\"\"\n    A flag indicating whether or not to print messages to the console.\n    \"\"\"\n    LOGOS_VERBOSE = False\n\n    @classmethod\n    def printv(self, msg: Any) -&gt; None:\n        \"\"\"\n        Prints a message to the console if in verbose mode.\n\n        Parameters:\n            msg: The message to be printed.\n        \"\"\"\n        if Printer.LOGOS_VERBOSE:\n            print(msg)\n\n    @classmethod\n    def set_verbose(self, val: bool) -&gt; None:\n        \"\"\"\n        Sets the verbosity of the printer.\n\n        Parameters:\n            val: The new verbosity value.\n        \"\"\"\n        Printer.LOGOS_VERBOSE = val\n\n    @staticmethod\n    def set_warnings_to(self, value: str):\n        \"\"\"\n        Set selected warnings to `value`.\n\n        Parameters:\n            value: The value to set the warnings to.\n        \"\"\"\n        warnings.filterwarnings(\n            value, category=RuntimeWarning, message=\"mean of empty slice\"\n        )\n        warnings.filterwarnings(\n            value,\n            category=RuntimeWarning,\n            message=\"invalid value encountered in scalar divide\",\n        )\n</code></pre>"},{"location":"reference/logos/printer/#logos.printer.Printer.printv","title":"<code>printv(msg)</code>  <code>classmethod</code>","text":"<p>Prints a message to the console if in verbose mode.</p> <p>Parameters:</p> Name Type Description Default <code>msg</code> <code>Any</code> <p>The message to be printed.</p> required Source code in <code>src/logos/printer.py</code> <pre><code>@classmethod\ndef printv(self, msg: Any) -&gt; None:\n    \"\"\"\n    Prints a message to the console if in verbose mode.\n\n    Parameters:\n        msg: The message to be printed.\n    \"\"\"\n    if Printer.LOGOS_VERBOSE:\n        print(msg)\n</code></pre>"},{"location":"reference/logos/printer/#logos.printer.Printer.set_verbose","title":"<code>set_verbose(val)</code>  <code>classmethod</code>","text":"<p>Sets the verbosity of the printer.</p> <p>Parameters:</p> Name Type Description Default <code>val</code> <code>bool</code> <p>The new verbosity value.</p> required Source code in <code>src/logos/printer.py</code> <pre><code>@classmethod\ndef set_verbose(self, val: bool) -&gt; None:\n    \"\"\"\n    Sets the verbosity of the printer.\n\n    Parameters:\n        val: The new verbosity value.\n    \"\"\"\n    Printer.LOGOS_VERBOSE = val\n</code></pre>"},{"location":"reference/logos/printer/#logos.printer.Printer.set_warnings_to","title":"<code>set_warnings_to(value)</code>  <code>staticmethod</code>","text":"<p>Set selected warnings to <code>value</code>.</p> <p>Parameters:</p> Name Type Description Default <code>value</code> <code>str</code> <p>The value to set the warnings to.</p> required Source code in <code>src/logos/printer.py</code> <pre><code>@staticmethod\ndef set_warnings_to(self, value: str):\n    \"\"\"\n    Set selected warnings to `value`.\n\n    Parameters:\n        value: The value to set the warnings to.\n    \"\"\"\n    warnings.filterwarnings(\n        value, category=RuntimeWarning, message=\"mean of empty slice\"\n    )\n    warnings.filterwarnings(\n        value,\n        category=RuntimeWarning,\n        message=\"invalid value encountered in scalar divide\",\n    )\n</code></pre>"},{"location":"reference/logos/pruner/","title":"Pruner","text":""},{"location":"reference/logos/pruner/#logos.pruner.Pruner","title":"<code>Pruner</code>","text":"Source code in <code>src/logos/pruner.py</code> <pre><code>class Pruner:\n    LASSO_DEFAULT_ALPHA = 0.1\n    LASSO_DEFAULT_MAX_ITER = 100000\n\n    \"\"\"\n    A collection of pruning functions for prepared variables,\n    used for pruning and candidate suggestion.\n    \"\"\"\n\n    @staticmethod\n    def prune_with_lasso(\n        data: pd.DataFrame,\n        outcome_cols: list[str],\n        alpha: float = LASSO_DEFAULT_ALPHA,\n        max_iter: int = LASSO_DEFAULT_MAX_ITER,\n        top_n: int = 0,\n        ignore: Optional[list[str]] = None,\n    ) -&gt; list[str]:\n        \"\"\"\n        Prune variables using Lasso regression.\n\n        Parameters:\n            data: The dataframe containing the data.\n            outcome_cols: The names of the target variables.\n            alpha: The Lasso regularization parameter.\n            max_iter: The maximum number of iterations for Lasso.\n            top_n: The number of variables to return. If 0, return all variables.\n            ignore: The names of the variables to ignore.\n\n        Returns:\n            The names of the variables that Lasso identified as impactful, optionally\n            limited to the top `n` variables by absolute coefficient.\n        \"\"\"\n\n        # TODO: do this properly wherever this is called\n        outcome_col = outcome_cols[0]\n\n        # Separate the target variable and predictor variables.\n        # Optionally, do not consider variables already in the graph.\n        y = data[outcome_cols]\n        drop_cols = [] if ignore is None else ignore\n        to_ignore = outcome_cols\n        drop_cols.extend(to_ignore)\n\n        # Do not consider variables with the same base variable as an ignored variable.\n        for v in to_ignore:\n            vp = PreparedVariableName(v)\n            if vp.base_var() != \"TemplateId\":\n                drop_cols.extend([c for c in data.columns if vp.base_var() in c])\n        drop_cols = list(set(drop_cols))\n\n        # Iterate until multiple prepared variables with the same base variable are eliminated.\n        done = False\n\n        while not done:\n            Printer.printv(f\"Variables that Lasso will ignore: {drop_cols}\")\n            X = data.drop(drop_cols, axis=1)\n            X_cols = X.columns\n            if X.empty:\n                return []\n\n            scaler = StandardScaler()\n            X = scaler.fit_transform(X)\n\n            # Fit a Lasso model to the data\n            lasso = Lasso(alpha=alpha, max_iter=max_iter)\n            lasso.fit(X, y)\n            Printer.printv(f\"Lasso coefficients : {lasso.coef_}\")\n            Printer.printv(f\"Scale: {scaler.scale_}\")\n            final_coefs = lasso.coef_ / scaler.scale_\n            abs_coefs = np.abs(final_coefs)\n            Printer.printv(f\"Lasso coefficients unscaled: {final_coefs}\")\n\n            # Mask for nonzero elements\n            nonzero_mask = final_coefs != 0\n\n            # Mask for top n largest elements by absolute value\n            # Create an array of False values with the same shape as the coefficients\n            top_n_mask = [False] * len(final_coefs)\n            for i in np.argsort(abs_coefs)[-top_n:]:\n                top_n_mask[i] = True\n\n            # Retrieve columns based on conditions above\n            selected_names = list(X_cols[nonzero_mask &amp; top_n_mask])\n\n            # Only keep one aggregate per variable\n            d = set()\n            done = True\n            for var in selected_names:\n                base_var = PreparedVariableName(var).base_var()\n                if base_var in d:\n                    drop_cols.append(var)\n                    done = False\n                else:\n                    d.add(base_var)\n\n        Printer.printv(\"Lasso identified the following impactful variables:\")\n        Printer.printv(selected_names)\n\n        return selected_names\n\n    @staticmethod\n    def prune_with_triangle(\n        data: pd.DataFrame,\n        vars: pd.DataFrame,\n        treatment_col: str,\n        outcome_col: str,\n        work_dir: str,\n        top_n: int = 0,\n        force: bool = False,\n    ) -&gt; list[str]:\n        \"\"\"\n        Prune variables using triangle method.\n\n        Parameters:\n            data: The dataframe containing the data.\n            vars: The dataframe containing the variables.\n            treatment_col: The name of the treatment variable.\n            outcome_col: The name of the outcome variable.\n            work_dir: The directory to store intermediate files in.\n            top_n: The number of variables to return. If 0, return all variables.\n            force: Whether to force recalculation of the triangle method.\n\n        Returns:\n            The names of the variables that triangle method identified as impactful, optionally\n            limited to the top `n` variables.\n        \"\"\"\n\n        # Check whether we can use pre-calculated results\n        filename = os.path.join(\n            work_dir, f\"pickles/triangle_dags/{treatment_col}_{outcome_col}.pkl\"\n        )\n        if os.path.isfile(filename) and not force:\n            df = pickle.load(open(filename, \"rb\"))\n            Printer.printv(\"Found pickled file\")\n            return list(df.index[:top_n].values)\n\n        Printer.printv(\"Starting to prune using triangle method\")\n        max_diffs = {}\n        base_ate = ATECalculator.get_ate_and_confidence(\n            data, vars, treatment_col, outcome_col, calculate_std_error=False\n        )[\"ATE\"]\n\n        for var in tqdm(data.columns, \"Processing triangle dags\"):\n            if var == treatment_col or var == outcome_col:\n                continue\n\n            # Construct the graphs to consider\n            graphs = []\n            # Second cause\n            graphs.append(\n                nx.DiGraph([(treatment_col, outcome_col), (var, outcome_col)])\n            )\n            # Confounder\n            graphs.append(\n                nx.DiGraph(\n                    [\n                        (treatment_col, outcome_col),\n                        (var, treatment_col),\n                        (var, outcome_col),\n                    ]\n                )\n            )\n            # Mediator with direct path\n            graphs.append(\n                nx.DiGraph(\n                    [\n                        (treatment_col, outcome_col),\n                        (treatment_col, var),\n                        (var, outcome_col),\n                    ]\n                )\n            )\n            # Mediator without direct path\n            graphs.append(nx.DiGraph([(treatment_col, var), (var, outcome_col)]))\n\n            # Calculate the corrsponding ATEs\n            ates = [base_ate]\n            for G in graphs:\n                try:\n                    ates.append(\n                        ATECalculator.get_ate_and_confidence(\n                            data,\n                            vars,\n                            treatment_col,\n                            outcome_col,\n                            graph=G,\n                            calculate_std_error=False,\n                        )[\"ATE\"]\n                    )\n                except:\n                    pass\n            max_diffs[var] = max(ates) - min(ates)\n        max_diffs = max_diffs\n        df = pd.DataFrame.from_dict(max_diffs, orient=\"index\", columns=[\"max_diff\"])\n        df = df.sort_values(by=\"max_diff\", ascending=False)\n\n        Pickler.dump(df, filename)\n\n        return list(df.index[:top_n].values)\n</code></pre>"},{"location":"reference/logos/pruner/#logos.pruner.Pruner.LASSO_DEFAULT_MAX_ITER","title":"<code>LASSO_DEFAULT_MAX_ITER = 100000</code>  <code>class-attribute</code> <code>instance-attribute</code>","text":"<p>A collection of pruning functions for prepared variables, used for pruning and candidate suggestion.</p>"},{"location":"reference/logos/pruner/#logos.pruner.Pruner.prune_with_lasso","title":"<code>prune_with_lasso(data, outcome_cols, alpha=LASSO_DEFAULT_ALPHA, max_iter=LASSO_DEFAULT_MAX_ITER, top_n=0, ignore=None)</code>  <code>staticmethod</code>","text":"<p>Prune variables using Lasso regression.</p> <p>Parameters:</p> Name Type Description Default <code>data</code> <code>DataFrame</code> <p>The dataframe containing the data.</p> required <code>outcome_cols</code> <code>list[str]</code> <p>The names of the target variables.</p> required <code>alpha</code> <code>float</code> <p>The Lasso regularization parameter.</p> <code>LASSO_DEFAULT_ALPHA</code> <code>max_iter</code> <code>int</code> <p>The maximum number of iterations for Lasso.</p> <code>LASSO_DEFAULT_MAX_ITER</code> <code>top_n</code> <code>int</code> <p>The number of variables to return. If 0, return all variables.</p> <code>0</code> <code>ignore</code> <code>Optional[list[str]]</code> <p>The names of the variables to ignore.</p> <code>None</code> <p>Returns:</p> Type Description <code>list[str]</code> <p>The names of the variables that Lasso identified as impactful, optionally</p> <code>list[str]</code> <p>limited to the top <code>n</code> variables by absolute coefficient.</p> Source code in <code>src/logos/pruner.py</code> <pre><code>@staticmethod\ndef prune_with_lasso(\n    data: pd.DataFrame,\n    outcome_cols: list[str],\n    alpha: float = LASSO_DEFAULT_ALPHA,\n    max_iter: int = LASSO_DEFAULT_MAX_ITER,\n    top_n: int = 0,\n    ignore: Optional[list[str]] = None,\n) -&gt; list[str]:\n    \"\"\"\n    Prune variables using Lasso regression.\n\n    Parameters:\n        data: The dataframe containing the data.\n        outcome_cols: The names of the target variables.\n        alpha: The Lasso regularization parameter.\n        max_iter: The maximum number of iterations for Lasso.\n        top_n: The number of variables to return. If 0, return all variables.\n        ignore: The names of the variables to ignore.\n\n    Returns:\n        The names of the variables that Lasso identified as impactful, optionally\n        limited to the top `n` variables by absolute coefficient.\n    \"\"\"\n\n    # TODO: do this properly wherever this is called\n    outcome_col = outcome_cols[0]\n\n    # Separate the target variable and predictor variables.\n    # Optionally, do not consider variables already in the graph.\n    y = data[outcome_cols]\n    drop_cols = [] if ignore is None else ignore\n    to_ignore = outcome_cols\n    drop_cols.extend(to_ignore)\n\n    # Do not consider variables with the same base variable as an ignored variable.\n    for v in to_ignore:\n        vp = PreparedVariableName(v)\n        if vp.base_var() != \"TemplateId\":\n            drop_cols.extend([c for c in data.columns if vp.base_var() in c])\n    drop_cols = list(set(drop_cols))\n\n    # Iterate until multiple prepared variables with the same base variable are eliminated.\n    done = False\n\n    while not done:\n        Printer.printv(f\"Variables that Lasso will ignore: {drop_cols}\")\n        X = data.drop(drop_cols, axis=1)\n        X_cols = X.columns\n        if X.empty:\n            return []\n\n        scaler = StandardScaler()\n        X = scaler.fit_transform(X)\n\n        # Fit a Lasso model to the data\n        lasso = Lasso(alpha=alpha, max_iter=max_iter)\n        lasso.fit(X, y)\n        Printer.printv(f\"Lasso coefficients : {lasso.coef_}\")\n        Printer.printv(f\"Scale: {scaler.scale_}\")\n        final_coefs = lasso.coef_ / scaler.scale_\n        abs_coefs = np.abs(final_coefs)\n        Printer.printv(f\"Lasso coefficients unscaled: {final_coefs}\")\n\n        # Mask for nonzero elements\n        nonzero_mask = final_coefs != 0\n\n        # Mask for top n largest elements by absolute value\n        # Create an array of False values with the same shape as the coefficients\n        top_n_mask = [False] * len(final_coefs)\n        for i in np.argsort(abs_coefs)[-top_n:]:\n            top_n_mask[i] = True\n\n        # Retrieve columns based on conditions above\n        selected_names = list(X_cols[nonzero_mask &amp; top_n_mask])\n\n        # Only keep one aggregate per variable\n        d = set()\n        done = True\n        for var in selected_names:\n            base_var = PreparedVariableName(var).base_var()\n            if base_var in d:\n                drop_cols.append(var)\n                done = False\n            else:\n                d.add(base_var)\n\n    Printer.printv(\"Lasso identified the following impactful variables:\")\n    Printer.printv(selected_names)\n\n    return selected_names\n</code></pre>"},{"location":"reference/logos/pruner/#logos.pruner.Pruner.prune_with_triangle","title":"<code>prune_with_triangle(data, vars, treatment_col, outcome_col, work_dir, top_n=0, force=False)</code>  <code>staticmethod</code>","text":"<p>Prune variables using triangle method.</p> <p>Parameters:</p> Name Type Description Default <code>data</code> <code>DataFrame</code> <p>The dataframe containing the data.</p> required <code>vars</code> <code>DataFrame</code> <p>The dataframe containing the variables.</p> required <code>treatment_col</code> <code>str</code> <p>The name of the treatment variable.</p> required <code>outcome_col</code> <code>str</code> <p>The name of the outcome variable.</p> required <code>work_dir</code> <code>str</code> <p>The directory to store intermediate files in.</p> required <code>top_n</code> <code>int</code> <p>The number of variables to return. If 0, return all variables.</p> <code>0</code> <code>force</code> <code>bool</code> <p>Whether to force recalculation of the triangle method.</p> <code>False</code> <p>Returns:</p> Type Description <code>list[str]</code> <p>The names of the variables that triangle method identified as impactful, optionally</p> <code>list[str]</code> <p>limited to the top <code>n</code> variables.</p> Source code in <code>src/logos/pruner.py</code> <pre><code>@staticmethod\ndef prune_with_triangle(\n    data: pd.DataFrame,\n    vars: pd.DataFrame,\n    treatment_col: str,\n    outcome_col: str,\n    work_dir: str,\n    top_n: int = 0,\n    force: bool = False,\n) -&gt; list[str]:\n    \"\"\"\n    Prune variables using triangle method.\n\n    Parameters:\n        data: The dataframe containing the data.\n        vars: The dataframe containing the variables.\n        treatment_col: The name of the treatment variable.\n        outcome_col: The name of the outcome variable.\n        work_dir: The directory to store intermediate files in.\n        top_n: The number of variables to return. If 0, return all variables.\n        force: Whether to force recalculation of the triangle method.\n\n    Returns:\n        The names of the variables that triangle method identified as impactful, optionally\n        limited to the top `n` variables.\n    \"\"\"\n\n    # Check whether we can use pre-calculated results\n    filename = os.path.join(\n        work_dir, f\"pickles/triangle_dags/{treatment_col}_{outcome_col}.pkl\"\n    )\n    if os.path.isfile(filename) and not force:\n        df = pickle.load(open(filename, \"rb\"))\n        Printer.printv(\"Found pickled file\")\n        return list(df.index[:top_n].values)\n\n    Printer.printv(\"Starting to prune using triangle method\")\n    max_diffs = {}\n    base_ate = ATECalculator.get_ate_and_confidence(\n        data, vars, treatment_col, outcome_col, calculate_std_error=False\n    )[\"ATE\"]\n\n    for var in tqdm(data.columns, \"Processing triangle dags\"):\n        if var == treatment_col or var == outcome_col:\n            continue\n\n        # Construct the graphs to consider\n        graphs = []\n        # Second cause\n        graphs.append(\n            nx.DiGraph([(treatment_col, outcome_col), (var, outcome_col)])\n        )\n        # Confounder\n        graphs.append(\n            nx.DiGraph(\n                [\n                    (treatment_col, outcome_col),\n                    (var, treatment_col),\n                    (var, outcome_col),\n                ]\n            )\n        )\n        # Mediator with direct path\n        graphs.append(\n            nx.DiGraph(\n                [\n                    (treatment_col, outcome_col),\n                    (treatment_col, var),\n                    (var, outcome_col),\n                ]\n            )\n        )\n        # Mediator without direct path\n        graphs.append(nx.DiGraph([(treatment_col, var), (var, outcome_col)]))\n\n        # Calculate the corrsponding ATEs\n        ates = [base_ate]\n        for G in graphs:\n            try:\n                ates.append(\n                    ATECalculator.get_ate_and_confidence(\n                        data,\n                        vars,\n                        treatment_col,\n                        outcome_col,\n                        graph=G,\n                        calculate_std_error=False,\n                    )[\"ATE\"]\n                )\n            except:\n                pass\n        max_diffs[var] = max(ates) - min(ates)\n    max_diffs = max_diffs\n    df = pd.DataFrame.from_dict(max_diffs, orient=\"index\", columns=[\"max_diff\"])\n    df = df.sort_values(by=\"max_diff\", ascending=False)\n\n    Pickler.dump(df, filename)\n\n    return list(df.index[:top_n].values)\n</code></pre>"},{"location":"reference/logos/regression/","title":"Regression","text":""},{"location":"reference/logos/regression/#logos.regression.Regression","title":"<code>Regression</code>","text":"<p>A collection of regression-related functions.</p> Source code in <code>src/logos/regression.py</code> <pre><code>class Regression:\n    \"\"\"\n    A collection of regression-related functions.\n    \"\"\"\n\n    @staticmethod\n    def ols(X_name: str, X_data: pd.Series, Y_data: pd.Series) -&gt; dict:\n        \"\"\"\n        Calculate the slope and p-value of a linear regression of `X` on `Y`.\n\n        Parameters:\n            X_name: The name of the predictor variable.\n            X_data: The data for the predictor variable.\n            Y_data: The data for the target variable.\n\n        Returns:\n            A dictionary containing the slope and p-value of the regression. If\n            there is no slope parameter because X_data does not vary enough,\n            the slope and p-value will be None.\n        \"\"\"\n        X_data = sm.add_constant(X_data)\n        model = sm.OLS(Y_data, X_data).fit()\n        slope = None\n        p_value = None\n        if len(model.params) &gt; 1:\n            slope = model.params.iloc[1]\n            p_value = model.pvalues.iloc[1]\n        return {\n            \"Candidate\": X_name,\n            \"Slope\": slope,\n            \"P-value\": p_value,\n        }\n\n    @staticmethod\n    def get_normalized_copy(data: pd.DataFrame) -&gt; tuple[pd.DataFrame, pd.Series]:\n        \"\"\"\n        Return a normalized copy of the input data, with zero mean\n        and unit variance.\n\n        Parameters:\n            data: The data to normalize.\n\n        Returns:\n            A normalized copy of the input data.\n            The original standard deviations of the columns of the input data.\n        \"\"\"\n        data = data.copy(deep=True)\n        stdevs = data.std()\n\n        # Cast all columns to float64 to avoid numpy warnings\n        data = data.astype(\"float64\")\n\n        for column in data.columns:\n            if stdevs[column] == 0:\n                data.loc[:, column] = 0\n            else:\n                data.loc[:, column] = (data[column] - data[column].mean()) / stdevs[\n                    column\n                ]\n        return data, stdevs\n\n    @staticmethod\n    def multi_ols(\n        X_names: list[str], X_data: pd.DataFrame, Y_data: pd.Series\n    ) -&gt; pd.DataFrame:\n        \"\"\"\n        Calculate the slopes and p-values of a multivariate linear regression\n        of the variables in `X` on `Y`. Normalize each column to zero mean and\n        unit variance before running the regression. Return both the normalized\n        and unnormalized slopes.\n\n        Parameters:\n            X_names: The names of the predictor variables.\n            X_data: The data for the predictor variables.\n            Y_data: The data for the target variable.\n\n        Returns:\n            A dataframe with the names, slopes, and p-values of the regressions.\n        \"\"\"\n        X_data, stdevs = Regression.get_normalized_copy(X_data)\n\n        X_data = sm.add_constant(X_data)\n        model = sm.OLS(Y_data, X_data).fit()\n\n        # Get the coefficients and p-values, ignoring the constant\n        coefficients = model.params.iloc[1:]\n        p_values = model.pvalues.iloc[1:]\n\n        # Unnormalize the slopes\n        coefficients_unnormalized = coefficients.copy()\n        for coeff in coefficients_unnormalized.index:\n            coefficients_unnormalized[coeff] = (\n                coefficients[coeff] / stdevs[coeff] if stdevs[coeff] != 0 else 0\n            )\n\n        return pd.DataFrame(\n            {\n                \"Candidate\": coefficients.index,\n                \"Slope\": coefficients_unnormalized.values,\n                \"P-value\": p_values.values,\n                \"Normalized Slope\": coefficients.values,\n                \"Absolute Normalized Slope\": coefficients.abs().values,\n            }\n        )\n</code></pre>"},{"location":"reference/logos/regression/#logos.regression.Regression.ols","title":"<code>ols(X_name, X_data, Y_data)</code>  <code>staticmethod</code>","text":"<p>Calculate the slope and p-value of a linear regression of <code>X</code> on <code>Y</code>.</p> <p>Parameters:</p> Name Type Description Default <code>X_name</code> <code>str</code> <p>The name of the predictor variable.</p> required <code>X_data</code> <code>Series</code> <p>The data for the predictor variable.</p> required <code>Y_data</code> <code>Series</code> <p>The data for the target variable.</p> required <p>Returns:</p> Type Description <code>dict</code> <p>A dictionary containing the slope and p-value of the regression. If</p> <code>dict</code> <p>there is no slope parameter because X_data does not vary enough,</p> <code>dict</code> <p>the slope and p-value will be None.</p> Source code in <code>src/logos/regression.py</code> <pre><code>@staticmethod\ndef ols(X_name: str, X_data: pd.Series, Y_data: pd.Series) -&gt; dict:\n    \"\"\"\n    Calculate the slope and p-value of a linear regression of `X` on `Y`.\n\n    Parameters:\n        X_name: The name of the predictor variable.\n        X_data: The data for the predictor variable.\n        Y_data: The data for the target variable.\n\n    Returns:\n        A dictionary containing the slope and p-value of the regression. If\n        there is no slope parameter because X_data does not vary enough,\n        the slope and p-value will be None.\n    \"\"\"\n    X_data = sm.add_constant(X_data)\n    model = sm.OLS(Y_data, X_data).fit()\n    slope = None\n    p_value = None\n    if len(model.params) &gt; 1:\n        slope = model.params.iloc[1]\n        p_value = model.pvalues.iloc[1]\n    return {\n        \"Candidate\": X_name,\n        \"Slope\": slope,\n        \"P-value\": p_value,\n    }\n</code></pre>"},{"location":"reference/logos/regression/#logos.regression.Regression.get_normalized_copy","title":"<code>get_normalized_copy(data)</code>  <code>staticmethod</code>","text":"<p>Return a normalized copy of the input data, with zero mean and unit variance.</p> <p>Parameters:</p> Name Type Description Default <code>data</code> <code>DataFrame</code> <p>The data to normalize.</p> required <p>Returns:</p> Type Description <code>DataFrame</code> <p>A normalized copy of the input data.</p> <code>Series</code> <p>The original standard deviations of the columns of the input data.</p> Source code in <code>src/logos/regression.py</code> <pre><code>@staticmethod\ndef get_normalized_copy(data: pd.DataFrame) -&gt; tuple[pd.DataFrame, pd.Series]:\n    \"\"\"\n    Return a normalized copy of the input data, with zero mean\n    and unit variance.\n\n    Parameters:\n        data: The data to normalize.\n\n    Returns:\n        A normalized copy of the input data.\n        The original standard deviations of the columns of the input data.\n    \"\"\"\n    data = data.copy(deep=True)\n    stdevs = data.std()\n\n    # Cast all columns to float64 to avoid numpy warnings\n    data = data.astype(\"float64\")\n\n    for column in data.columns:\n        if stdevs[column] == 0:\n            data.loc[:, column] = 0\n        else:\n            data.loc[:, column] = (data[column] - data[column].mean()) / stdevs[\n                column\n            ]\n    return data, stdevs\n</code></pre>"},{"location":"reference/logos/regression/#logos.regression.Regression.multi_ols","title":"<code>multi_ols(X_names, X_data, Y_data)</code>  <code>staticmethod</code>","text":"<p>Calculate the slopes and p-values of a multivariate linear regression of the variables in <code>X</code> on <code>Y</code>. Normalize each column to zero mean and unit variance before running the regression. Return both the normalized and unnormalized slopes.</p> <p>Parameters:</p> Name Type Description Default <code>X_names</code> <code>list[str]</code> <p>The names of the predictor variables.</p> required <code>X_data</code> <code>DataFrame</code> <p>The data for the predictor variables.</p> required <code>Y_data</code> <code>Series</code> <p>The data for the target variable.</p> required <p>Returns:</p> Type Description <code>DataFrame</code> <p>A dataframe with the names, slopes, and p-values of the regressions.</p> Source code in <code>src/logos/regression.py</code> <pre><code>@staticmethod\ndef multi_ols(\n    X_names: list[str], X_data: pd.DataFrame, Y_data: pd.Series\n) -&gt; pd.DataFrame:\n    \"\"\"\n    Calculate the slopes and p-values of a multivariate linear regression\n    of the variables in `X` on `Y`. Normalize each column to zero mean and\n    unit variance before running the regression. Return both the normalized\n    and unnormalized slopes.\n\n    Parameters:\n        X_names: The names of the predictor variables.\n        X_data: The data for the predictor variables.\n        Y_data: The data for the target variable.\n\n    Returns:\n        A dataframe with the names, slopes, and p-values of the regressions.\n    \"\"\"\n    X_data, stdevs = Regression.get_normalized_copy(X_data)\n\n    X_data = sm.add_constant(X_data)\n    model = sm.OLS(Y_data, X_data).fit()\n\n    # Get the coefficients and p-values, ignoring the constant\n    coefficients = model.params.iloc[1:]\n    p_values = model.pvalues.iloc[1:]\n\n    # Unnormalize the slopes\n    coefficients_unnormalized = coefficients.copy()\n    for coeff in coefficients_unnormalized.index:\n        coefficients_unnormalized[coeff] = (\n            coefficients[coeff] / stdevs[coeff] if stdevs[coeff] != 0 else 0\n        )\n\n    return pd.DataFrame(\n        {\n            \"Candidate\": coefficients.index,\n            \"Slope\": coefficients_unnormalized.values,\n            \"P-value\": p_values.values,\n            \"Normalized Slope\": coefficients.values,\n            \"Absolute Normalized Slope\": coefficients.abs().values,\n        }\n    )\n</code></pre>"},{"location":"reference/logos/tag_utils/","title":"TagUtils","text":""},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagOrigin","title":"<code>TagOrigin</code>","text":"<p>               Bases: <code>IntEnum</code></p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>class TagOrigin(IntEnum):\n    PRECEDING: int = 0\n    \"\"\"Indicates that the tag was derived from the preceding tokens in the corresponding template.\"\"\"\n\n    GPT_3POINT5_TURBO: int = 1\n    \"\"\"Indicates that the tag was derived using gpt-3.5-turbo.\"\"\"\n\n    GPT_4: int = 2\n    \"\"\"Indicates that the tag was derived using gpt-4.\"\"\"\n\n    NAME: int = 3\n    \"\"\"Indicates that the tag was derived from the name of the variable.\"\"\"\n\n    REGEX_VARIABLE: int = 4\n    \"\"\"Indicates that the tag was derived from the name of the variable because the name was given by the user.\"\"\"\n</code></pre>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagOrigin.PRECEDING","title":"<code>PRECEDING: int = 0</code>  <code>class-attribute</code> <code>instance-attribute</code>","text":"<p>Indicates that the tag was derived from the preceding tokens in the corresponding template.</p>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagOrigin.GPT_3POINT5_TURBO","title":"<code>GPT_3POINT5_TURBO: int = 1</code>  <code>class-attribute</code> <code>instance-attribute</code>","text":"<p>Indicates that the tag was derived using gpt-3.5-turbo.</p>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagOrigin.GPT_4","title":"<code>GPT_4: int = 2</code>  <code>class-attribute</code> <code>instance-attribute</code>","text":"<p>Indicates that the tag was derived using gpt-4.</p>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagOrigin.NAME","title":"<code>NAME: int = 3</code>  <code>class-attribute</code> <code>instance-attribute</code>","text":"<p>Indicates that the tag was derived from the name of the variable.</p>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagOrigin.REGEX_VARIABLE","title":"<code>REGEX_VARIABLE: int = 4</code>  <code>class-attribute</code> <code>instance-attribute</code>","text":"<p>Indicates that the tag was derived from the name of the variable because the name was given by the user.</p>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagUtils","title":"<code>TagUtils</code>","text":"<p>A class for managing tags of parsed and prepared variables.</p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>class TagUtils:\n    \"\"\"\n    A class for managing tags of parsed and prepared variables.\n    \"\"\"\n\n    @staticmethod\n    def check_columns(df: pd.DataFrame, columns: list) -&gt; None:\n        \"\"\"\n        Check that the specified columns exist in the dataframe.\n\n        Parameters:\n            df: The dataframe to be checked.\n            columns: The columns to be checked.\n\n        Raises:\n            ValueError: If any of the columns are not present in the dataframe.\n        \"\"\"\n        if not set(columns).issubset(set(df.columns)):\n            raise ValueError(f\"Columns {columns} are not all present in the dataframe.\")\n\n    @staticmethod\n    def check_fields(series: pd.Series, fields: list) -&gt; None:\n        \"\"\"\n        Check that the specified fields exist in the specified series.\n\n        Parameters:\n            series: The series to be checked.\n            fields: The fields to be checked.\n\n        Raises:\n            ValueError: If any of the fields are not present in the series.\n        \"\"\"\n        if not set(fields).issubset(set(series.index)):\n            raise ValueError(f\"Fields {fields} are not all present in the series.\")\n\n    @staticmethod\n    def best_effort_tag(\n        templates_df: pd.DataFrame,\n        variable_row: pd.Series,\n        enable_gpt_tagging: bool,\n        gpt_model: str,\n    ) -&gt; tuple[str, bool]:\n        \"\"\"\n        Apply `gpt_tag` to `variable_row`, if possible, and return the result. If there is\n        no environment variable called OPENAI_API_KEY, or if `enable_gpt_tagging` is False,\n        apply `preceding_tokens_tag` instead.\n\n        Parameters:\n            templates_df: The dataframe containing information about the log templates.\n            variable_row: The row of the dataframe containing information about the parsed variable.\n            enable_gpt_tagging: A boolean indicating whether GPT-3.5 tagging should be enabled.\n            gpt_model: The GPT model to use.\n\n        Returns:\n            A tuple containing (i) the GPT-3.5 tag for the parsed variable name, if possible, or the\n            best-effort tag otherwise, and (ii) a boolean indicating whether the GPT-3.5 tag was used.\n        \"\"\"\n        if enable_gpt_tagging:\n            try:\n                return (TagUtils.gpt_tag(templates_df, variable_row, gpt_model), True)\n            except:\n                return (TagUtils.preceding_tokens_tag(variable_row), False)\n        else:\n            return (TagUtils.preceding_tokens_tag(variable_row), False)\n\n    @staticmethod\n    def waterfall_tag(\n        templates_df: pd.DataFrame,\n        variable_row: pd.Series,\n        banned_values: Optional[list[str]] = None,\n    ) -&gt; tuple[str, TagOrigin]:\n        \"\"\"\n        Apply each of the tagging methods in turn, in order of increasing cost, until a tag is found\n        that is not included in the banned values. In partidular, apply `preceding_tokens_tag` first,\n        then `gpt_tag` with the GPT-3.5 model, and finally `gpt_tag` with the GPT-4 model. If none of\n        these methods succeeds, return the name of the variable as the tag.\n\n        Parameters:\n            templates_df: The dataframe containing information about the log templates.\n            variable_row: The row of the dataframe containing information about the parsed variable.\n            banned_values: A list of values that should not be used as tags.\n\n        Returns:\n            A tuple containing (i) the tag for the parsed variable, and (ii) the origin of the tag.\n        \"\"\"\n        name = variable_row[\"Name\"]\n        if variable_row[\"From regex\"]:\n            return (name, TagOrigin.REGEX_VARIABLE)\n\n        # Try to derive a tag from the preceding tokens in the corresponding template\n        tag, origin = TagUtils.preceding_tokens_tag(variable_row, banned_values)\n        if tag != name:\n            return (tag, origin)\n\n        # Try to derive a tag using GPT-3.5\n        try:\n            tag = TagUtils.gpt_tag(\n                templates_df, variable_row, \"gpt-3.5-turbo\", banned_values\n            )\n            if tag != name:\n                return (tag, TagOrigin.GPT_3POINT5_TURBO)\n        except Exception as e:\n            print(f\"Exception {e} came up while tagging {name} with GPT-3.5.\")\n            pass\n\n        # Try to derive a tag using GPT-4\n        try:\n            tag = TagUtils.gpt_tag(templates_df, variable_row, \"gpt-4\", banned_values)\n            if tag != name:\n                return (tag, TagOrigin.GPT_4)\n        except Exception as e:\n            print(f\"Exception {e} came up while tagging {name} with GPT-4.\")\n            pass\n\n        return (name, TagOrigin.NAME)\n\n    @staticmethod\n    def preceding_tokens_tag(\n        variable_row: pd.Series, banned_values: Optional[list[str]] = None\n    ) -&gt; tuple[str, TagOrigin]:\n        \"\"\"\n        Try to derive a tag for a parsed variable name based on the preceding tokens in the corresponding template.\n\n        Parameters:\n            variable_row: The row of the dataframe containing information about the parsed variable.\n            banned_values: A list of values that should not be used as tags.\n\n        Returns:\n            A tuple containing (i) the tag for the parsed variable, and (ii) the origin of the tag.\n        \"\"\"\n\n        TagUtils.check_fields(variable_row, [\"Preceding 3 tokens\", \"Name\", \"From regex\"])\n        name = variable_row[\"Name\"]\n        if variable_row[\"From regex\"]:\n            return name, TagOrigin.REGEX_VARIABLE\n\n        pr = variable_row[\"Preceding 3 tokens\"]\n        tag = name\n        origin = TagOrigin.NAME\n        if len(pr) &gt;= 2 and (pr[-1] in \":=\") and (pr[-2][0] != \"&lt;\"):\n            tag = pr[-2]\n            origin = TagOrigin.PRECEDING\n        elif (\n            len(pr) == 3\n            and (pr[2] in \"\"\"\"'\"\"\")\n            and (pr[1] in \":=\")\n            and (pr[0][0] != \"&lt;\")\n        ):\n            tag = pr[0]\n            origin = TagOrigin.PRECEDING\n\n        # Double-check that the tag is not in the banned values\n        if banned_values is not None and tag in banned_values:\n            return name, TagOrigin.NAME\n\n        return tag, origin\n\n    @staticmethod\n    def gpt_tag(\n        templates_df: pd.DataFrame,\n        variable_row: pd.Series,\n        model: str = \"gpt-3.5-turbo\",\n        banned_values: Optional[list[str]] = None,\n    ) -&gt; str:\n        \"\"\"\n        Use GPT to derive a tag the variable described in `variable_row`,\n        using information about the corresponding log template, retrieved from `templates_df`.\n\n        Parameters:\n            templates_df: The dataframe containing information about the log templates.\n            variable_row: The row of the dataframe containing information about the parsed variable.\n            model: The GPT model to use.\n            banned_values: A list of values that should not be used as tags.\n\n        Returns:\n            The GPT-generated tag for the parsed variable name.\n        \"\"\"\n\n        TagUtils.check_fields(variable_row, [\"Name\", \"Examples\"])\n        TagUtils.check_columns(templates_df, [\"TemplateId\", \"TemplateExample\"])\n\n        template_id = ParsedVariableName(variable_row[\"Name\"]).template_id()\n        idx = ParsedVariableName(variable_row[\"Name\"]).index()\n\n        line = templates_df[templates_df[\"TemplateId\"] == template_id][\n            \"TemplateExample\"\n        ].values[0]\n        line_toks = line.split()\n\n        # Define the messages to send to the model\n        messages = [\n            {\n                \"role\": \"system\",\n                \"content\": \"You are a backend engineer that knows all about the logging infrastructure of a distributed system.\",\n            },\n            {\n                \"role\": \"user\",\n                \"content\": f\"\"\"Generate a tag for the variable that takes the value {line_toks[idx]} \"\"\"\n                f\"\"\"in the following log line:\\n {line}\\n\"\"\"\n                f\"\"\"Here are the 3 tokens that precede the variable: [{', '.join(line_toks[max(idx-3, 0):idx])} ]\\n\"\"\"\n                f\"\"\"Here are some more example values for this variable: [{', '.join(variable_row['Examples'])} ]\\n\"\"\"\n                #f\"\"\"Make sure the tag matches none of the following values: [{', '.join(banned_values) if banned_values is not None else ''} ]\\n\"\"\"\n                \"\"\"Return only the tag as a single word, possibly including underscores. DO NOT EVER REPLY WITH MORE THAN ONE WORD.\\n\"\"\",\n            },\n        ]\n\n        client = OpenAI()\n\n        tag = (\n            client.chat.completions.create(model=model, messages=messages)\n            .choices[0]\n            .message.content\n        )\n        tag_length = len(tag.split())\n        if tag_length &gt; 1:\n            # GPT didn't listen to us and returned a phrase describing the tag.\n            # Extract the word between the second-last and last occurrence of double quotes.\n            tag = tag.split('\"')[-2]\n\n\n        with open(\"gpt_log.txt\", \"a+\") as f:\n            f.write('----------------------------------\\n')\n            f.write(f\"Variable name: {variable_row['Name']}\\n\\n\")\n            f.write(f\"Model used: {model}\\n\\n\")\n            f.write(f\"Messages sent to the model:\\n{messages}\\n\\n\")\n            f.write(f\"Tag generated by the model:\\n{tag}\\n\\n\")\n            f.flush()\n\n        # Double-check that the tag is not in the banned values\n        if banned_values is not None and tag in banned_values:\n            with open(\"gpt_log.txt\", \"a+\") as f:\n                f.write('That tag is banned, returning name.\\n')\n            return variable_row[\"Name\"]\n\n        return tag\n\n    @staticmethod\n    def deduplicate_tags(df: pd.DataFrame) -&gt; pd.DataFrame:\n        \"\"\"\n        Ensure that the tags in df are unique, by making the tag column of any row\n        with a seen-before tag equal to the name column of that row.\n\n        Parameters:\n            df: The dataframe to be deduplicated.\n\n        Returns:\n            The deduplicated dataframe.\n        \"\"\"\n\n        TagUtils.check_columns(df, [\"Name\", \"Tag\", \"TagOrigin\"])\n        seen_tags = set()\n        for i, row in df.iterrows():\n            if row[\"Tag\"] in seen_tags:\n                df.loc[i, \"Tag\"] = row[\"Name\"]\n                df.loc[i, \"TagOrigin\"] = TagOrigin.NAME\n            else:\n                seen_tags.add(row[\"Tag\"])\n\n    @staticmethod\n    def set_tag(df: pd.DataFrame, name: str, tag: str, info: str = \"\") -&gt; None:\n        \"\"\"\n        Tag a parsed or prepared variable for easier access.\n\n        Parameters:\n            df: The dataframe containing the parsed or prepared variables.\n            name: The name of the parsed or prepared variable.\n            tag: The tag to be set.\n            info: A string describing the type of variable being tagged (parsed or prepared).\n\n        Raises:\n            ValueError: If the name is not the name of a parsed or prepared variable.\n        \"\"\"\n        TagUtils.check_columns(df, [\"Name\", \"Tag\"])\n        if name in df[\"Name\"].values:\n            df.loc[df[\"Name\"] == name, \"Tag\"] = tag\n            Printer.printv(f\"Variable {name} tagged as {tag}\")\n        else:\n            raise ValueError(f\"{name} is not the name of a {info} variable.\")\n\n    @staticmethod\n    def get_tag(df: pd.DataFrame, name: str, info: str = \"\") -&gt; str:\n        \"\"\"\n        Retrieve the tag of a parsed or prepared variable.\n\n        Parameters:\n            df: The dataframe containing the parsed or prepared variables.\n            name: The name of the parsed or prepared variable.\n            info: A string describing the type of variable being tagged (parsed or prepared).\n\n        Raises:\n            ValueError: If the name is not the name of a parsed or prepared variable.\n        \"\"\"\n\n        TagUtils.check_columns(df, [\"Name\", \"Tag\"])\n        if name in df[\"Name\"].values:\n            return df.loc[df[\"Name\"] == name, \"Tag\"].values[0]\n        else:\n            raise ValueError(f\"{name} is not the name of a {info} variable.\")\n\n    @staticmethod\n    def name_of(df: pd.DataFrame, name_or_tag: str, info: str = \"\") -&gt; str:\n        \"\"\"\n        Determine the name of a parsed or prepared variable, given either itself or its tag.\n\n        Parameters:\n            df: The dataframe containing the parsed or prepared variables.\n            name_or_tag: The name or tag of the parsed or prepared variable.\n            info: A string describing the type of variable in question (parsed or prepared).\n\n        Returns:\n            The name of the parsed or prepared variable.\n        \"\"\"\n\n        TagUtils.check_columns(df, [\"Name\", \"Tag\"])\n        name_or_tag = name_or_tag.strip()\n        if name_or_tag in df[\"Name\"].values:\n            return name_or_tag\n        elif name_or_tag in df[\"Tag\"].values:\n            return df.loc[df[\"Tag\"] == name_or_tag, \"Name\"].values[0]\n        else:\n            raise ValueError(\n                f\"{name_or_tag} is not the name or tag of a {info} variable.\"\n            )\n\n    @staticmethod\n    def tag_of(df: pd.DataFrame, name_or_tag: Optional[str], info: str = \"\") -&gt; Optional[str]:\n        \"\"\"\n        Determine the tag of a parsed or prepared variable, given either itself or its name.\n        Retuirn None if the variable is None.\n\n        Parameters:\n            df: The dataframe containing the parsed or prepared variables.\n            name_or_tag: The name or tag of the parsed or prepared variable.\n            info: A string describing the type of variable in question (parsed or prepared).\n\n        Returns:\n            The tag of the parsed or prepared variable.\n        \"\"\"\n\n        if name_or_tag is None:\n            return None\n\n        TagUtils.check_columns(df, [\"Name\", \"Tag\"])\n        name_or_tag = name_or_tag.strip()\n        if name_or_tag in df[\"Tag\"].values:\n            return name_or_tag\n        elif name_or_tag in df[\"Name\"].values:\n            return df.loc[df[\"Name\"] == name_or_tag, \"Tag\"].values[0]\n        else:\n            raise ValueError(\n                f\"{name_or_tag} is not the name or tag of a {info} variable.\"\n            )\n</code></pre>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagUtils.check_columns","title":"<code>check_columns(df, columns)</code>  <code>staticmethod</code>","text":"<p>Check that the specified columns exist in the dataframe.</p> <p>Parameters:</p> Name Type Description Default <code>df</code> <code>DataFrame</code> <p>The dataframe to be checked.</p> required <code>columns</code> <code>list</code> <p>The columns to be checked.</p> required <p>Raises:</p> Type Description <code>ValueError</code> <p>If any of the columns are not present in the dataframe.</p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>@staticmethod\ndef check_columns(df: pd.DataFrame, columns: list) -&gt; None:\n    \"\"\"\n    Check that the specified columns exist in the dataframe.\n\n    Parameters:\n        df: The dataframe to be checked.\n        columns: The columns to be checked.\n\n    Raises:\n        ValueError: If any of the columns are not present in the dataframe.\n    \"\"\"\n    if not set(columns).issubset(set(df.columns)):\n        raise ValueError(f\"Columns {columns} are not all present in the dataframe.\")\n</code></pre>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagUtils.check_fields","title":"<code>check_fields(series, fields)</code>  <code>staticmethod</code>","text":"<p>Check that the specified fields exist in the specified series.</p> <p>Parameters:</p> Name Type Description Default <code>series</code> <code>Series</code> <p>The series to be checked.</p> required <code>fields</code> <code>list</code> <p>The fields to be checked.</p> required <p>Raises:</p> Type Description <code>ValueError</code> <p>If any of the fields are not present in the series.</p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>@staticmethod\ndef check_fields(series: pd.Series, fields: list) -&gt; None:\n    \"\"\"\n    Check that the specified fields exist in the specified series.\n\n    Parameters:\n        series: The series to be checked.\n        fields: The fields to be checked.\n\n    Raises:\n        ValueError: If any of the fields are not present in the series.\n    \"\"\"\n    if not set(fields).issubset(set(series.index)):\n        raise ValueError(f\"Fields {fields} are not all present in the series.\")\n</code></pre>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagUtils.best_effort_tag","title":"<code>best_effort_tag(templates_df, variable_row, enable_gpt_tagging, gpt_model)</code>  <code>staticmethod</code>","text":"<p>Apply <code>gpt_tag</code> to <code>variable_row</code>, if possible, and return the result. If there is no environment variable called OPENAI_API_KEY, or if <code>enable_gpt_tagging</code> is False, apply <code>preceding_tokens_tag</code> instead.</p> <p>Parameters:</p> Name Type Description Default <code>templates_df</code> <code>DataFrame</code> <p>The dataframe containing information about the log templates.</p> required <code>variable_row</code> <code>Series</code> <p>The row of the dataframe containing information about the parsed variable.</p> required <code>enable_gpt_tagging</code> <code>bool</code> <p>A boolean indicating whether GPT-3.5 tagging should be enabled.</p> required <code>gpt_model</code> <code>str</code> <p>The GPT model to use.</p> required <p>Returns:</p> Type Description <code>str</code> <p>A tuple containing (i) the GPT-3.5 tag for the parsed variable name, if possible, or the</p> <code>bool</code> <p>best-effort tag otherwise, and (ii) a boolean indicating whether the GPT-3.5 tag was used.</p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>@staticmethod\ndef best_effort_tag(\n    templates_df: pd.DataFrame,\n    variable_row: pd.Series,\n    enable_gpt_tagging: bool,\n    gpt_model: str,\n) -&gt; tuple[str, bool]:\n    \"\"\"\n    Apply `gpt_tag` to `variable_row`, if possible, and return the result. If there is\n    no environment variable called OPENAI_API_KEY, or if `enable_gpt_tagging` is False,\n    apply `preceding_tokens_tag` instead.\n\n    Parameters:\n        templates_df: The dataframe containing information about the log templates.\n        variable_row: The row of the dataframe containing information about the parsed variable.\n        enable_gpt_tagging: A boolean indicating whether GPT-3.5 tagging should be enabled.\n        gpt_model: The GPT model to use.\n\n    Returns:\n        A tuple containing (i) the GPT-3.5 tag for the parsed variable name, if possible, or the\n        best-effort tag otherwise, and (ii) a boolean indicating whether the GPT-3.5 tag was used.\n    \"\"\"\n    if enable_gpt_tagging:\n        try:\n            return (TagUtils.gpt_tag(templates_df, variable_row, gpt_model), True)\n        except:\n            return (TagUtils.preceding_tokens_tag(variable_row), False)\n    else:\n        return (TagUtils.preceding_tokens_tag(variable_row), False)\n</code></pre>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagUtils.waterfall_tag","title":"<code>waterfall_tag(templates_df, variable_row, banned_values=None)</code>  <code>staticmethod</code>","text":"<p>Apply each of the tagging methods in turn, in order of increasing cost, until a tag is found that is not included in the banned values. In partidular, apply <code>preceding_tokens_tag</code> first, then <code>gpt_tag</code> with the GPT-3.5 model, and finally <code>gpt_tag</code> with the GPT-4 model. If none of these methods succeeds, return the name of the variable as the tag.</p> <p>Parameters:</p> Name Type Description Default <code>templates_df</code> <code>DataFrame</code> <p>The dataframe containing information about the log templates.</p> required <code>variable_row</code> <code>Series</code> <p>The row of the dataframe containing information about the parsed variable.</p> required <code>banned_values</code> <code>Optional[list[str]]</code> <p>A list of values that should not be used as tags.</p> <code>None</code> <p>Returns:</p> Type Description <code>tuple[str, TagOrigin]</code> <p>A tuple containing (i) the tag for the parsed variable, and (ii) the origin of the tag.</p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>@staticmethod\ndef waterfall_tag(\n    templates_df: pd.DataFrame,\n    variable_row: pd.Series,\n    banned_values: Optional[list[str]] = None,\n) -&gt; tuple[str, TagOrigin]:\n    \"\"\"\n    Apply each of the tagging methods in turn, in order of increasing cost, until a tag is found\n    that is not included in the banned values. In partidular, apply `preceding_tokens_tag` first,\n    then `gpt_tag` with the GPT-3.5 model, and finally `gpt_tag` with the GPT-4 model. If none of\n    these methods succeeds, return the name of the variable as the tag.\n\n    Parameters:\n        templates_df: The dataframe containing information about the log templates.\n        variable_row: The row of the dataframe containing information about the parsed variable.\n        banned_values: A list of values that should not be used as tags.\n\n    Returns:\n        A tuple containing (i) the tag for the parsed variable, and (ii) the origin of the tag.\n    \"\"\"\n    name = variable_row[\"Name\"]\n    if variable_row[\"From regex\"]:\n        return (name, TagOrigin.REGEX_VARIABLE)\n\n    # Try to derive a tag from the preceding tokens in the corresponding template\n    tag, origin = TagUtils.preceding_tokens_tag(variable_row, banned_values)\n    if tag != name:\n        return (tag, origin)\n\n    # Try to derive a tag using GPT-3.5\n    try:\n        tag = TagUtils.gpt_tag(\n            templates_df, variable_row, \"gpt-3.5-turbo\", banned_values\n        )\n        if tag != name:\n            return (tag, TagOrigin.GPT_3POINT5_TURBO)\n    except Exception as e:\n        print(f\"Exception {e} came up while tagging {name} with GPT-3.5.\")\n        pass\n\n    # Try to derive a tag using GPT-4\n    try:\n        tag = TagUtils.gpt_tag(templates_df, variable_row, \"gpt-4\", banned_values)\n        if tag != name:\n            return (tag, TagOrigin.GPT_4)\n    except Exception as e:\n        print(f\"Exception {e} came up while tagging {name} with GPT-4.\")\n        pass\n\n    return (name, TagOrigin.NAME)\n</code></pre>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagUtils.preceding_tokens_tag","title":"<code>preceding_tokens_tag(variable_row, banned_values=None)</code>  <code>staticmethod</code>","text":"<p>Try to derive a tag for a parsed variable name based on the preceding tokens in the corresponding template.</p> <p>Parameters:</p> Name Type Description Default <code>variable_row</code> <code>Series</code> <p>The row of the dataframe containing information about the parsed variable.</p> required <code>banned_values</code> <code>Optional[list[str]]</code> <p>A list of values that should not be used as tags.</p> <code>None</code> <p>Returns:</p> Type Description <code>tuple[str, TagOrigin]</code> <p>A tuple containing (i) the tag for the parsed variable, and (ii) the origin of the tag.</p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>@staticmethod\ndef preceding_tokens_tag(\n    variable_row: pd.Series, banned_values: Optional[list[str]] = None\n) -&gt; tuple[str, TagOrigin]:\n    \"\"\"\n    Try to derive a tag for a parsed variable name based on the preceding tokens in the corresponding template.\n\n    Parameters:\n        variable_row: The row of the dataframe containing information about the parsed variable.\n        banned_values: A list of values that should not be used as tags.\n\n    Returns:\n        A tuple containing (i) the tag for the parsed variable, and (ii) the origin of the tag.\n    \"\"\"\n\n    TagUtils.check_fields(variable_row, [\"Preceding 3 tokens\", \"Name\", \"From regex\"])\n    name = variable_row[\"Name\"]\n    if variable_row[\"From regex\"]:\n        return name, TagOrigin.REGEX_VARIABLE\n\n    pr = variable_row[\"Preceding 3 tokens\"]\n    tag = name\n    origin = TagOrigin.NAME\n    if len(pr) &gt;= 2 and (pr[-1] in \":=\") and (pr[-2][0] != \"&lt;\"):\n        tag = pr[-2]\n        origin = TagOrigin.PRECEDING\n    elif (\n        len(pr) == 3\n        and (pr[2] in \"\"\"\"'\"\"\")\n        and (pr[1] in \":=\")\n        and (pr[0][0] != \"&lt;\")\n    ):\n        tag = pr[0]\n        origin = TagOrigin.PRECEDING\n\n    # Double-check that the tag is not in the banned values\n    if banned_values is not None and tag in banned_values:\n        return name, TagOrigin.NAME\n\n    return tag, origin\n</code></pre>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagUtils.gpt_tag","title":"<code>gpt_tag(templates_df, variable_row, model='gpt-3.5-turbo', banned_values=None)</code>  <code>staticmethod</code>","text":"<p>Use GPT to derive a tag the variable described in <code>variable_row</code>, using information about the corresponding log template, retrieved from <code>templates_df</code>.</p> <p>Parameters:</p> Name Type Description Default <code>templates_df</code> <code>DataFrame</code> <p>The dataframe containing information about the log templates.</p> required <code>variable_row</code> <code>Series</code> <p>The row of the dataframe containing information about the parsed variable.</p> required <code>model</code> <code>str</code> <p>The GPT model to use.</p> <code>'gpt-3.5-turbo'</code> <code>banned_values</code> <code>Optional[list[str]]</code> <p>A list of values that should not be used as tags.</p> <code>None</code> <p>Returns:</p> Type Description <code>str</code> <p>The GPT-generated tag for the parsed variable name.</p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>@staticmethod\ndef gpt_tag(\n    templates_df: pd.DataFrame,\n    variable_row: pd.Series,\n    model: str = \"gpt-3.5-turbo\",\n    banned_values: Optional[list[str]] = None,\n) -&gt; str:\n    \"\"\"\n    Use GPT to derive a tag the variable described in `variable_row`,\n    using information about the corresponding log template, retrieved from `templates_df`.\n\n    Parameters:\n        templates_df: The dataframe containing information about the log templates.\n        variable_row: The row of the dataframe containing information about the parsed variable.\n        model: The GPT model to use.\n        banned_values: A list of values that should not be used as tags.\n\n    Returns:\n        The GPT-generated tag for the parsed variable name.\n    \"\"\"\n\n    TagUtils.check_fields(variable_row, [\"Name\", \"Examples\"])\n    TagUtils.check_columns(templates_df, [\"TemplateId\", \"TemplateExample\"])\n\n    template_id = ParsedVariableName(variable_row[\"Name\"]).template_id()\n    idx = ParsedVariableName(variable_row[\"Name\"]).index()\n\n    line = templates_df[templates_df[\"TemplateId\"] == template_id][\n        \"TemplateExample\"\n    ].values[0]\n    line_toks = line.split()\n\n    # Define the messages to send to the model\n    messages = [\n        {\n            \"role\": \"system\",\n            \"content\": \"You are a backend engineer that knows all about the logging infrastructure of a distributed system.\",\n        },\n        {\n            \"role\": \"user\",\n            \"content\": f\"\"\"Generate a tag for the variable that takes the value {line_toks[idx]} \"\"\"\n            f\"\"\"in the following log line:\\n {line}\\n\"\"\"\n            f\"\"\"Here are the 3 tokens that precede the variable: [{', '.join(line_toks[max(idx-3, 0):idx])} ]\\n\"\"\"\n            f\"\"\"Here are some more example values for this variable: [{', '.join(variable_row['Examples'])} ]\\n\"\"\"\n            #f\"\"\"Make sure the tag matches none of the following values: [{', '.join(banned_values) if banned_values is not None else ''} ]\\n\"\"\"\n            \"\"\"Return only the tag as a single word, possibly including underscores. DO NOT EVER REPLY WITH MORE THAN ONE WORD.\\n\"\"\",\n        },\n    ]\n\n    client = OpenAI()\n\n    tag = (\n        client.chat.completions.create(model=model, messages=messages)\n        .choices[0]\n        .message.content\n    )\n    tag_length = len(tag.split())\n    if tag_length &gt; 1:\n        # GPT didn't listen to us and returned a phrase describing the tag.\n        # Extract the word between the second-last and last occurrence of double quotes.\n        tag = tag.split('\"')[-2]\n\n\n    with open(\"gpt_log.txt\", \"a+\") as f:\n        f.write('----------------------------------\\n')\n        f.write(f\"Variable name: {variable_row['Name']}\\n\\n\")\n        f.write(f\"Model used: {model}\\n\\n\")\n        f.write(f\"Messages sent to the model:\\n{messages}\\n\\n\")\n        f.write(f\"Tag generated by the model:\\n{tag}\\n\\n\")\n        f.flush()\n\n    # Double-check that the tag is not in the banned values\n    if banned_values is not None and tag in banned_values:\n        with open(\"gpt_log.txt\", \"a+\") as f:\n            f.write('That tag is banned, returning name.\\n')\n        return variable_row[\"Name\"]\n\n    return tag\n</code></pre>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagUtils.deduplicate_tags","title":"<code>deduplicate_tags(df)</code>  <code>staticmethod</code>","text":"<p>Ensure that the tags in df are unique, by making the tag column of any row with a seen-before tag equal to the name column of that row.</p> <p>Parameters:</p> Name Type Description Default <code>df</code> <code>DataFrame</code> <p>The dataframe to be deduplicated.</p> required <p>Returns:</p> Type Description <code>DataFrame</code> <p>The deduplicated dataframe.</p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>@staticmethod\ndef deduplicate_tags(df: pd.DataFrame) -&gt; pd.DataFrame:\n    \"\"\"\n    Ensure that the tags in df are unique, by making the tag column of any row\n    with a seen-before tag equal to the name column of that row.\n\n    Parameters:\n        df: The dataframe to be deduplicated.\n\n    Returns:\n        The deduplicated dataframe.\n    \"\"\"\n\n    TagUtils.check_columns(df, [\"Name\", \"Tag\", \"TagOrigin\"])\n    seen_tags = set()\n    for i, row in df.iterrows():\n        if row[\"Tag\"] in seen_tags:\n            df.loc[i, \"Tag\"] = row[\"Name\"]\n            df.loc[i, \"TagOrigin\"] = TagOrigin.NAME\n        else:\n            seen_tags.add(row[\"Tag\"])\n</code></pre>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagUtils.set_tag","title":"<code>set_tag(df, name, tag, info='')</code>  <code>staticmethod</code>","text":"<p>Tag a parsed or prepared variable for easier access.</p> <p>Parameters:</p> Name Type Description Default <code>df</code> <code>DataFrame</code> <p>The dataframe containing the parsed or prepared variables.</p> required <code>name</code> <code>str</code> <p>The name of the parsed or prepared variable.</p> required <code>tag</code> <code>str</code> <p>The tag to be set.</p> required <code>info</code> <code>str</code> <p>A string describing the type of variable being tagged (parsed or prepared).</p> <code>''</code> <p>Raises:</p> Type Description <code>ValueError</code> <p>If the name is not the name of a parsed or prepared variable.</p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>@staticmethod\ndef set_tag(df: pd.DataFrame, name: str, tag: str, info: str = \"\") -&gt; None:\n    \"\"\"\n    Tag a parsed or prepared variable for easier access.\n\n    Parameters:\n        df: The dataframe containing the parsed or prepared variables.\n        name: The name of the parsed or prepared variable.\n        tag: The tag to be set.\n        info: A string describing the type of variable being tagged (parsed or prepared).\n\n    Raises:\n        ValueError: If the name is not the name of a parsed or prepared variable.\n    \"\"\"\n    TagUtils.check_columns(df, [\"Name\", \"Tag\"])\n    if name in df[\"Name\"].values:\n        df.loc[df[\"Name\"] == name, \"Tag\"] = tag\n        Printer.printv(f\"Variable {name} tagged as {tag}\")\n    else:\n        raise ValueError(f\"{name} is not the name of a {info} variable.\")\n</code></pre>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagUtils.get_tag","title":"<code>get_tag(df, name, info='')</code>  <code>staticmethod</code>","text":"<p>Retrieve the tag of a parsed or prepared variable.</p> <p>Parameters:</p> Name Type Description Default <code>df</code> <code>DataFrame</code> <p>The dataframe containing the parsed or prepared variables.</p> required <code>name</code> <code>str</code> <p>The name of the parsed or prepared variable.</p> required <code>info</code> <code>str</code> <p>A string describing the type of variable being tagged (parsed or prepared).</p> <code>''</code> <p>Raises:</p> Type Description <code>ValueError</code> <p>If the name is not the name of a parsed or prepared variable.</p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>@staticmethod\ndef get_tag(df: pd.DataFrame, name: str, info: str = \"\") -&gt; str:\n    \"\"\"\n    Retrieve the tag of a parsed or prepared variable.\n\n    Parameters:\n        df: The dataframe containing the parsed or prepared variables.\n        name: The name of the parsed or prepared variable.\n        info: A string describing the type of variable being tagged (parsed or prepared).\n\n    Raises:\n        ValueError: If the name is not the name of a parsed or prepared variable.\n    \"\"\"\n\n    TagUtils.check_columns(df, [\"Name\", \"Tag\"])\n    if name in df[\"Name\"].values:\n        return df.loc[df[\"Name\"] == name, \"Tag\"].values[0]\n    else:\n        raise ValueError(f\"{name} is not the name of a {info} variable.\")\n</code></pre>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagUtils.name_of","title":"<code>name_of(df, name_or_tag, info='')</code>  <code>staticmethod</code>","text":"<p>Determine the name of a parsed or prepared variable, given either itself or its tag.</p> <p>Parameters:</p> Name Type Description Default <code>df</code> <code>DataFrame</code> <p>The dataframe containing the parsed or prepared variables.</p> required <code>name_or_tag</code> <code>str</code> <p>The name or tag of the parsed or prepared variable.</p> required <code>info</code> <code>str</code> <p>A string describing the type of variable in question (parsed or prepared).</p> <code>''</code> <p>Returns:</p> Type Description <code>str</code> <p>The name of the parsed or prepared variable.</p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>@staticmethod\ndef name_of(df: pd.DataFrame, name_or_tag: str, info: str = \"\") -&gt; str:\n    \"\"\"\n    Determine the name of a parsed or prepared variable, given either itself or its tag.\n\n    Parameters:\n        df: The dataframe containing the parsed or prepared variables.\n        name_or_tag: The name or tag of the parsed or prepared variable.\n        info: A string describing the type of variable in question (parsed or prepared).\n\n    Returns:\n        The name of the parsed or prepared variable.\n    \"\"\"\n\n    TagUtils.check_columns(df, [\"Name\", \"Tag\"])\n    name_or_tag = name_or_tag.strip()\n    if name_or_tag in df[\"Name\"].values:\n        return name_or_tag\n    elif name_or_tag in df[\"Tag\"].values:\n        return df.loc[df[\"Tag\"] == name_or_tag, \"Name\"].values[0]\n    else:\n        raise ValueError(\n            f\"{name_or_tag} is not the name or tag of a {info} variable.\"\n        )\n</code></pre>"},{"location":"reference/logos/tag_utils/#logos.tag_utils.TagUtils.tag_of","title":"<code>tag_of(df, name_or_tag, info='')</code>  <code>staticmethod</code>","text":"<p>Determine the tag of a parsed or prepared variable, given either itself or its name. Retuirn None if the variable is None.</p> <p>Parameters:</p> Name Type Description Default <code>df</code> <code>DataFrame</code> <p>The dataframe containing the parsed or prepared variables.</p> required <code>name_or_tag</code> <code>Optional[str]</code> <p>The name or tag of the parsed or prepared variable.</p> required <code>info</code> <code>str</code> <p>A string describing the type of variable in question (parsed or prepared).</p> <code>''</code> <p>Returns:</p> Type Description <code>Optional[str]</code> <p>The tag of the parsed or prepared variable.</p> Source code in <code>src/logos/tag_utils.py</code> <pre><code>@staticmethod\ndef tag_of(df: pd.DataFrame, name_or_tag: Optional[str], info: str = \"\") -&gt; Optional[str]:\n    \"\"\"\n    Determine the tag of a parsed or prepared variable, given either itself or its name.\n    Retuirn None if the variable is None.\n\n    Parameters:\n        df: The dataframe containing the parsed or prepared variables.\n        name_or_tag: The name or tag of the parsed or prepared variable.\n        info: A string describing the type of variable in question (parsed or prepared).\n\n    Returns:\n        The tag of the parsed or prepared variable.\n    \"\"\"\n\n    if name_or_tag is None:\n        return None\n\n    TagUtils.check_columns(df, [\"Name\", \"Tag\"])\n    name_or_tag = name_or_tag.strip()\n    if name_or_tag in df[\"Tag\"].values:\n        return name_or_tag\n    elif name_or_tag in df[\"Name\"].values:\n        return df.loc[df[\"Name\"] == name_or_tag, \"Tag\"].values[0]\n    else:\n        raise ValueError(\n            f\"{name_or_tag} is not the name or tag of a {info} variable.\"\n        )\n</code></pre>"},{"location":"reference/logos/types/","title":"Types","text":""},{"location":"reference/logos/types/#logos.types.Types","title":"<code>Types</code>","text":"Source code in <code>src/logos/types.py</code> <pre><code>class Types:\n    Edge = tuple[str, str]\n    \"\"\"Type alias for a directed edge.\"\"\"\n\n    LeafLabelingFunction = Callable[[int], str]\n    \"\"\"Type alias for a leaf labeling function in `ATE`.\"\"\"\n\n    EdgeCountDict = defaultdict[Edge, int]\n    \"\"\"Type alias for a dictionary counting edge occurrences.\"\"\"\n</code></pre>"},{"location":"reference/logos/types/#logos.types.Types.Edge","title":"<code>Edge = tuple[str, str]</code>  <code>class-attribute</code> <code>instance-attribute</code>","text":"<p>Type alias for a directed edge.</p>"},{"location":"reference/logos/types/#logos.types.Types.LeafLabelingFunction","title":"<code>LeafLabelingFunction = Callable[[int], str]</code>  <code>class-attribute</code> <code>instance-attribute</code>","text":"<p>Type alias for a leaf labeling function in <code>ATE</code>.</p>"},{"location":"reference/logos/types/#logos.types.Types.EdgeCountDict","title":"<code>EdgeCountDict = defaultdict[Edge, int]</code>  <code>class-attribute</code> <code>instance-attribute</code>","text":"<p>Type alias for a dictionary counting edge occurrences.</p>"},{"location":"reference/logos/aggimp/","title":"Index","text":""},{"location":"reference/logos/aggimp/agg_funcs/","title":"Aggregation Functions","text":""},{"location":"reference/logos/aggimp/agg_funcs/#logos.aggimp.agg_funcs.mean","title":"<code>mean(x)</code>","text":"<p>Calculates the mean of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the mean will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The mean of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def mean(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the mean of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the mean will be calculated.\n\n    Returns:\n        The mean of the series, or None if the series is all NA.\n    \"\"\"\n    return x.mean(skipna=True) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggimp/agg_funcs/#logos.aggimp.agg_funcs.min","title":"<code>min(x)</code>","text":"<p>Calculates the minimum of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the minimum will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The minimum of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def min(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the minimum of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the minimum will be calculated.\n\n    Returns:\n        The minimum of the series, or None if the series is all NA.\n    \"\"\"\n    return x.min(skipna=True) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggimp/agg_funcs/#logos.aggimp.agg_funcs.max","title":"<code>max(x)</code>","text":"<p>Calculates the maximum of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the maximum will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The maximum of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def max(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the maximum of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the maximum will be calculated.\n\n    Returns:\n        The maximum of the series, or None if the series is all NA.\n    \"\"\"\n    return x.max(skipna=True) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggimp/agg_funcs/#logos.aggimp.agg_funcs.median","title":"<code>median(x)</code>","text":"<p>Calculates the median of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the median will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The median of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def median(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the median of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the median will be calculated.\n\n    Returns:\n        The median of the series, or None if the series is all NA.\n    \"\"\"\n    return x.median(skipna=True) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggimp/agg_funcs/#logos.aggimp.agg_funcs.mode","title":"<code>mode(x)</code>","text":"<p>Calculates the mode of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the mode will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The mode of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def mode(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the mode of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the mode will be calculated.\n\n    Returns:\n        The mode of the series, or None if the series is all NA.\n    \"\"\"\n    return x.mode(dropna=True)[0] if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggimp/agg_funcs/#logos.aggimp.agg_funcs.std","title":"<code>std(x)</code>","text":"<p>Calculates the standard deviation of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the standard deviation will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The standard deviation of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def std(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the standard deviation of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the standard deviation will be calculated.\n\n    Returns:\n        The standard deviation of the series, or None if the series is all NA.\n    \"\"\"\n    return x.std(skipna=True) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggimp/agg_funcs/#logos.aggimp.agg_funcs.last","title":"<code>last(x)</code>","text":"<p>Returns the last non-NA value in a series.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the last non-NA value will be returned.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The last non-NA value of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def last(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Returns the last non-NA value in a series.\n\n    Parameters:\n        x: The series for which the last non-NA value will be returned.\n\n    Returns:\n        The last non-NA value of the series, or None if the series is all NA.\n    \"\"\"\n    return x.dropna().tail(1) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggimp/agg_funcs/#logos.aggimp.agg_funcs.first","title":"<code>first(x)</code>","text":"<p>Returns the first non-NA value in a series.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the first non-NA value will be returned.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The first non-NA value of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def first(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Returns the first non-NA value in a series.\n\n    Parameters:\n        x: The series for which the first non-NA value will be returned.\n\n    Returns:\n        The first non-NA value of the series, or None if the series is all NA.\n    \"\"\"\n    return x.dropna().head(1) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggimp/agg_funcs/#logos.aggimp.agg_funcs.sum","title":"<code>sum(x)</code>","text":"<p>Calculates the sum of a series, ignoring NA values.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the sum will be calculated.</p> required <p>Returns:</p> Type Description <code>Optional[Series]</code> <p>The sum of the series, or None if the series is all NA.</p> Source code in <code>src/logos/aggimp/agg_funcs.py</code> <pre><code>def sum(x: pd.Series) -&gt; Optional[pd.Series]:\n    \"\"\"\n    Calculates the sum of a series, ignoring NA values.\n\n    Parameters:\n        x: The series for which the sum will be calculated.\n\n    Returns:\n        The sum of the series, or None if the series is all NA.\n    \"\"\"\n    return x.sum(skipna=True) if x.isna().sum() &lt; len(x) else None\n</code></pre>"},{"location":"reference/logos/aggimp/imp_funcs/","title":"Imputation Functions","text":""},{"location":"reference/logos/aggimp/imp_funcs/#logos.aggimp.imp_funcs.ffill_imp","title":"<code>ffill_imp(x)</code>","text":"<p>Impute the NA values in a series by forward-filling and return the series.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the NA values will be imputed.</p> required <p>Returns:</p> Type Description <code>Series</code> <p>The series, with NA values imputed.</p> Source code in <code>src/logos/aggimp/imp_funcs.py</code> <pre><code>def ffill_imp(x: pd.Series) -&gt; pd.Series:\n    \"\"\"\n    Impute the NA values in a series by forward-filling and return the series.\n\n    Parameters:\n        x: The series for which the NA values will be imputed.\n\n    Returns:\n        The series, with NA values imputed.\n    \"\"\"\n    return x.ffill()\n</code></pre>"},{"location":"reference/logos/aggimp/imp_funcs/#logos.aggimp.imp_funcs.zero_imp","title":"<code>zero_imp(x)</code>","text":"<p>Impute the NA values in a series with zeroes and return the series.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series for which the NA values will be imputed.</p> required <p>Returns:</p> Type Description <code>Series</code> <p>The series, with NA values imputed.</p> Source code in <code>src/logos/aggimp/imp_funcs.py</code> <pre><code>def zero_imp(x: pd.Series) -&gt; pd.Series:\n    \"\"\"\n    Impute the NA values in a series with zeroes and return the series.\n\n    Parameters:\n        x: The series for which the NA values will be imputed.\n\n    Returns:\n        The series, with NA values imputed.\n    \"\"\"\n    return x.fillna(0)\n</code></pre>"},{"location":"reference/logos/aggimp/imp_funcs/#logos.aggimp.imp_funcs.no_imp","title":"<code>no_imp(x)</code>","text":"<p>No-op.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>Series</code> <p>The series to be returned.</p> required <p>Returns:</p> Type Description <code>Series</code> <p>The series passed as a parameter.</p> Source code in <code>src/logos/aggimp/imp_funcs.py</code> <pre><code>def no_imp(x: pd.Series) -&gt; pd.Series:\n    \"\"\"\n    No-op.\n\n    Parameters:\n        x: The series to be returned.\n\n    Returns:\n        The series passed as a parameter.\n    \"\"\"\n    return x\n</code></pre>"},{"location":"reference/logos/variable_name/","title":"Index","text":""},{"location":"reference/logos/variable_name/parsed_variable_name/","title":"ParsedVariableName","text":""},{"location":"reference/logos/variable_name/parsed_variable_name/#logos.variable_name.parsed_variable_name.ParsedVariableName","title":"<code>ParsedVariableName</code>","text":"<p>Performs operations on a atring interpreted as a parsed variable name.</p> <p>The relevant string format is {template_id}[_{index}].</p> Source code in <code>src/logos/variable_name/parsed_variable_name.py</code> <pre><code>class ParsedVariableName:\n    \"\"\"\n    Performs operations on a atring interpreted as a parsed variable name.\n\n    The relevant string format is {template_id}[_{index}].\n    \"\"\"\n    def __init__(self, s: str) -&gt; None:\n        \"\"\"\n        Initializes a ParsedVariableName object.\n\n        Parameters:\n            s: The string interpretation of the parsed variable name.\n        \"\"\"\n        toks = s.split(\"_\")\n        self._s = s\n        self._template_id = toks[0]\n        self._index = int(toks[1]) if len(toks) &gt; 1 else -1\n\n    def template_id(self) -&gt; str:\n        \"\"\"\n        Returns the template ID of the parsed variable name.\n\n        Returns:\n            The template ID of the parsed variable name.\n        \"\"\"\n        return self._template_id\n\n    def index(self) -&gt; Optional[int]:\n        \"\"\"\n        Returns the index of the parsed variable name.\n\n        Returns:\n            The index of the parsed variable name, or None if the index is not\n            present.\n        \"\"\"\n        return self._index if self._index != -1 else None\n\n    def str(self) -&gt; str:\n        \"\"\"\n        Returns the string representation of the parsed variable name.\n\n        Returns:\n            The string representation of the parsed variable name.\n        \"\"\"\n        return self._s\n</code></pre>"},{"location":"reference/logos/variable_name/parsed_variable_name/#logos.variable_name.parsed_variable_name.ParsedVariableName.__init__","title":"<code>__init__(s)</code>","text":"<p>Initializes a ParsedVariableName object.</p> <p>Parameters:</p> Name Type Description Default <code>s</code> <code>str</code> <p>The string interpretation of the parsed variable name.</p> required Source code in <code>src/logos/variable_name/parsed_variable_name.py</code> <pre><code>def __init__(self, s: str) -&gt; None:\n    \"\"\"\n    Initializes a ParsedVariableName object.\n\n    Parameters:\n        s: The string interpretation of the parsed variable name.\n    \"\"\"\n    toks = s.split(\"_\")\n    self._s = s\n    self._template_id = toks[0]\n    self._index = int(toks[1]) if len(toks) &gt; 1 else -1\n</code></pre>"},{"location":"reference/logos/variable_name/parsed_variable_name/#logos.variable_name.parsed_variable_name.ParsedVariableName.template_id","title":"<code>template_id()</code>","text":"<p>Returns the template ID of the parsed variable name.</p> <p>Returns:</p> Type Description <code>str</code> <p>The template ID of the parsed variable name.</p> Source code in <code>src/logos/variable_name/parsed_variable_name.py</code> <pre><code>def template_id(self) -&gt; str:\n    \"\"\"\n    Returns the template ID of the parsed variable name.\n\n    Returns:\n        The template ID of the parsed variable name.\n    \"\"\"\n    return self._template_id\n</code></pre>"},{"location":"reference/logos/variable_name/parsed_variable_name/#logos.variable_name.parsed_variable_name.ParsedVariableName.index","title":"<code>index()</code>","text":"<p>Returns the index of the parsed variable name.</p> <p>Returns:</p> Type Description <code>Optional[int]</code> <p>The index of the parsed variable name, or None if the index is not</p> <code>Optional[int]</code> <p>present.</p> Source code in <code>src/logos/variable_name/parsed_variable_name.py</code> <pre><code>def index(self) -&gt; Optional[int]:\n    \"\"\"\n    Returns the index of the parsed variable name.\n\n    Returns:\n        The index of the parsed variable name, or None if the index is not\n        present.\n    \"\"\"\n    return self._index if self._index != -1 else None\n</code></pre>"},{"location":"reference/logos/variable_name/parsed_variable_name/#logos.variable_name.parsed_variable_name.ParsedVariableName.str","title":"<code>str()</code>","text":"<p>Returns the string representation of the parsed variable name.</p> <p>Returns:</p> Type Description <code>str</code> <p>The string representation of the parsed variable name.</p> Source code in <code>src/logos/variable_name/parsed_variable_name.py</code> <pre><code>def str(self) -&gt; str:\n    \"\"\"\n    Returns the string representation of the parsed variable name.\n\n    Returns:\n        The string representation of the parsed variable name.\n    \"\"\"\n    return self._s\n</code></pre>"},{"location":"reference/logos/variable_name/prepared_variable_name/","title":"PreparedVariableName","text":""},{"location":"reference/logos/variable_name/prepared_variable_name/#logos.variable_name.prepared_variable_name.PreparedVariableName","title":"<code>PreparedVariableName</code>","text":"<p>Performs operations on a string interpreted as a prepared variable name.</p> <p>The relevant string format is {template_id}[_{index}][={pre-agg value}]+{aggregate}[={post_agg value}].</p> Source code in <code>src/logos/variable_name/prepared_variable_name.py</code> <pre><code>class PreparedVariableName:\n    \"\"\"\n    Performs operations on a string interpreted as a prepared variable name.\n\n    The relevant string format is {template_id}[_{index}][={pre-agg value}]+{aggregate}[={post_agg value}].\n    \"\"\"\n\n    def __init__(self, s: str) -&gt; None:\n        \"\"\"\n        Initializes a PreparedVariableName object.\n\n        Parameters:\n            s: The string representation of the prepared variable name.\n        \"\"\"\n        mid_split = s.split(\"+\")\n\n        left_split = mid_split[0].split(\"=\")\n        right_split = mid_split[1].split(\"=\") if len(mid_split) &gt; 1 else [\"\", \"\"]\n\n        self._base_var = left_split[0]\n        self._pre_agg_value = left_split[1] if len(left_split) &gt; 1 else \"\"\n        self._aggregate = right_split[0]\n        self._post_agg_value = right_split[1] if len(right_split) &gt; 1 else \"\"\n\n    def base_var(self) -&gt; str:\n        \"\"\"\n        Returns the base variable of the prepared variable name.\n\n        Returns:\n            The base variable of the prepared variable name.\n        \"\"\"\n        return self._base_var\n\n    def template_id(self) -&gt; str:\n        \"\"\"\n        Returns the template ID of the prepared variable name. If the base variable\n        is 'TemplateId', then this will match the pre_agg_value.\n\n        Returns:\n            The template ID of the prepared variable name.\n        \"\"\"\n        if self._base_var == \"TemplateId\":\n            return self._pre_agg_value\n        else:\n            return ParsedVariableName(self._base_var).template_id()\n\n    def index(self) -&gt; Optional[int]:\n        \"\"\"\n        Returns the index of the prepared variable name.\n\n        Returns:\n            The index of the prepared variable name, or None if the index is not\n            present.\n        \"\"\"\n        return ParsedVariableName(self._base_var).index()\n\n    def pre_agg_value(self) -&gt; str:\n        \"\"\"\n        Returns the pre-aggregate value of the prepared variable name.\n\n        Returns:\n            The pre-aggregate value of the prepared variable name.\n        \"\"\"\n        return self._pre_agg_value\n\n    def aggregate(self) -&gt; str:\n        \"\"\"\n        Returns the aggregate of the prepared variable name.\n\n        Returns:\n            The aggregation function implied by the prepared variable name.\n        \"\"\"\n        return self._aggregate\n\n    def post_agg_value(self) -&gt; str:\n        \"\"\"\n        Returns the post-aggregate value of the prepared variable name.\n\n        Returns:\n            The post-aggregate value of the prepared variable name.\n        \"\"\"\n        return self._post_agg_value\n\n    def no_pre_post_aggs(self) -&gt; bool:\n        \"\"\"\n        Check whether the prepared variable has no pre- or post-aggregates.\n\n        Returns:\n            Whether the prepared variable has no pre- or post-aggregates.\n        \"\"\"\n        return self.pre_agg_value() == \"\" and self.post_agg_value() == \"\"\n\n    def has_base_var(self, x: str | Self) -&gt; bool:\n        \"\"\"\n        Check whether the prepared variable has the given base variable.\n\n        Parameters:\n            x: The base variable to check.\n\n        Returns:\n            Whether the prepared variable has the given base variable.\n        \"\"\"\n        return PreparedVariableName.same_base_var(self, x)\n\n    @staticmethod\n    def same_base_var(var1: str | Self, var2: str | Self) -&gt; bool:\n        \"\"\"\n        Check whether two prepared variables have the same base variable.\n\n        Parameters:\n            var1: The first variable to check.\n            var2: The second variable to check.\n\n        Returns:\n            Whether the two variables have the same base variable.\n        \"\"\"\n\n        if isinstance(var1, str):\n            var1 = PreparedVariableName(var1)\n        if isinstance(var2, str):\n            var2 = PreparedVariableName(var2)\n\n        return var1.base_var() == var2.base_var()\n</code></pre>"},{"location":"reference/logos/variable_name/prepared_variable_name/#logos.variable_name.prepared_variable_name.PreparedVariableName.__init__","title":"<code>__init__(s)</code>","text":"<p>Initializes a PreparedVariableName object.</p> <p>Parameters:</p> Name Type Description Default <code>s</code> <code>str</code> <p>The string representation of the prepared variable name.</p> required Source code in <code>src/logos/variable_name/prepared_variable_name.py</code> <pre><code>def __init__(self, s: str) -&gt; None:\n    \"\"\"\n    Initializes a PreparedVariableName object.\n\n    Parameters:\n        s: The string representation of the prepared variable name.\n    \"\"\"\n    mid_split = s.split(\"+\")\n\n    left_split = mid_split[0].split(\"=\")\n    right_split = mid_split[1].split(\"=\") if len(mid_split) &gt; 1 else [\"\", \"\"]\n\n    self._base_var = left_split[0]\n    self._pre_agg_value = left_split[1] if len(left_split) &gt; 1 else \"\"\n    self._aggregate = right_split[0]\n    self._post_agg_value = right_split[1] if len(right_split) &gt; 1 else \"\"\n</code></pre>"},{"location":"reference/logos/variable_name/prepared_variable_name/#logos.variable_name.prepared_variable_name.PreparedVariableName.base_var","title":"<code>base_var()</code>","text":"<p>Returns the base variable of the prepared variable name.</p> <p>Returns:</p> Type Description <code>str</code> <p>The base variable of the prepared variable name.</p> Source code in <code>src/logos/variable_name/prepared_variable_name.py</code> <pre><code>def base_var(self) -&gt; str:\n    \"\"\"\n    Returns the base variable of the prepared variable name.\n\n    Returns:\n        The base variable of the prepared variable name.\n    \"\"\"\n    return self._base_var\n</code></pre>"},{"location":"reference/logos/variable_name/prepared_variable_name/#logos.variable_name.prepared_variable_name.PreparedVariableName.template_id","title":"<code>template_id()</code>","text":"<p>Returns the template ID of the prepared variable name. If the base variable is 'TemplateId', then this will match the pre_agg_value.</p> <p>Returns:</p> Type Description <code>str</code> <p>The template ID of the prepared variable name.</p> Source code in <code>src/logos/variable_name/prepared_variable_name.py</code> <pre><code>def template_id(self) -&gt; str:\n    \"\"\"\n    Returns the template ID of the prepared variable name. If the base variable\n    is 'TemplateId', then this will match the pre_agg_value.\n\n    Returns:\n        The template ID of the prepared variable name.\n    \"\"\"\n    if self._base_var == \"TemplateId\":\n        return self._pre_agg_value\n    else:\n        return ParsedVariableName(self._base_var).template_id()\n</code></pre>"},{"location":"reference/logos/variable_name/prepared_variable_name/#logos.variable_name.prepared_variable_name.PreparedVariableName.index","title":"<code>index()</code>","text":"<p>Returns the index of the prepared variable name.</p> <p>Returns:</p> Type Description <code>Optional[int]</code> <p>The index of the prepared variable name, or None if the index is not</p> <code>Optional[int]</code> <p>present.</p> Source code in <code>src/logos/variable_name/prepared_variable_name.py</code> <pre><code>def index(self) -&gt; Optional[int]:\n    \"\"\"\n    Returns the index of the prepared variable name.\n\n    Returns:\n        The index of the prepared variable name, or None if the index is not\n        present.\n    \"\"\"\n    return ParsedVariableName(self._base_var).index()\n</code></pre>"},{"location":"reference/logos/variable_name/prepared_variable_name/#logos.variable_name.prepared_variable_name.PreparedVariableName.pre_agg_value","title":"<code>pre_agg_value()</code>","text":"<p>Returns the pre-aggregate value of the prepared variable name.</p> <p>Returns:</p> Type Description <code>str</code> <p>The pre-aggregate value of the prepared variable name.</p> Source code in <code>src/logos/variable_name/prepared_variable_name.py</code> <pre><code>def pre_agg_value(self) -&gt; str:\n    \"\"\"\n    Returns the pre-aggregate value of the prepared variable name.\n\n    Returns:\n        The pre-aggregate value of the prepared variable name.\n    \"\"\"\n    return self._pre_agg_value\n</code></pre>"},{"location":"reference/logos/variable_name/prepared_variable_name/#logos.variable_name.prepared_variable_name.PreparedVariableName.aggregate","title":"<code>aggregate()</code>","text":"<p>Returns the aggregate of the prepared variable name.</p> <p>Returns:</p> Type Description <code>str</code> <p>The aggregation function implied by the prepared variable name.</p> Source code in <code>src/logos/variable_name/prepared_variable_name.py</code> <pre><code>def aggregate(self) -&gt; str:\n    \"\"\"\n    Returns the aggregate of the prepared variable name.\n\n    Returns:\n        The aggregation function implied by the prepared variable name.\n    \"\"\"\n    return self._aggregate\n</code></pre>"},{"location":"reference/logos/variable_name/prepared_variable_name/#logos.variable_name.prepared_variable_name.PreparedVariableName.post_agg_value","title":"<code>post_agg_value()</code>","text":"<p>Returns the post-aggregate value of the prepared variable name.</p> <p>Returns:</p> Type Description <code>str</code> <p>The post-aggregate value of the prepared variable name.</p> Source code in <code>src/logos/variable_name/prepared_variable_name.py</code> <pre><code>def post_agg_value(self) -&gt; str:\n    \"\"\"\n    Returns the post-aggregate value of the prepared variable name.\n\n    Returns:\n        The post-aggregate value of the prepared variable name.\n    \"\"\"\n    return self._post_agg_value\n</code></pre>"},{"location":"reference/logos/variable_name/prepared_variable_name/#logos.variable_name.prepared_variable_name.PreparedVariableName.no_pre_post_aggs","title":"<code>no_pre_post_aggs()</code>","text":"<p>Check whether the prepared variable has no pre- or post-aggregates.</p> <p>Returns:</p> Type Description <code>bool</code> <p>Whether the prepared variable has no pre- or post-aggregates.</p> Source code in <code>src/logos/variable_name/prepared_variable_name.py</code> <pre><code>def no_pre_post_aggs(self) -&gt; bool:\n    \"\"\"\n    Check whether the prepared variable has no pre- or post-aggregates.\n\n    Returns:\n        Whether the prepared variable has no pre- or post-aggregates.\n    \"\"\"\n    return self.pre_agg_value() == \"\" and self.post_agg_value() == \"\"\n</code></pre>"},{"location":"reference/logos/variable_name/prepared_variable_name/#logos.variable_name.prepared_variable_name.PreparedVariableName.has_base_var","title":"<code>has_base_var(x)</code>","text":"<p>Check whether the prepared variable has the given base variable.</p> <p>Parameters:</p> Name Type Description Default <code>x</code> <code>str | Self</code> <p>The base variable to check.</p> required <p>Returns:</p> Type Description <code>bool</code> <p>Whether the prepared variable has the given base variable.</p> Source code in <code>src/logos/variable_name/prepared_variable_name.py</code> <pre><code>def has_base_var(self, x: str | Self) -&gt; bool:\n    \"\"\"\n    Check whether the prepared variable has the given base variable.\n\n    Parameters:\n        x: The base variable to check.\n\n    Returns:\n        Whether the prepared variable has the given base variable.\n    \"\"\"\n    return PreparedVariableName.same_base_var(self, x)\n</code></pre>"},{"location":"reference/logos/variable_name/prepared_variable_name/#logos.variable_name.prepared_variable_name.PreparedVariableName.same_base_var","title":"<code>same_base_var(var1, var2)</code>  <code>staticmethod</code>","text":"<p>Check whether two prepared variables have the same base variable.</p> <p>Parameters:</p> Name Type Description Default <code>var1</code> <code>str | Self</code> <p>The first variable to check.</p> required <code>var2</code> <code>str | Self</code> <p>The second variable to check.</p> required <p>Returns:</p> Type Description <code>bool</code> <p>Whether the two variables have the same base variable.</p> Source code in <code>src/logos/variable_name/prepared_variable_name.py</code> <pre><code>@staticmethod\ndef same_base_var(var1: str | Self, var2: str | Self) -&gt; bool:\n    \"\"\"\n    Check whether two prepared variables have the same base variable.\n\n    Parameters:\n        var1: The first variable to check.\n        var2: The second variable to check.\n\n    Returns:\n        Whether the two variables have the same base variable.\n    \"\"\"\n\n    if isinstance(var1, str):\n        var1 = PreparedVariableName(var1)\n    if isinstance(var2, str):\n        var2 = PreparedVariableName(var2)\n\n    return var1.base_var() == var2.base_var()\n</code></pre>"}]}
\ No newline at end of file
diff --git a/sitemap.xml.gz b/sitemap.xml.gz
index 13c0253..372a232 100644
Binary files a/sitemap.xml.gz and b/sitemap.xml.gz differ
diff --git a/stylesheets/extra.css b/stylesheets/extra.css
deleted file mode 100644
index 9c2ee7f..0000000
--- a/stylesheets/extra.css
+++ /dev/null
@@ -1,9 +0,0 @@
-[data-md-color-scheme="logos-light"] {
-    --md-primary-fg-color:        #7F9FBA;
-    --md-default-bg-color:        #FFFFFF;
-}
-
-[data-md-color-scheme="logos-dark"] {
-    --md-primary-fg-color:        #7F9FBA;
-    --md-default-bg-color:        #394853;
-}
\ No newline at end of file