Skip to content

jiaxiaogang/he4o

Repository files navigation

he4o系统

he4o是一个螺旋熵减机,是一种通用人工智能(AGI)系统:

  1. 机器学习支持:
    • 迁移学习为主
    • 强化学习为辅
  2. 知识表征宏微支持:
    • 稀疏码
    • 特征
    • 概念
    • 时序
    • 价值
  3. 神经网络支持:动态、模糊、抽具象、组与分、感理性。
  4. 支持智能体自主终身动态学习。
  5. 无论宏观框架还是微观细节设计,都依从相对与循环转化。
  6. 思维控制支持:
    • 出入 (行为 & 感知) //含反馈
    • 认知 (识别 & 学习) //含类比
    • 需求 (任务 & 计划) //含意向
    • 决策 (求解 & 迁移) //含分析
  7. 数理:
    • 集合论(迁移)
    • 概率论(强化)
  8. 计算:使用最简单的bool运算:类比评价
  9. 记忆结构:长时为网(启发式)、短时为树(递归)、瞬时为序(依次)。
  10. 编程思想:DOP (面向动态编程:知识由后天演化,先天仅编写控制器和存储结构)。
  11. 性能要求:可运行于单机终端(当前是ios设备)。

手稿:https://github.com/jiaxiaogang/HELIX_THEORY
网站:https://jiaxiaogang.github.io
文档:https://james4ever0.github.io/he4o 由James4Ever0提供,感谢❤

License

1. -------------引言-------------

第一梯队:1950年图灵提出"可思考的机器"和"图灵测试",他说:"放眼不远的将来,我们就有很多工作要做";

第二梯队:1956达特矛斯会议后,明斯基和麦卡锡等等许多前辈穷其一生心血,虽然符号主义AI在面对不确定性环境下鲁棒性差,但却为AGI奠定了很多基础。

第三梯队:随着大数据,云计算等成熟,AI迎来DL、GPT热,但DL、GPT也并非全功能型智能体。

综上:近70年以来,人工智能研究跌宕起伏,但与最初设想的AI还相差甚远,he4o旨在实现螺旋熵减机式的通用人工智能系统。


2. -------------(一)螺旋论-------------

  螺旋论从2017年2月正式开始研究至2018年2月成熟,历时一年。

螺旋论:含三大要素:定义、相对和循环,共同呈现螺旋形。
https://github.com/jiaxiaogang/HELIX_THEORY#%E7%86%B5%E5%87%8F%E6%9C%BA

3. -------------(二)螺旋熵减机模型-------------

螺旋熵减机理论模型在18年3月成熟,直至今天此模型仍在不断细化中。

1. 此图从内外双向、动静转化、主客角度,三种方式来解读。
2. 每外一个模块,与内所有模块之和相对循环 (如神经网络与思维,智能体与现实世界)
注: 一切都是从无到有,相对与循环,he4o认为自己活着 源于循环;

4. -------------(三)he4o系统实践-------------

V1.0《初版》:
  2017年2月立项 - 2018年10月21日正式落地发布V1.0版本。
V2.0《小鸟生存演示》:
  2018年11月 - 至今 开发完成,测试训练中...

架构图
架构设计 由螺旋论展开成螺旋熵减机模型,再由螺旋熵减机模型展开为系统架构
代码占比 内核代码中神经网络占30%,思维控制器占50%,其它(输入、输出等)共占20%;
神经网络 神经网络的模型十字总结:横向宏与微,纵向抽具象;
思维向性 每一种操作方向表示一种思维操作,如:认知、决策、理性、感性。
思维模块 1分2分4分8: 感知(入),识别(认),学习(知),任务(需),计划(求),求解(决),迁移(策),行为(出)
思维架构 思维控制器整体呈现螺旋形运行

5. -------------DEMO演示-------------

1 多向飞吃
说明 在这个DEMO中,它已通过交互学习,知道饿了吃坚果可以解决饥饿问题,也通过交互学习到飞行可以解决距离问题,在扔出坚果后,它会自行飞过去吃掉以解决饥饿问题;
操作 在这个DEMO中,我投喂了两个坚果,并且点击了模拟饥饿(因为等手机掉电太慢了,很多时候我用模拟器跑,更不会掉电),别的都是它自己行为;
2 安全第一
说明 在这个DEMO中,在前面的交互中它被撞了一次,导致后面一看到飞过来的木棒,就立马躲开,并且再也不飞到下面了,即使扔坚果它也不去吃;
操作 我可以用双击向下拉它,但它自己会立马躲上去,我也可以手动投喂坚果,但它依然会自己躲开不过去;
3 变向觅食
说明 在这个DEMO中,它会自动尝试飞到坚果处,并且吃掉,但它离的很近时尝试吃却没吃到,然后又思考了下,再飞近,才吃到坚果;
操作 在这个DEMO中,我扔了坚果,点击了模拟饥饿,别的全是它自己的思考和行为;
4 先躲再吃
说明 在这个DEMO中,它在饥饿后,准确去吃,但此时看到木棒,立马又躲返回来,等到木棒过去安全后,又飞上去吃坚果;
操作 坚果我扔的,饥饿我点的,木棒我扔的,别的全它自己;
5 初用工具
说明 在这个DEMO中,它可以通过踢行为来将带皮的坚果踢到路上,等木棍滚过压破皮后(初级使用工具功能),它再飞过去吃掉;
操作 带皮坚果我扔的,饥饿我点的,木棒我扔的,别的全它自己;

6. -------------付费声明-------------

付费:本软件是付费软件,分为使用付费和商业付费两个部分:

  1. 使用付费的价格=需每年支付使用者平均一顿午餐的费用进行支付。
    如果使用者的收入低于所在城市(地区)平均收入,则无需支付该项。

  2. 商业付费的价格=该软件为基础创造的商业营收的0.1%进行支付。
    如未创造营收,则无需支付该项。

打赏:您也可以对我进行打赏,以帮助我有更多资金与精力投入到该系统的研发,非常感谢。

  • 2024.06 感谢REmaiin(熬时间少年的你?) 10.6元
  • 2024.12 感谢REmaiin 66元


7. -------------时间线-------------

2024.11.21 至今
  • 回测:继续试错训练
2024.10.11 耗时40天
  • 回测:继续试错训练测得二次过滤后,多样性消失BUG时序识别似层化迭代迁移: 学时即推举 & 用时只继承子即父,父非子I/F综合稳定性计算
2024.09.10 耗时30天
  • 迭代细节:迭代Canset类比算法整修outSPDic的BUGTCPlan支持反思R子任务启用迭代前段条件满足迭代时序全含算法
2024.08.09 耗时30天
  • 综合训练:连续多向觅食打开protoFo的全局防重完善TCPlanV2流程细节试错训练广传染&窄计数
2024.07.20 耗时19天
  • 回测训练:训练用搬运微调:多触发Canset类比抽象
2024.07.06 耗时14天
  • 迭代TCPlanV2 & 连续视觉:训练用搬运(失败)迭代TCPlanV2训练用搬运(成功但不稳定)连续视觉
2024.05.25 耗时40天
  • 回测训练:测试支持OutSPDic训练无皮果动机ok训练Canset试错训练ok训练学去皮ok训练有皮果动机ok微调:持续价值感的任务的失效机制调整为-负mv反馈后任务不失效训练学搬运
2024.05.10 耗时15天
  • Canset的传染机制:Canset的传染机制: 批量判断否和批量唤醒
2024.04.25 耗时15天
  • 测训&修细节:概念识别BUG导致feedbackTOR不成立迭代convert2RCansetModel()算法:1.优化条件满足判断 2.候选池宽入100%激活
2024.04.10 耗时15天
  • Canset的IndexDic:HCanset的IndexDic收集与计算
2024.03.12 耗时28天
  • 训练测试:回测实时竞争和HSolutionV3
2024.02.15 耗时25天
  • 迭代hSolutionV3:迭代hSolutionV3迭代迁移: 综合indexDic计算 & 推举继承合并
2024.01.10 耗时25天
  • 解决方案实时竞争:支持持续反馈 & 持续反馈评价Cansets实时竞争迭代TCPlanV2
2023.12.28 耗时12天
  • 搬运训练:搬运动机训练学会搬运运用搬运Root竞争进度分加权hCanset迁移优化: 基于r场景树和hAlg抽具象树实现迁移
2023.11.09 耗时49天
  • 搬运训练:搬运动机训练交层Canset训练规划搬运训练步骤迁移时连带迁移SP值构建Canset改为场景内防重同质任务执行太多次问题: 同质Root合并决策性能优化(15s至1s)
2023.10.17 耗时22天
  • 去皮训练:整理Canset演化过程废弃Canset识别类比加重Canset预想与实际类比全面支持cansetAlg的共同抽象即匹配预想与实际类比中的实际fo: 采用pFo.realMaskFo生成
2023.09.07 耗时40天
  • 去皮训练:H任务支持TCScene & TCCanset & TCTransferHCanset由R场景改为单独场景优化去皮训练步骤
2023.08.16 耗时20天
  • 去皮训练:学会去皮训练步骤设计与实施
2023.07.30 耗时17天
  • 去皮训练:去皮动机
2023.07.16 耗时14天 其中测试7天
  • 多线程思维:思维用TI和TO两个线程回归测训
2023.06.29 耗时17天
  • 测父子任务:迭代TCRefrection反思: 改到行为化前反思识别二次过滤器
2023.06.01 耗时28天
  • 防撞和觅食训练,等安全再吃训练:性能优化防撞训练ok觅食训练ok防撞觅食联合训练ok持续饥饿感
2023.05.25 耗时7天
  • 识别准确度提升:识别二次过滤器
2023.05.07 耗时18天
  • 回测Solution数据流竞争演化情况:训练测试稳定的scene演化过程迭代solutionFoRank排名器
2023.05.03 耗时4天
  • 梳理TO数据流:Solution竞争断层: 宽入窄出solutionCanset过滤器solutionScene过滤器
2023.04.20 耗时12天
  • Canset迁移性增强回测:修复canset迁移后支持indexDic等BUG
2023.04.02 耗时18天
  • 提升Canset迁移性决策部分:Canset迁移性增强的决策支持TCScene场景树TCCanset.override算法TCRealact可行性TCTransfer推举和继承算法相应更新SPEFF
2023.03.21 耗时11天
  • 提升Canset迁移性认知部分:外类比支持匹配度共同点构建新Canset优先用场景alg迭代Canst识别&全含判断Canst外类比Canst空概念抽象Canset初始SPEFFCanset识别支持AIFilter回测Canset迁移性
2023.03.09 耗时12天
  • 训练:觅食和防撞训练特征主观恒常性Canset惰性期测得Canset迁移性差问题
2023.02.26 耗时13天
  • 优化:测决策循环连续飞躲反思子任务不求解BUG_行为转任务死循环BUG_静默任务被激活调整过滤器提升识别准确度觅食训练规划:mv进时序(未完成)增加迁移性与识别准确度:废除客观特征
2023.02.14 耗时12天
  • 优化:使取S越来越准识别率低BUG支持AIFilter过滤器
2023.02.04 耗时10天
  • 回测:测试条件满足功能回测项大整理修复R任务的Canset再类比时机与条件判断BUG
2023.01.03 耗时12天 (含测试12天,中途春节休7天)
  • 优化:迭代canset前段条件满足使概念识别越来越准修复前段条件满足不完全的问题
2022.12.17 耗时16天
  • AIRank:概念识别和时序识别的综合竞争: 支持强度竞争回测
2022.11.30 耗时17天
  • 二十测:回归测试
2022.10.15 耗时45天
  • 优化:抽具象多层多样性优化持久化与复用概念相似度迭代时序识别:持久化与复用indexDiccanset演化周期废除TO反思识别
2022.10.08 耗时7天
  • 测试:废弃isMem继续测试反思
2022.09.18 耗时12天
  • 测试:测试任务失效机制
2022.09.01 耗时17天
  • 调优:任务失效机制
2022.08.06 耗时25天
  • 测试:测试TCRefrection性能优化
2022.07.05 耗时22天 中途旅游休8天
  • 十九测:迭代TCRefrection反思
2022.06.05 耗时9天 中途疫情休20天
  • 梳理TC数据流:决策配置调整: 快慢思考部分学时统计 & 用时概率测连续飞躲Analyst综合排名
2022.05.20 耗时15天
  • 梳理TC数据流:识别准确度优化:逐层宽入窄出数据流:整体观快思考慢思考TCActYes每帧O反省
2022.05.11 耗时9天
  • 性能优化:优化pFo识别性能迭代Demand支持多pFos十八测回归测试
2022.05.04 耗时7天
  • 工具优化:十七测强化训练工具优化:支持模拟重启思维可视化工具优化:支持手势缩放
2022.04.28 耗时6天
  • 梳理TC数据流:整体兼顾各线竞争
2022.04.23 耗时5天
  • 十六测:性能优化强化学习训练
2022.03.28 耗时8天 中途疫情休17天
  • 强化训练:开发强化学习稳定性训练器: RLTrainer
2022.03.13 耗时15天
  • 思维可视化工具:TOMVisionV2迭代: 思维可视化
2022.02.16 耗时25天 中途春节疫情休25天
  • 十五测:春节结束,开工回归测试
2022.01.15 耗时5天
  • 十四测:回测相近匹配
2022.01.10 耗时5天
  • 相近匹配:相近匹配
2021.12.26 耗时15天
  • 回归十三测:新螺旋架构测试反省分裂迭代测试
2021.12.22 耗时4天
  • 反省迭代:hSolution从SP取解决方案分裂:感性反省 和 理性反省废弃HN
2021.11.18 耗时34天
  • 思维控制器架构大迭代:完善螺旋架构废弃宏微决策反思融入识别工作记忆树迭代迭代综合评价末枝最优路径
2021.11.04 耗时14天
  • R决策模式迭代:FRS评价器迭代废弃dsFo废弃PM废弃GL
2021.10.19 耗时15天
  • PM稳定性迭代:VRS评价器迭代VRSTarget修正目标
2021.09.29 耗时20天
  • v2.0十二测与训练:IRT的SP参与VRS评分SP定义由顺逆改为好坏紧急状态不反思主客观互卡问题tir_OPushM迭代:IRT的理性失效
2021.09.14 耗时15天
  • 网络节点类型排查:指针集成type自检测试网络at&ds&type错误大排查
2021.07.08 耗时66天
  • v2.0十一测与训练:子任务回测R决策模式防撞训练
2021.06.25 耗时13天
  • 子任务细节改动:子任务的已发生截点同级任务协作
2021.06.05 耗时17天
  • 子任务细节改动:子任务协同子任务不应期
2021.05.24 耗时1个月
  • v2.0十测与训练:子任务测试防撞训练
2021.04.10 耗时44天
  • v2.0九测与训练:觅食训练&变向觅食训练
2021.04.07 耗时15天
  • HNGL嵌套迭代:内中外类比迭代v3,v4迭代getInnerV3()RFo抽具象关联
2021.03.12 耗时20天
  • v2.0八测与训练:R-模式测试觅食和防撞融合训练
2021.02.23 耗时37天
  • 决策理性迭代:规划决策子任务迭代:理性反思来的及评价嵌套关联
2021.01.30 耗时4天
  • R-决策模式V3迭代、反向反馈外类比
2021.01.23 耗时35天
  • v2.0七测与训练 防撞训练R-模式测试
2021.01.15 耗时8天
  • In反省类比迭代、R-决策模式V2迭代 迭代触发机制: 生物钟触发器
2020.12.24 耗时20天
  • v2.0六测与训练 多向飞行正常
2020.12.07 耗时1个月
  • AIScore评价器整理完善:时序理性评价:FRS稀疏码理性评价:VRS
2020.11.07 耗时1个月
  • v2.0五测与训练
2020.10.21 耗时15天
  • TIR_Alg支持多识别
2020.09.01 耗时1个月
  • v2.0四测与训练
2020.08.12 耗时27天
  • Out反省类比迭代 (DiffAnalogy)、生物钟(AITime)、PM理性评价迭代v2
2020.06.28 5天
  • 决策迭代:PM理性评价
2020.06.06 耗时2个月
  • v2.0三测与训练
2020.05.15 耗时20天
  • 决策迭代:(根据输出期短时记忆使决策递归与外循环更好协作)
2020.04.21 耗时1个月
  • 决策迭代:(根据输入期短时记忆使决策支持四模式)
2020.03.31 耗时1个月
  • 迭代外类比: 新增反向反馈类比 (In反省类比) (构建SP正负时序、应用SP于决策的MC中、迭代反思)
2020.02.20 耗时18天
  • 稀疏码模糊匹配
2019.12.27 持续3个月
  • v2.0二测与规划性训练--回归小鸟训练
2019.11.22 耗时1个月
  • 理性思维——反思评价
2019.09.30 耗时2个月
  • 理性思维——TOR迭代 (行为化架构迭代、支持瞬时网络)
2019.08.25 耗时1个月
  • 理性思维——TIR迭代 (时序识别、时序预测、价值预判)
2019.06.20 耗时2个月
  • v2.0版本基础测试改BUG 与 训练
2019.06.05 写完耗时15天,调至可用性达到标准至45天
  • v2.0一测--小鸟训练——神经网络可视化v2.0
2019.05.01 耗时1个月
  • 优化性能——XGWedis异步持久化短时内存网络
2019.03.01 耗时2个月
  • 内类比 (与外类比相对)
2019.01.21 耗时40天
  • 迭代决策循环 (行为化等)
2018.11.28 耗时2个月
  • 迭代神经网络 (区分动态时序与静态概念)
2018.11.05 规划耗时20天
  • 势 (小鸟生存演示) (v2.0开始开发)
2018.10.21 耗时0天
  • v1.0.0 (he4o内核发布)
2018.10.20 耗时0天
  • 螺旋熵减机 (产生智能的环境)
2018.08.29 耗时2个月
  • MOL
2018.08.01 耗时1个月
  • MIL & MOL (重构中层动循环)
2018.07.01 耗时1个月
  • HELIX (定义、相对和循环呈现的螺旋型)
2018.06.01 耗时1个月
  • 三层循环大改版 (mv循环,思维网络循环,智能体与现实世界循环)
2018.05.01 耗时1个月
  • 相对 (he4o实现定义,横向相对,纵向相对)
2018.02.01 耗时3个月
  • 宏微 (前身是拆分与整合,宏微一体)
2017.12.09 耗时2个月
  • 定义 (从0到1)
2017.11.10 耗时1个月
  • 规则 (最简)
2017.09.20 耗时50天
  • DOP_面向数据编程
  • GNOP_动态构建网络
2017.08.23 耗时1个月
  • 神经网络 (算法,抽具象网络)
2017.08.02 耗时20天
  • MindValue(价值)
2017.07.10 耗时20天
  • 树BrainTree(参考N3P7,N3P8)
2017.06.01 耗时40天
  • 三维架构(参考笔记/AI/框架)
2017.05.22 耗时10天
  • OOP编程思想->数据语言 (OOP2DataLanguage)
2017.05.21 耗时1天
  • 重绘了新版架构图; (AIFoundation)
2017.04.21 耗时1个月
  • 金字塔架构
2017.03.21 耗时1个月
  • 分层架构
2017.02.21 耗时1个月
  • 流程架构