basic_dna 0232

ExSan++

ExSan  and Bioinformatics

Text analysis, also called text mining or textual analysis, is the automated process of classifying and extracting text data using AI. A text analysis model can read and understand text in an ExSan spreadsheet, and structures it automatically.

This job: reads Genoma file and does statistics, search of string

  1     ExSan++ High Perfomance C++ Computing _V22_17.1.6@04.21.python

  3                                                         Mon May  2 08:38:03 2022

  4 

  5 

  6     exsan.plusplus@gmail.com   https://twitter.com/#!/ExSan_com

  7     JOB:  basic_dna3803

  8 

  9     Data File:  c:\exsan\exsan_data\DNA_FA_0001.txt

 10 

 11a     1st_line TAAACAAGCAGTAGTAATTCCTGCTTTATCAAGATAATTTTTCGACTCATCAGA

 11b     1st_line AAATATCCGAAAGTGTTAACTTCTGCGTCATGGAAGCGATAAAACTC

 12 

 13     size strand 100

 14 

 15     total strands 1000

 16 

 17a     last_line B@DFEFFFGEGGGFGHHHGGFGFGFIHGEGEHGHHGHGGEHBHF@HCIHEHEGHGGGCFGGBH

 17b     last_line HIHHGHFHHFGDJJDGIFHGKHGGFG>GHDFIFGEED

 18 

 19     strand size 100

 20 

 21     Generate Exsan ( 10 ,  10 )

 22 

 23     Basis

 24     WORKSHEET 1  A[10, 10] CHAR

 25          A B C D E F G H I J 

 26          >------------------------------<

 27       1:T A A A C A A G C A 

 28       2:G T A G T A A T T C 

 29       3:C T G C T T T A T C 

 30       4:A A G A T A A T T T 

 31       5:T T C G A C T C A T 

 32       6:C A G A A A T A T C 

 33       7:C G A A A G T G T T 

 34       8:A A C T T C T G C G 

 35       9:T C A T G G A A G C 

 36      10:G A T A A A A C T C 

 37          <------------------------------>

 38 

 39     WORKSHEET 2  B[10, 10] CHAR

 40          A B C D E F G H I J 

 41          >------------------------------<

 42       1:A A C A A G C A G T 

 43       2:A G T A A T T C C T 

 44       3:G C T T T A T C A A 

 45       4:G A T A A T T T T T 

 46       5:C G A C T C A T C A 

 47       6:G A A A T A T A C G 

 48       7:A A A G T G T T A A 

 49       8:C T T C T G C G T C 

 50       9:A T G G A C A C G A 

 51      10:A A A A A C T C C C 

 52          <------------------------------>

 53 

 54     WORKSHEET 999[10, 10]

 55          A B C D E F G H I J 

 56          >------------------------------<

 57       1:G C G G C G C A A C 

 58       2:C T G T G A C G A C 

 59       3:A A A T C T G C T C 

 60       4:A A A T T T A T G C 

 61       5:G C G C T T C G A T 

 62       6:A A A A A T G A T T 

 63       7:G G C G T A T C C A 

 64       8:A C C T G C A G A G 

 65       9:T T T T A T C G C T 

 66      10:T C C A T G A C G C 

 67          <------------------------------>

 68 

 69     WORKSHEET 1000[10, 10]

 70          A B C D E F G H I J 

 71          >------------------------------<

 72       1:C G A G C T G C G C 

 73       2:A A G G A T A G G T 

 74       3:C G A A T T T T C T 

 75       4:C A T T T T C C G C 

 76       5:C A G C A G T C C A 

 77       6:C T T C G A T T T A 

 78       7:A T T C G T A A A C 

 79       8:A A G C A G T A G T 

 80       9:A A T T C C T G C T 

 81      10:T T A T C A A G A T 

 82          <------------------------------>

 83 

 84     Qualities

 85     WORKSHEET 1  A[10, 10] PIX

 86           A   B   C   D   E   F   G   H   I   J 

 87          >------------------------------<

 88       1: 33  31  35  37  36  37  37  37  38  36 

 89       2: 38  38  38  39  36  39  38  39  38  39 

 90       3: 38  38  38  38  39  40  37  38  37  40 

 91       4: 37  39  40  34  37  38  39  38  39  38 

 92       5: 41  38  39  37  38  39  38  40  39  36 

 93       6: 39  38  38  39  41  38  37  36  37  39 

 94       7: 38  39  36  38  38  39  39  38  39  40 

 95       8: 37  38  37  38  35  40  37  38  38  37 

 96       9: 38  38  38  37  39  38  38  38  39  38 

 97      10: 38  38  32  38  40  37  38  38  34  38 

 98          <------------------------------>

 99 

100     WORKSHEET 2  B[10, 10] PIX

101        A   B   C   D   E   F   G   H   I   J 

102          >------------------------------<

103       1: 28  31  31  34  36  33  37  31  33  38 

104       2: 33  38  21  38  37  16  36  27  15  19 

105       3: 34  18  36  22  36  13  24  38  28  39 

106       4: 27  39  25  39  39  26  39  33  39  26 

107       5: 38  21  24  37  22  11  22  35  38   7 

108       6:  7  36  38  23  32  23  11  12  20  12 

109       7: 23  11  30  11  11  11  32  36  29  34 

110       8: 11  33  30  11  11  11  21  19   3  32 

111       9: 34   6  10   6  28   6  10  19   6  18 

112      10:  9  19  10  36  18  17  17   9   6   7 

113          <------------------------------>

114 

115     WORKSHEET 999[10, 10]

116        A   B   C   D   E   F   G   H   I   J 

117          >------------------------------<

118       1: 14  31  35  34  31  33  37  35  38  33 

119       2: 38  31  38  21  36  29  32  33  38  39 

120       3: 38  37  37  38  35  40  38  38  37  37 

121       4: 36  39  37  35  39  38  11  37  33  36 

122       5: 38  34  36  35  31  39  38  37  39  36 

123       6: 32  36  35  39  38  38  22  33  37  32 

124       7: 23  22  30  38  22  30  37  36  35  37 

125       8: 39  29  35  38  21  40  33  38  38  37 

126       9: 19  34  38  29  34  38  38  36  35  35 

127      10: 38  38  38  17  18  24  30  34  26  31 

128          <------------------------------>

129 

130     WORKSHEET 1000[10, 10]

131        A   B   C   D   E   F   G   H   I   J 

132          >------------------------------<

133       1: 33  31  35  37  36  37  37  37  38  36 

134       2: 38  38  38  37  38  39  39  39  38  38 

135       3: 37  38  37  38  37  40  39  38  36  38 

136       4: 36  39  38  39  39  38  39  38  38  36 

137       5: 39  33  39  37  31  39  34  40  39  36 

138       6: 39  36  38  39  38  38  38  34  37  38 

139       7: 38  33  39  39  40  39  39  38  39  37 

140       8: 39  39  37  38  35  41  41  35  38  40 

141       9: 37  39  38  42  39  38  38  37  38  29 

142      10: 38  39  35  37  40  37  38  36  36  35 

143          <------------------------------>

144 

145     Total counter =  100000 

146a    n_A =  28426 n_C =  21890 n_G =  19147 

146b n_T =  30531 n_N =  6   total:  100000 ***n_GC =  41037

147 

148     %  A:  28.43   C:  21.89   G:  19.15   T:  30.53   N:  0.006

149 

150     check-sum->  1

151 

152     Qualities min =  0   max =  43   range:  43

153 

154     delta_Q:  43

155 

156     Histogram of Qualities( 0  <-->  43 ):

157 

158     0.046 %  0 - 4 :    

159 

160     0.552 %  4 - 8 :    

161 

162     1.472 %  8 - 12 :    *

163 

164     1.487 %  12 - 17 :    *

165 

166     1.861 %  17 - 21 :    *

167 

168     2.231 %  21 - 25 :    **

169 

170     9.051 %  25 - 30 :    *********

171 

172     63.4 %  30 - 34 :    ***************************************************************

173 

174     19.83 %  34 - 38 :    *******************

175 

176     0.07 %  38 - 43 :    

177 

178     Search this Random String length:  11  --->  AGCCTCATGGG 

179 

180     Search this Random String length:  11  --->  TACTGACAAAA 

181 

182     Search this Random String length:  9  --->  CAGCGTTGG 

183 

184     Search this Random String length:  8  --->  GGCTCGCA 

185 

186     Search this Random String length:  10  --->  AAATGCCTCA 

187 

188     Search this Random String length:  8  --->  AAACAATT 

189 

190     Search this Random String length:  9  --->  CGCTAACAA 

191 

192     Search this Random String length:  9  --->  AAACACCTG 

193 

194     Search this Random String length:  12  --->  GGATGTGCTATT 

195 

196     Search this Random String length:  8  --->  ATTGGTGG 

197 

198     Search this Random String length:  9  --->  GCTACAGCG 

199 

200     Search this Random String length:  12  --->  AGTCATACGAAG 

201 

202     Search this Random String length:  9  --->  AGATTCAAT 

203 

204     Search this Random String length:  9  --->  ACGGTTTAG 

205 

206     Search this Random String length:  10  --->  TGGAAAGACA 

207 

208     Search this Random String length:  10  --->  ATAGTAACTG 

209 

210     Search this Random String length:  8  --->  TACAATGA 

211 

212     Search this Random String length:  9  --->  TGGCACGAT 

213 

214     Search this Random String length:  11  --->  AATACCCGAGG 

215 

216     Search this Random String length:  10  --->  ATGTACGCAT 

217 

218     Search this Random String length:  12  --->  ATGTAGTTAGTA 

219 

220     Search this Random String length:  11  --->  TCGAAAGTAGC 

221 

222     Search this Random String length:  11  --->  TATCCGCGAGG 

223 

224     Search this Random String length:  12  --->  TATCACCTCAAT 

225 

226     Search this Random String length:  9  --->  GTAGGTTCA 

227 

228     Search this Random String length:  10  --->  TAGTTAAACT 

229 

230     Search this Random String length:  12  --->  CAACCCGGTTTT 

231 

232     Search this Random String length:  8  --->  GACACATC 

233 

234     Search this Random String length:  10  --->  TGGTTACCGG 

235 

236     Search this Random String length:  10  --->  TCATCAGCTA 

237 

238     Search this Random String length:  11  --->  GGAGTGGGTGC 

239 

240     Search this Random String length:  12  --->  CTATCTTTTCGT 

241 

242     Search this Random String length:  9  --->  GGTGCTGCC 

243 

244     Search this Random String length:  10  --->  CTTTTCAGCC 

245 

246     Search this Random String length:  11  --->  GCACCCCCCAG 

247 

248     Search this Random String length:  8  --->  CTTTCCCC 

249 

250     Search this Random String length:  9  --->  CGGGGAGTT 

251 

252     Search this Random String length:  9  --->  AGGACTGAT 

253 

254     Search this Random String length:  10  --->  ACAAACACGA 

255 

256     Search this Random String length:  12  --->  GAGGGCGTCCTT 

257 

258     Search this Random String length:  12  --->  GGAGGTAAGGTT 

259 

260     Search this Random String length:  11  --->  GTTGTTGGCCC 

261 

262     Search this Random String length:  8  --->  GCTTACAT 

263 

264     Search this Random String length:  12  --->  GCGGGTTCGGAT 

265 

266     Search this Random String length:  12  --->  TTGGCGCTCACA 

267 

268     Search this Random String length:  10  --->  CCTAACGTGT 

269 

270     Search this Random String length:  8  --->  ACACATTA 

271 

272     Search this Random String length:  9  --->  TACACGCGT 

273 

274     Search this Random String length:  11  --->  AGTATCTGGAG 

275 

276     Search this Random String length:  8  --->  GTACAAAG 

277 

278     Search this Random String length:  11  --->  TTGCGTGAAGA 

279 

280     Search this Random String length:  11  --->  AAGTCGAGGAA 

281 

282     Search this Random String length:  12  --->  CTCGATCCGGGA 

283 

284     Search this Random String length:  11  --->  CAACAGTAGTT 

285 

286     Search this Random String length:  8  --->  TTAACCAC 

287 

288     Search this Random String length:  11  --->  ATCACGGCGCG 

289 

290     Search this Random String length:  9  --->  TGTTACTAA 

291 

292     Search this Random String length:  10  --->  TGCGGCCGAT 

293 

294     Search this Random String length:  10  --->  TACACATTGG 

295 

296     Search this Random String length:  9  --->  TCCATTGGT 

297 

298     Search this Random String length:  10  --->  GTGAGCTTTA 

299 

300     Search this Random String length:  10  --->  GCGATAGAAT 

301 

302     Search this Random String length:  12  --->  ATAGCCTGTAAC 

303 

304     Search this Random String length:  8  --->  CTCCTCTA 

305 

306     Search this Random String length:  11  --->  AAGCGTTCGAT 

307 

308     Search this Random String length:  10  --->  AACTGTAAGC 

309 

310     Search this Random String length:  8  --->  GGGGCGTG 

311 

312     Search this Random String length:  9  --->  CCATTGGTA 

313 

314     Search this Random String length:  9  --->  TTTCCTTAG 

315 

316     Search this Random String length:  12  --->  CCCATAGAGACT 

317 

318     Search this Random String length:  11  --->  CCACGTCTCTC 

319 

320     Search this Random String length:  10  --->  TCTTTCCCCA 

321 

322     Search this Random String length:  8  --->  TTTCTACT 

323 

324     Search this Random String length:  12  --->  TAAGGTGGCATT 

325 

326     Search this Random String length:  12  --->  AGGGATAAGTTG 

327 

328     Search this Random String length:  9  --->  CTGCGTCCG 

329 

330     Search this Random String length:  10  --->  GGAATCGTTA 

331 

332     Search this Random String length:  10  --->  CTAGATGATC 

333 

334     Search this Random String length:  9  --->  TGTTCCGCC 

335 

336     Search this Random String length:  9  --->  TTCAGACTA 

337 

338     Search this Random String length:  10  --->  TTGGGCCGCC 

339 

340     Search this Random String length:  11  --->  GAAGTTCGAGA 

341 

342     Search this Random String length:  12  --->  GTTGTGCGTCCT 

343 

344     Search this Random String length:  12  --->  GTAGAGCGCCGC 

345 

346     Search this Random String length:  10  --->  TCTCACTACT 

347 

348     Search this Random String length:  8  --->  AGACACCC 

349 

350     Search this Random String length:  8  --->  CTATTTTT 

351 

352     Search this Random String length:  11  --->  CGCTGTTCAGG 

353 

354     Search this Random String length:  11  --->  ATCTGCTCCAG 

355 

356     Search this Random String length:  12  --->  GTGGCTCGTGCG 

357 

358     Search this Random String length:  8  --->  CGCATCAC 

359 

360     Search this Random String length:  11  --->  GGGAGCCGAGC 

361 

362     Search this Random String length:  12  --->  CTGACTGCACCG 

363 

364     Search this Random String length:  11  --->  ATTCTGTCGCC 

365 

366     Search this Random String length:  10  --->  CACACGCGTG 

367 

368     Search this Random String length:  12  --->  CAAGGCTATGTT 

369 

370     Search this Random String length:  9  --->  CGTCATCTG 

371 

372     Search this Random String length:  12  --->  AGGTTCCCACGA 

373 

374     Search this Random String length:  8  --->  ATTAACTA 

375 

376     Search this Random String length:  11  --->  ATAGCACACGG 

377 

378     Search this Random String length:  12  --->  GAAACAGTCAGG 

379 

380     Search this Random String length:  11  --->  GGAACTCAAAC 

381 

382     Search this Random String length:  9  --->  CCTGCATCT 

383 

384     Search this Random String length:  9  --->  ATTCATAGC 

385 

386     Search this Random String length:  9  --->  GTGTAGTTG 

387 

388     Search this Random String length:  10  --->  ACTTAATTGT 

389 

390     Search this Random String length:  12  --->  GACTCTCTGGAC 

391 

392     Search this Random String length:  9  --->  TCCTAAGTG 

393 

394     Search this Random String length:  12  --->  GGCTCTGCATCG 

395 

396     Search this Random String length:  10  --->  AGTCCTTTGT 

397 

398     Search this Random String length:  12  --->  CATCTAGTAGTG 

399 

400     Search this Random String length:  12  --->  TAGAGATTCCTT 

401 

402     Search this Random String length:  10  --->  ACTGCCTGTG 

403 

404     Search this Random String length:  9  --->  TGTAGGGGG 

405 

406     Search this Random String length:  11  --->  GACTAGCTGCA 

407 

408     Search this Random String length:  9  --->  GACAGGACG 

409 

410     Search this Random String length:  10  --->  GGTGGCTCTA 

411 

412     Search this Random String length:  10  --->  TTCTTGTATC 

413 

414     Search this Random String length:  12  --->  GACCAACCACTT 

415 

416     Search this Random String length:  12  --->  CTTTTACTCGTA 

417 

418     Search this Random String length:  10  --->  ACGGTTAGAT 

419 

420     Search this Random String length:  9  --->  AACCCAATC 

421 

422     Search this Random String length:  11  --->  ATCAAGGAGGT 

423 

424     Search this Random String length:  9  --->  AATTATCAC 

425 

426     Search this Random String length:  8  --->  TAGCAGGC 

427 

428     Search this Random String length:  8  --->  ACCTACGA 

429 

430     Search this Random String length:  8  --->  CCCCATAG 

431 

432     Search this Random String length:  9  --->  GATAGCTAT 

433 

434     Search this Random String length:  10  --->  GGCTGGTACC 

435 

436     Search this Random String length:  10  --->  TCCTACAGCA 

437 

438     Search this Random String length:  8  --->  GTCTGATG 

439 

440     Search this Random String length:  9  --->  GGTAAGCCT 

441 

442     Search this Random String length:  8  --->  GGTGACCC 

443 

444     Search this Random String length:  11  --->  GATGCTCCGGT 

445 

446     Search this Random String length:  12  --->  TACTATTTGCCT 

447 

448     Search this Random String length:  12  --->  CTTCATCGCGTG 

449 

450     Search this Random String length:  11  --->  GAGTTCCCTAG 

451 

452     Search this Random String length:  10  --->  GTGGTCGCTC 

453 

454     Search this Random String length:  10  --->  CCTTTATACT 

455 

456     Search this Random String length:  11  --->  AATCAGTTCCA 

457 

458     Search this Random String length:  10  --->  CAATTACACA 

459 

460     Search this Random String length:  10  --->  TATTTCCCGA 

461 

462     Search this Random String length:  11  --->  CCCCCCGCAGT 

463 

464     Search this Random String length:  9  --->  CGAACCTTC 

465 

466     Search this Random String length:  8  --->  TAAAGGTT 

467 

468     Search this Random String length:  10  --->  GTACCAGTTG 

469 

470     Search this Random String length:  12  --->  AATAATGGCGAA 

471 

472     Search this Random String length:  8  --->  GCTTGACA 

473 

474     Search this Random String length:  8  --->  TCGGTACC 

475 

476     Search this Random String length:  11  --->  CAATTATTCGA 

477 

478     Search this Random String length:  8  --->  TCGACTGA 

479 

480     Search this Random String length:  11  --->  TCCAGAAGCGC 

481 

482     Search this Random String length:  9  --->  ATATATTGA 

483 

484     Search this Random String length:  10  --->  TTATGTGTGC 

485 

486     Search this Random String length:  8  --->  TGAACAAG 

487 

488a     THERE IS A forward MATCH in page 3 string -> TGAACAAG  starts in  

488b ( 10 ,  9 )  ends in  page  4  ( 1 ,  6 )

489 

490     WORKSHEET 4  D[10, 10] CHAR

491      A B C D E F G H I J 

492          >------------------------------<

493       1:A A C A A G C A G T 

494       2:A G T A A T T C C T 

495       3:G C T T T A T C A A 

496       4:G A T A A T T T T T 

497       5:C G A C T C A T C A 

498       6:G A A A T A T C C G 

499       7:A A A G T G T T A A 

500       8:C T T C T G C G T C 

501       9:A T G G A A G C G A 

502      10:T A A A A C T C T G 

503          <------------------------------>

504 

505     WORKSHEET 5  E[10, 10] CHAR

506          A B C D E F G H I J 

507          >------------------------------<

508       1:A G C C G A C G T T 

509       2:T T G G C G G C G C 

510       3:A A C C T G T G A C 

511       4:G A C A A A T C T G 

512       5:C T C A A A T T T A 

513       6:T G C G C G C T T C 

514       7:G A T A A A A A T G 

515       8:A T T G G C G T A T 

516       9:C C A A C C T G C A 

517      10:G A G T T T T A T C 

518          <------------------------------>

519 

520     Sequencing by Synthesis

521     DNA Polymerase

522a     In human genetics polyploidy actually refers to an abnormal state when a 

522b  has 3 sets of chromosomes (69) or 4 sets (92). Normal cells that have 46 chromosomes, 

523    

524    ENDS  basic_dna3803   Elapsed Time: 1.668  sec

525    NOT VALID FOR DISTRIBUTION ---BE---careful

526    Boost version: 1.59.0

527 

528     EXIT FROM EXSAN                                    

    0         1         2         3         4         5         6         7         8
    012345678901234567890123456789012345678901234567890123456789012345678901234567890
row 1
lorem ipsum
Flag Counter

Comments